日语五十音图片假名什么意思,日语50音平片假名
Python3:编码:python3支持UTF-8,有一个unicode(这是个好东西)通过unicode #转换原理进行字符转换从六个导入unicode str 1= u 3041 #代表一个字符: code=ord(str1) #获取这个字符的unicode值——一个int类型的值,可以通过print(code,Type (ord (str1)) # 12353 class int 值和type # unicode值加1:这个字符的下一个字符: 1-unicode值print(chr(code 1)) # chr()表示字符的下一个字符将unicode转换为字符print(unicode(code 1))# unichr()的功能与chr()相同:具体区别百度知道python3的unicode转换,剩下的就好办了。
平假名范围: u3041 ," u3096 "
片假名范围:" U30A1 ", U30F6
字符编码查询
片假名和平假名转换:
两个想法:
一:
Ord (flat) x=ord (slice),只要知道中间差x,就能理解字符的unicode对应关系。举个例子,假设A,A的一个unicode插值为:10-//不带word ORD(),应该理解为它们对应的unicode值相加或相减,即a 10=A,A-10=a可以推导出:b 10=B,C 10=C
平假名范围: u3041 , u3096 片假名范围: u30a1 , u30f6 我们知道范围,所以可以分别遍历它们,这样结果可以保存在字典中,直接查阅字典。哦耶~这是第二个想法(第一个太简单了)
#参数:平假名start,end,片假名start,end #返回值:一个数组def make _ dic(平假名,endh,片假名,endk)带两个字典:dic={} start1,end1=ord(平假名),Ord(endH)#先转换成对应的unicode值,用于后续计算start2,end2=ord(片假名),ord (endk) num=0 #用于计数#其实这个键没用,因为start1,start2 # For key in range(end 2-start 2):# 85 number # DIC[CHR(start 1 key)]=CHR(start 2 key)For key in range(start 2,2):# 85 number DIC[CHR(start 1 num)]=CHR(start 2 num)#解释:例如ABCDEFG和abcdefg #字典添加元素:DIC[A]=A A A A对应A # A 1对应A 1(Unicode)-“B和b# A循环将对应所有元素。 Num=1 l dict=dict (zip (dic。values(),dic。keys()))# dictionary reverse return[DIC,ldict] #返回两个字典的数组,def check_chart(input_str,Arr):for input _ str中的v:#字符数组中的单个字符print (v,end=:)if Arr[0]:# Arr[0]—{ flat:slice } dictionary,判断是否在字典中,有些词输出print(Arr[0][v])elif v in Arr[-1]:# Arr[-1]-{ slice:flat } dictionary,但如果print(arr[-1][v])input _ str=input( input: n片假名范围:范围相同,元素对应arr=make _ DIC ( u3041 , u3096 , u30a1 , u30f6) check _ chart (base _ str,arr)运行结果:
-
RUBY之所以说RUBY。因为太方便了。
Python3不能通过将字节转换成其他代码直接加减其他字符(正则和小数不能算,不能),所以用unicode。
Ruby可以直接从010遍历到59000,不需要额外的转码。
Show _ info #平假名范围: u3041 , u3096 ,用于 u3041 中的索引. u 3096 do printf index end puts n #片假名范围: u30a1 , u30f6 for u30A1 . u30f 6 do printf index # print index ended show _ info
方便了小偷。让我们在后面有一本字典来对应它们。控制台可以输入判断并得到结果。哦~
带有字典反转的Ruby函数:
字符范围
创建一个新的hash并反转hash中的键和值。做一个后续循环,这样就不用每次匹配完再点运行了。
注意:ruby在windows下会出现中文和日文乱码(有些输出正常,有些输入乱码)。测试:创建新的。rb文件:puts gets.chomp #打印输入字符解决方案:
向文件头添加utf-8注释,向文件头添加GBK编码,并将系统更改为utf8。
结果。随意
(反正没成功,就换成Linux了[默认使用utf-8编码,贼舒服])。其他语言也差不多,关键是一个字符转换问题。嘿,我溜了。