汉字拆分
中文信息处理术语
汉字拆分是基于一定的构字元素集合和拆分规则,把汉字分解为构字元素序列的过程。汉字拆分的目的是为了对汉字进行信息化处理,所得构字元素序列可用于进一步得出汉字的编码或汉字表达式。根据构字元素集合、拆分规则、拆分过程的差异性,形成了汉字拆分的不同流派。
定义
汉字拆分是基于一定的构字元素集合和拆分规则,把汉字分解为构字元素序列的过程。
其中,「汉字」特指需要在计算机中显示和存储的汉字个体;「构字元素」是由开发者定义的,用来描述汉字字形构成的最小单元(可以是笔画、部首、声旁、字根、部件、字块、字祖等);「拆分规则」是由开发者制定的,用来完成汉字拆分的一套操作流程和方法。
主要流派
根据构字元素集合、拆分规则、拆分过程的差异性,形成了汉字拆分的不同流派。主要有:
另有不完全拆分,即在汉字拆分过程的某一中间态中止拆分,见于汉字表达式或某些输入法。例如,「礴」字的IDS表达式为「⿰石薄」。
出处
「汉字拆分」是一个常用的词汇,多见于中文信息处理、汉字检索等方面的文章。例如:
参考资料
说字祖.「寫文拼字」公众号.2020-08-01
动态输入法.动态输入法.2017-01-01
最新修订时间:2020-09-02 17:02
目录
概述
定义
主要流派
参考资料