download

汉字的标准化
 文字作为辅助语言的交际工具必须实现标准化。汉字标准化的主要内容






是“四定”,就是定量、定形、定音、定序。
一、定量
定量就是确定现代汉字的字量,包括各种专门用字的字量,实现汉字
字有定量。
汉字自古至今的总字数多达数万。《康熙字典》收字47000多字,
《汉语大字典》收字54000多字,1994年出版的《中华字海》收字
86000多字。在这86000多字中,大部分是文言古语用字,只有一万多
个是现代汉字。在这一万多个现代汉字中,使用的频率并不相等,有的
高有的低。据统计,按照字频由高到低排列,序号和覆盖率的关系大致
如下:
序 号:1000 2400 3800 5200 6600
覆盖率:90% 99% 99.9% 99.99% 99.999%
频率最高的1000字在现代白话文中的覆盖率高达90%。这就是说,在
100000字的文章中大约有90000字,是用这1000字写成的。这样的统计
规律可以帮助我们实现汉字的分级定量。