中国有多少个(中国有多少个汉字)

我们聊了不少生僻字了,有些是特殊字,有些是某一个汉字的特殊写法。虽然我们常说常用汉字不过3000,但有些汉字可能有很多种写法。

如此下来汉字究竟一共有多少个呢?今天我们来讨论一下这个问题。

1

自古以来的汉字数量

中华上下五千年,汉字的历史可太长了,所以汉字一共有多少个是个很难说清楚的问题。

据学者考证,甲骨文和金文共有汉字约5000个,我们已知其含义的约有3000个。

我国最早的字典《说文解字》,收录汉字9353个。

北宋《类编》收录汉字高达33190个,而清朝《康熙字典》收字46933个,是古代收录汉字数量最多的字典。

《汉语大字典》收录单字56000多个,20年发布的最新版《新华字典》收录单字13000多个。

大家不用惊讶于数量,《现代汉语常用字表》只有3500个汉字,而根据中国语言生活状况报告,2394个常用汉字就占据了99%的语言篇幅。

所谓常用汉字,以庞中华硬笔书法为例,小时候我家里有这本书,妈妈逼着我练,我觉得好不情愿。这个字帖是2500字。

2

不同编码标准带来的问题

在电脑普及、数字化时代到来之前,我们也只能以字典为标准,统计汉字的数量。

然而数字化时代到来之后,除了字典,我国*开始定期统计收录汉字,并将这些汉字编排在国家标准文件中。

大陆最早的标准,制定于1980年,称为GB2312,也就是国家汉字信息交换用编码,通行于大陆。新加坡等地也使用此编码。

*则于1983年开始使用著名的“大五码”也就是big5字库。

这两个标准曾经深深“伤害”过老一辈电脑游戏玩家的心。在很多三国游戏迷心里,曹操有另外一个名字——“变巨”。

其实这就是大五码“曹操”二字,由于标准不统一,*生产的游戏运行在大陆电脑里,就有了这个奇怪的名字。

为了解决这个问题,当时还曾经有一票辅助软件,其中提供文字编码选择功能,让部分汉字正确显示。

也正是为了解决这些问题,1993年5月,中日韩联合研究小组正式制订了CJK(中日韩统一表意文字),同年国际标准化组织发布了10646,我国也以此为标准制定了GB13000.1-93。

3

汉字数量的大致参考

为什么汉字的标准,并非由中国制定,而是国际制定后,才有国家标准呢?这是因为虽然汉字是中国的原生文字,但使用汉字的国家,并不限于中国境内。

最典型的就是日本、韩国、越南,他们的文字,或是同样叫做“汉字”,或是在写法、发音、字义等方向,明显带有汉字的特点。

“密”字当选日本2020年度汉字

于是iso字库的来源,也包含着这些国家;除此以外,海外尚有大量中国古籍文献,各国或是拥有汉字文化研究组织,或是与国内汉字研究组织合作,也定期向iso申报新的汉字。

需要说明的是,根据国际汉字标准制定国内汉字字符集这一做法,一直沿用至现在。

这也就有了所谓“汉字总数量”的大致参考标准:

另外在2012年,我国启动了“中华字库”工程,旨在为30万个汉字、10万少数民族文字以及10万多个如甲骨文这种不常见的古代书写文字编码,总计约50万字。

4

汉字数量的发展

中华字库50万这个数字,已经涵盖了历史上所有的汉字。但是,这一数字并非不会增长。

我们常说,语言是一种“约定俗成”的东西,在这一点上,汉字也类似。比如在2020年公布的iso10646扩展字符集g中,就已经包含了民俗字biáng字。

另外在化工领域,也有一些新造的汉字。2017年5月9日,新化学元素中文名公布,两新造字纳入国家规范用字,分别是——

这些汉字,将是我们现在、未来网络交流、数字化交流的基石。

5

汉字输入的难题

但是,汉字多起来,我们不得不面临一个新的问题:如何输入这么多汉字呢?

举例来说,我们常用拼音输入法。汉语拼音一共有300多个发音,gb2312的时代一共6000多字,输入一个发音,与之对应的汉字数量平均不过二三十个。

按照输入法每行显示十个候选字计算,翻页两三次便能找到想要录入的汉字。

但是,今天汉字数量已经达到9万,平均每个读音下有300页候选汉字。

难道我们要翻页300次来寻找某一个想要输入的汉字吗?

我们都曾遇到过这样的问题,在拼音输入法下寻找某一个字,翻到底了还没找到,只要更细致地往回寻找,可能输入一个字就要花上好几分钟。

别着急,好办法已经有了。咱们之后找机会跟您慢慢聊这个问题。

END

敝帚字珍

汉字文化博大精深,

我们常用的汉字只有不到3000个;

新华字典收录汉字约8000个;

现在的电脑手机等终端,

可显示汉字约30000个;

2005年的国家标准GB18030-2005,

收录汉字7万多个;

而最新的国际标准10646,

收录汉字9万多个。

汉字再多,

如果不认识、在电脑上打不出来,

这些汉字文化就都丢了。

我们要做的,就是和您一起,

寻找汉字的文化。

欢迎您:敝帚字珍。