我们每天都在使用汉字,汉字与我们的生活密不可分,很难想象一个没有汉字的世界会是什么样子。但实际上我们经常使用的汉字非常有限,据统计:1000个汉字能覆盖约92%的书面资料,2000个字可覆盖98%以上,3000个字时就可达到99%。所以常用的汉字大概在3500个左右。如果你还想进一步阅读一些古籍的话,最多只要再增加一倍。
换句话说,我们经常使用的汉字不过几千字,那我们不经常使用或从来没使用过的汉字又有多少个呢?要回答这个问题可能有点困难。因为自仓颉造字开始,人们对于汉字的创造活动就一直没断过,我们很难做个准确的结论。过去的字典只是讲收录了多少汉字,而不是说汉字就只有字典中那么多,毕竟由于编撰者经历和阅历的有限,难免有所遗漏,而且有很多古体字已经消失,难以统计。
当然,这并不表示我们不能得出一个结论。已通过专家鉴定的北京国安资讯设备公司汉字字库,共收录有出处的汉字91251个,是目前收入汉字最全的字库。所以我们可以大概说汉字有9万多。
说到汉字,就让人想到字典。无论是民间还是皇室,中国历来就有编撰字典的传统。中国最早按字的形体和偏旁编排的第一部字典《说文解字》共收录汉字9353个,南朝时顾野王所撰《玉篇》共收录16917字,宋朝官修的《集韵》收字53525个,《康熙字典》收字47035个,日本《大汉和字典》收字48902个,《汉语大字典》收字54678个。
20世纪编辑出版的《中华字海》是迄今为止收录汉字最多的字典,共收字85000个。它涵盖了过去编撰的字典中的全部汉字,另外添入了佛经、道藏难字、敦煌俗字、宋元明清俗字、方言字、科技新造字以及一些人名和地名用字,是一部研究汉语言文字的极佳字典。