《古籍印刷通用字规范字形表》来了

栏目:学历教育  时间:2023-08-03
手机版

  标准发布

  2021年10月11日,《古籍印刷通用字规范字形表》(GB/Z40637-2021,下文简称《古籍印通表》)发布,该表共收录了 14?250 个汉字,其中《辞源》 12?709 字,古联字频表补充 1441 字,将于 2022年5月1日 起正式实施。

  最新发布的《古籍印刷通用字规范字形表》(GB/Z40637-2021)值得注意的是,本次《古籍印通表》的发布是继《印刷通用汉字表》(1964)、《简化字总表》(1964,1986)、《通用规范汉字表》(2013)发布之后最为重要的汉字印刷规范,对于中国的古籍整理、出版和信息化将有积极、重要的意义。

  从收字上来看,这份字形表基本涵盖了古籍整理印刷中所需汉字,是对《通用规范汉字表》在 古籍整理应用方面的拓展。从字形上来看,《古籍印通表》所选用的字形向传统写法靠拢,不再拘泥于之前的繁简字对照表。

  值得注意的是,本次《古籍印通表》仅为指导标准,并非强制标准,这无论对印刷还是古籍整理或科研都是比较友好的。

  此次《古籍印通表》的发布,整体上来看,要比之前多个规范人性化很多,更符合信息时代的要求,更接“地气”。但对于《古籍印通表》,笔者依然有几点疑惑:

  1. 网络上发布的相关文件为什么不直接使用字体嵌入的形式,而是使用了位图?(难道害怕字体“泄露”?)这显示了相关部门的不作为。如果是国家标准,就必须有相应的字体文件和输入法供公众免费下载使用,不然,标准仅掌握在少数人公司手上,又和没有标准有什么区别呢?2. 为什么不直接发布符合字表规范的字体和输入法而仅仅是进行了文字上的描述?如果需要推广该标准,这样做又能够直到什么作用?3. 为什么不发布涵盖字表全部字符表?(电子版,可以是文本格式,配合字库直接使用)这样才有利于开发相应的输入法或者是校对软件、程序等。《古籍印通表》主要有两个收字来源:《辞源》第三版中 14?208 个字头和古联统计频度排序前 20?326 字,最终《古籍印通表》在这两者的合集中取 14?250 字。%这14 208 个字是《辞源》的字头还是全部用字,并没有确切说明。

  从这两个来源的角度来看,《辞源》是一本专业的古汉字词典,所收汉字涵盖了中国常见典籍中用到的绝大多数字,目前最新版本为第三版。《辞源》(第三版)字头及释文用字共计 14?208 个,但即便如此,离印刷通用字还有一定的距离。相关研究表明,如果要做到通用的话,30?000 字是一个比较合适的收字量。此次发布的《古籍印通表》离这个数还有一定的距离。但相较于之前的几次标准发布而言,这次《古籍印通表》的发布要显得谨慎得多,基本上尊重了相关领域内专家们的意见。

  从常见古籍中的单字量来看,《论语》 1339 字,《史记》5122 字,《宋史》 7389 字,《清史稿》8080 字,《二十四史》15?918 字。可以看出,如果收字量达到 30?000 字时,已经完全可以应对普通的古籍资料,对于常见的古籍的覆盖几乎可以达到 100%。

  字典编纂的过程本身就是一个文字整理的过程,所以使用《辞源》字头本身就更具说服力。反观 2013 年出台的《通用规范汉字表》,只考虑到简体汉字使用情况,没能顾及古籍中汉字使用的实际情况,和 GB2312 如出一辙,甚至连中学课本中一些常见的文言汉字都不予收录,更不用提《论语》、《左传》、《史记》这类常见典籍的实际用字了。据统计,GB2312 对于《四库全书》和《四部集要》两种重要典籍的覆盖率仅为 72.57%(日语 JIS0208 (J0)收字 6500 字,覆盖率为 95.57%)。这对于以“通用”标榜的汉字表,而且是强制性标准来说,怎么看都有些生硬。不过,其主要原因是 GB2312 只收简体汉字,不收繁体汉字,覆盖率低就不足不怪了。

  古联平台本身就是为中华书局的古籍出版服务的,其字频数据能比较客观地反观出古籍的用字的实际状况。将其作为收字来源是比较合理的。

  《辞源》第三版书影考虑到 Big5 字符集只收录繁体字符,其收录的字符数量为 13?060 个(其中有两个字符重复收录),已经基本上涵盖了日常使用用字和大部分古籍用字(对《四库全书》和《四部集要》的覆盖率为95.26%),而此次《古籍印通表》收录的 14?250 个汉字中并不包含日常汉字,而且《古籍印通表》在其收字原则中已经明确提出,对于异体字,只收录一个标准字形。这样,基于《古籍印通表》的收字来源和收字量,可以乐观地估计,《古籍印通表》能够基本上满足古籍出版的需求。至少对于像《论语》、《左传》、《史记》这类常见古籍,应该不会出现缺字的情况。这对于古籍的推广和普及无疑将有着相当大的作用。

  还应该注意到一个情况,那就是《古籍印通表》仅收录繁体汉字,古籍用字对应的简体汉字并不收录。也就是说,对于古籍的简体出版、整理和信息化工作而言,《古籍印通表》并不能起到相应的作用。从这一点上来看,《古籍印通表》的应用范围将只限于古籍出版、研究和信息化领域,这不能不说是一种遗憾。之前,无论是 GBK 还是 GB18030 都是站在简体汉字应用的立场上,在确定简体字之后再加入其对应的繁体字,为什么就不能在《古籍印通表》中加入所收繁体字形对应的简体字形呢?

  目前,大量古籍都以简体形式在网络上流传,对于其中的缺字一般只能使用相应的繁体汉字代替。如果使用 Unicode 扩展字符集中所定义的简体汉字,在输入、显示等方面都存在着问题。所以如果能够有相应的标准(字体、输入法等)问世,对于简体古籍文献的网络传播是有非常特殊的意义的。

  《古籍印通表》的收字原则是必须从 ISO/IEC 10646 国际编码字符集中由中国提交的汉字。包括从扩展字符集 CJK-A–CJK-F 中选取或修缮适用的字形,凡是 ISO/IEC 10646 字符集中未出现的汉字一律不收。《古籍印通表》的理念很清楚,就是给计算机用的,所以在确定字形的同时也确定了码位。这一点对于编制输入法、检索等工作相当重要,值得点赞。

  这不禁让人想到,2013 年《通用规范汉字表》出台时,竟然没有一个文本文件可以表示其中所有的 8105 个字符,也没有任何字库可以完整显示这些字符。直到 2015 年 Unicode 8.0 发布之后,才算是收齐了《通用规范汉字表》中的所有字符。到目前为止,虽说主流字体都能够显示《通用规范汉字表》中的所有字符,但大多数的输入法(包括国内所有的商业输入法)却依然我行我素。要知道,《通用规范汉字表》可是我国汉字使用的强制标准。目前,主流输入法甚至对于 Unicode 的支持仅限于 GBK 中的字符,遇到扩充集中的汉字时只知道使用私用区(PUA)自造汉字,而且只提供 PUA 的映射,而非 SIP,这是相当尴尬的一件事(近年来有所改善,也非常有限)。

  这样看来,《古籍印通表》很好地解决或者是规避了之前出台《通用规范汉字表》时遇到的尴尬问题,这对于《古籍印通表》的推行是极为有利的。实际上,后期只要配合完善的字体和输入法,就可以形成强大的合力,让古籍在出版、整理和电子化的道路上走得更快更好。

  《辞源》第三版书影总体上来看,《古籍印通表》全面回归传统写法,但却并不完备,个别古籍中的常用字并未收录,如“羣”,但估计实际使用中会有所取舍,毕竟目前正式出版的古籍中都有这个字。“繭、花、苗、雚”中的草字头中间断开;“吕、闾、侣”中间的“吕”都变成连笔“呂”;“即、節”中的(既左边)变为“皀”;“奂、黄、晋、强、鬼、敢”等字有所变化(奐、黃、晉、強、鬼、敢);但“朝”字不调整。

  全面回归传统写法,这是好事。但美中不足的是,有相当多的汉字依然使用了有别于传统古籍印刷中广泛采用的旧字形,如用“彦”不用“彥”,用“産”不用“產”。既然是往回退,为什么不能够一下子全部退到传统写法上去,以旧版《二十四史》的实际用字为标准不就行了?

  也许这是一次有益的尝试,繁体出版中的字体总算有法有度了。但同时新的问题又会出现:应对的字库、字典(《辞源》、《汉字大词典》)怎么办?目前有没有现成的字体?有没有符合该标准的输入法或者是检查、规范用字的程度?从官方透露出的资料来看,《古籍印通表》是围绕着《辞源》的编纂进行的,那么新版《辞源》应该会符合这个标准,至少也是大致符合吧,编写过程自然会制订相应的字库。至于《汉字大词典》,目前还没有出第二版,到时候应该不会有问题。

  如果在可见的未来这个标准得到执行的话,就将意味着大陆地区的古籍出版及信息化有了相应的标准可依,据此对古籍进行电子化整理是一件利国利民的基础性工程。从另外一种意义上来说,它同时也意味着,大陆古籍整理从此会告别传统,走向“独立”发展的道路。

  实际上,从理论上来说,之前无论是发布《第一批异体字整理》还是《简化字总表》,其中的繁简对照表都是以简体字的规范使用为目的的,不应该被看作是对繁体字的使用规范。但在这次《古籍印通表》发布之后,情况就完全不同了。《古籍印通表》必将对古籍整理出版和信息化起到深远的影响。

  我们注意到,《古籍印通表》出台虽说能够解决一部分问题,但摆在我们面前的问题依然不少。没有了与标准对应的字体和输入法,无论发布什么样的标准对于标准的执行来说,都是无济于事的;想要让标准得到公众认可就需要对标准本身精打细磨,但显然《古籍印通表》还没有做到;对于发布标准的有关机构和部门来说,标准发布后更需要进行持续地更新和修订,而不能是“一锤子买卖”,发布之后就没有了下文。

  GB18030 标准在 2005 年发布第二版之后在长达 17 年里竟然没有任何动静,直到最近才发布了最新版本。要知道,GB18030 可是我国计算机领域的强制标准!在经历了之前近二十年的“无人职守”状态之后,今后想要使用 GB18030 标准的用户怎么也得三思而后行了,这一点对于古籍工作者来说尤为重要。我们很高兴看到,在 GB18030-2022 标准发布之后,从相关表述中可以看出来,有关部门将会建立标准部门协调机制,适时补充各部门提交的新增汉字,建设标准公共服务平台,发布标准解读资料,提供相关配套字体并加强标准符合性检测等。至少从以上表述来看,该标准显得诚意满满,值得一个大写的赞。相对于 GB18030 标准,我们希望《古籍印通表》也能够建立某种机制,定期对字形进行更新、修正。

上一篇:南大第3复旦第7,上海交大第5南科大第8,浙大第10武大第13
下一篇:50位老年学员在家门口拿到“毕业证”

最近更新学历教育