博客网 >

 
 

 

《龙语瀚堂典籍数据库》试用鉴定与推荐

    近日《龙语瀚堂典籍数据库》在网上公布了最新更新的增补版,我与文学院的博导、硕导及其博士生、硕士生一起反复试用,觉得独具特色,非同寻常,所以推荐图书馆能够考虑购买使用,惠及全校。据悉南京大学已经在试用。

该数据库内容独特,尤其是其“小学工具”、“出土文献”等数据,填补了目前中文典籍类数据库的空白。其独特的四字节中文处理技术彻底突破了古籍整理和研究中异体俗字数字化的瓶颈:所有入库的异体俗字均可自由编辑,既非造字,亦非贴图,更不是左右上下的临时拼合。因为该数据库应用了Unicode四字节编码的最新拓展字符集,可调用的异体俗字达到7万多字。这就大大提高了我们处理汗牛充栋的古典文献、近代文献乃至现代文献、当代文献的能力,使得我们日常研究的效率总体得到提升。不仅如此,龙语瀚堂的多种检索方式,以及它们的混合应用,快捷超常,易于掌握,就如同“百度”、“google”等搜索引擎那样奇妙。

对此我有深刻的感触。我觉得中国应该在汉字处理这个领域做出一流的东西,也完全可以做到。我们绝对不会败在日本人手下。关键是要有眼光,要认真做。我们在科技方面落后了,但是在古典文献学、汉语言文字学等方面绝对是世界领先的。一些国家领导和部门看不见这个亮点,觉得这种学科自生自灭最好,不要加大投入,实在短见。这样一来,迟早连这块宝地也要出让给外国人。打个不恰当的比方,中国的学术现状,就象中国的土地,不是不够,而是没有很好开发。如果大西北的土地,出租给以色列,或免费让我们自己人去开发利用,要不几年,戈壁就可能变成绿洲了。典型的例子就是汉字排版系统,虽然我们都以王选的北大方正为自豪,但是由于当年国标字符集的限定用字,使得中国的软件存在着字数太少的严重缺陷,在很长的时间内都要靠造字功能补缺。我们出版的《敦煌变文校注》,前后造了大约3000多字(不包括反复出现的使用次数),仍然还不能彻底解决问题,最后有些字是我亲自用黑钢笔在排版胶片上写出来的。正因为诸如此类的问题,美国的微软后来研制了office系统,其中的word很快占据了汉字处理的国际主导地位,现在全中国都在使用。这其中原因固然很多,但是word字库多达几万字,这也是它特别优越的一个方面。中国的政府领导、主管部门和科技先锋,尤其是现代汉字学的某些专家,自己限制了自己的活动能力,迫使我们的软件与生俱来就先天不足。至今有些领导和专家说起汉字,还坚持繁体字不是规范字,还认定中国人只准在10000字以内使用汉字,甚至曾经朱镕基总理的名字都要临时拼造,让人啼笑皆非。在汉字问题上,中国政府犯了几个大错误:一是以简化字为正字,否认繁体字的合法地位,造成海峡两岸政治上彼我区分;二是异字同音的粗暴归并(複復、干乾、發髪之类),造成电脑繁简切换的不对应;三是限定字种数,起初规定软件设计必须按照《国标字符集》一、二级来用字,后来规定用字在1万字以内,等等,最终使得中国13亿人每天使用的汉字系统,我们自己都不知道一共有多少个汉字,压根儿就拿不出一张汉字总表!

20061016

 
博客网版权所有
<< 也谈“吾国学术之伤心史” / 敦煌写经今何在 >>

专题推荐

不平凡的水果世界

不平凡的水果世界

平凡的水果世界,平凡中的不平凡。 今朝看水果是水果 ,看水果还是水果 ,看水果已不是水果。这境界,谁人可比?在不平凡的水果世界里,仁者见仁,智者见智。

中国春节的那些习俗

中国春节的那些习俗

正月是农历新年的开始,人们往往将它看作是新的一年年运好坏的兆示期。所以,过年的时候“禁忌”特别多。当然,各个地方的风俗习惯不一样,过年的禁忌也是不一样的。

评论
0/200
表情 验证码:

huangzheng1958

  • 文章总数0
  • 画报总数0
  • 画报点击数0
  • 文章点击数0
个人排行
        博文分类
        日期归档