系统简介
本系统由海峡两岸语言文字学、文献学、辞书编纂等多学科专家学者与互联网技术人员共同开发建设,具有简体中文和繁体中文互转的词级转换功能,因而得名《海峡繁简中文转换系统》。
目前,网络上有关繁简字转换的各种免费软件(或称转换器、在线繁简转换网站)比比皆是,大致可以分为“字级转换”和“词级转换”2类。《海峡繁简中文转换系统》属于“词级转换”软件。 “字级转换”软件,只能简单地将一个简化字转换为一个对应的繁体字,然而对于一个简化字对应着多个繁体字的情况就无法处理了。例如:“并”字的繁体有“並”、“併”2个,“并”字本身在繁体中文系统里也是独立的一个字,这样,一个简化字“并”就对应着3个繁体。大多数的“字级转换”软件选择的是:简化字“并”对应繁体字“並”(并—→並),如果用这类繁简字转换软件进行“简—→繁”转换时,句子或文章中所有的“并”都会被转换为“並”。“併”和“并”的所有组词例如“合併”、“吞併”、“併發症”等词也会被转换成“合並”(×)、“吞並”(×)、“並發症”(×);“并州”、“并刀”、“并州剪”等词也会被转换成“並州”(×)、“並刀”(×)、“並州剪”(×)。对于这样的转换,大多数使用繁体中文的人是看不明白的,至少会造成阅读理解上的不便。
“词级转换”软件,可以分为初级和高级(或专业级)2种。初级“词级转换”软件是在“字级转换”的基础上进行了简单修订,相当数量的常用词组能够得到正确的转换,但是还很不完善。在遇到这样的句子,如: “巴西最大贫民窟发生黑帮火并。”和“日航发动机起火并非撞鸟所致。”正确的“简—→繁”转换是:巴西最大貧民窟發生黑幫火併;日航發動機起火並非撞鳥所致。这2个句子中都含有“火并”一词(注:火并,指同伙自相残杀、吞并;繁体为“火併”),而后句中的“火并”没有前句中“火併”的意思,后句要表达的意思是“起火的原因并不是”,而“起火并非”的繁体是“起火並非”。一般的“词级转换”软件会转换成:巴西最大貧民窟發生黑幫火併;日航發動機起火併非撞鳥所致。
类似的例子还有很多,再如:
宋代文学家苏轼《念奴娇·大江东去》词中有“多情应笑我,早生华发”一句,现代文章中有“各国企业在华发展机遇会越来越多”。正确的“简—→繁”转换是:多情應笑我,早生華髮;各國企業在華發展機遇會越來越多。这2个句子里都含有“华发”一词(注:华发,指花白的头发,繁体为“華髮”), 而后句中的“华发”没有前句中“華髮”的意思,后句要表达的意思是“在中国发展”,而“在华发展”的繁体是“在華發展”。 此外,“并”字还有一些古体、异体字如“幷、竝、竮”等,现在已不常用,但这些字是古人在书法、文章和著作中用过的字,在需要对涉及到这些字的文章或句子进行“简—→繁”转换时,“字级转换”软件只能望洋兴叹;初级“词级转换”软件如果没有有关专家参与是无法进行修订、完善的。
《海峡繁简中文转换系统》软件的建设目标是:建成一款简体中文和繁体中文之间能够精确互转的专业词级转换系统。