- 东往东来:近代中日之间的语词概念
- 陈力卫
- 3898字
- 2025-04-07 15:28:16
四 词源调查的方法及其局限性
检验上述“新汉语”的方法之一,就是具体考证语词的历史,通过比较中日两国语言的最早用例来决定是源自中文还是出自日语。比如,宫岛达夫分别抽出日中两国的1000个高频词,通过比较这些词在辞典里出现的时期,来看各自语言的近代化进程。[18]图1-5所展示的结果正可以看作图1-1近代部分的扩展版。这里强调了两点:一是“中文近代化进程的步伐本来早于日文,但在20世纪初被日文超过”;二是“中文随后又受日文的影响,加快了近代化的步伐”。前者印证了日语中“汉语词”剧增的事实,后者则反映出近代中文新词受日语影响的一面。

图1-5 日中语言的近代化比较
资料来源:宫島達夫「語彙史の巨視的比較」,朱京伟主编,汉日对比语言学研究(协作)会、北京大学外国语学院日本语言文化系合编《汉日语言对比研究论丛》第1辑。
在日语的1000个高频词中,有416个“汉语词”,其中128个为日中同形词。宫岛对这些词用两国的历史语言词典(《日本国语大辞典》和《汉语大词典》)加以比较,发现其中绝大部分是早就出现在中文里的词,只有10个词是日语用例早于中文的,即“簡単”“国際”“参加”“時期”“実現”“集中”“全部”“内容”“表現”“問題”。而实际上这10个词也多是中文早已有之,只是现行词典(如《汉语大词典》)没能详尽收录而已。如果检索其后出版的《近代汉语大词典》(中华书局,2008)或《四库全书》电子版,就会发现“时期”“实现”“全部”“内容”“表现”“问题”等在中文里已经有了早于日语的例子,只是没有反映到词典里去。通过这道检验程序,暂且可以确定在日语中形成的只有“簡単”“国際”“参加”“集中”这四个词,也即作为所谓“和制汉语”输出到中文里去的。
这种“汉语词”的词源调查结果表明128个日中同形词中只有四个词是纯粹由日本独创的,即我们上面说的c类,从比例上来看只占日中同形词的3%。但我们也发现这种词源判断的结果,是受资料的开放程度所限制的。如果按最初的词典来判断,那就会得出10个词,即近一成的词为“和制汉语”。所以,为弥补这一差距,只能利用更多的材料来进行验证,而电子文本语料库的完善,使我们能够做出更为精确的判断。
这一调查的目的是明确哪些是日文独自创造的词,这比笼统地将其称为“新汉语”要鲜明得多。如果将“汉语词”两分的话,就是要澄清哪些是汉语词,哪些是日语词。
野村雅昭也是利用这种词典用例的时代差,对日语里“汉语词”的出现时期进行了调查,他把范围扩大到“汉语词”双音节的基础三千词上,得出了表1-1的结果。即按“汉语词”最早出现的时期来做时代划分,结果发现:第Ⅰ、Ⅱ期几乎都是源自古汉语文献的词(如“意見”“音楽”“観光”“同盟”等);而自第Ⅲ期的江户后期始,便包含了兰学创造的“汉语译语”(如“手術”“動脈”等),也就是开始出现日本独自创造的“新汉语”。[19]
表1-1 “基础汉语”三千词的出现期分布

野村自己是这样解释的:“此表最大的特征便是最初出现在第Ⅳ期日本明治时代的词占大多数(38.9%)。恐怕这三千词的相当部分均是在第Ⅲ期江户时代后期的某一时段才开始出现的,即从幕末到明治时代可以称作日语词汇的变动期,此前几乎都是借自中文的‘汉语词’,而自这个时期起日本自己创造的‘和制汉语’开始增多。另外,亦可做出一种推测:江户后期以后诞生的语词中有不少也输出到了中国。”[20]
这一调查结果也印证了我们前面提到的以1720年为近代的转折点以及明治时期“新汉语”的增加,同时也展现出三千基本“汉语词”在各个时代的大体分布。但是,与上述宫岛的研究相同,仅靠辞书的首见例证来判断其产生的时代会有很大的误差,江户后期的第Ⅲ期加上第Ⅳ期共有1529个词,这一数量经过更多的材料验证后,必然会有进一步修正的可能性。在此基础上,我们才有可能抽出日中同形词,再确定a、b、c三类的正确比例,以及各自的认定及其内涵,也才能判断出哪些词是作为日语借词后来进入到中文里去的。
单纯依靠辞书来验证词源有其局限性,笔者曾对各个具体汉语词的词源问题有过一段评论,指出单靠辞典来判断语词的出处有很大的危险性。“如果判断该词为中文成立的话,至少要仔细调查传教士留下的西学材料,然后找出与日本的关联,在确认两者的影响关系后才能在某种程度上给出一个答案。……无论哪种可能,都是以精确的资料调查为前提的,所以在调查每个词时所花费的精力和时间是必不可少的。从这一意义上看,该领域研究中的资料尚不完备,目前只凭借着《日本国语大辞典》《汉语大词典》《大汉和辞典》等辞书来构筑词史,未必能得出正确的结论,反倒是应该对过分依赖这些词典鸣起警钟。”[21]
这就是说,单单比较一下中日双方的辞书用例,就做出一个词语源自日本或中国的判断,不但不能解决问题,反而会带来各种误解。这首先要归结于辞典本身的问题,《大汉和辞典》(修订版)和《汉语大词典》所收的近现代词不足,特别是后者“既不使用西学资料和英华字典,在词目和用例上也无视或轻视近代语词”。[22]所以可以想象依照这类词典得出的结论是很不可靠的。
近年来,日本的《幕末·明治初期汉语辞典》(佐藤亨编,明治书院,2007)和中国的《近现代辞源》(黄河清编,上海辞书出版社,2010)相继出版,分别弥补了各自辞典在近代语词部分的不足,亦可以说有了一定的进步。比如,以下两例我们用《近现代辞源》和《日本国语大辞典》(第二版)做一比较,会发现中国的例子要比日本出现得早,按通常的看法,便会认为其是源自中文的语词:
[病例]中国1942/日本1959《海辺の光景》安岡章太郎「现在ではアメリカでもっと多く見られる病例で」⇒〈父母乃務 家庭育児〉三谷周策著(鍾美堂、1905)
[茶話会]中国1901/日本1909《田舎教師》田山花袋「大君の目出度い誕生日は茶話会では収まらなかった」⇒珈琲会(茶話会)〈処女のつとめ〉ダブイヂス著·阪田孫四郎訳(博文館、1894)
但是,如果再仔细调查的话,正如⇒后面的例句所示,我们可以上溯到其他文献里找出日语的用例。这也就是说,《日本国语大辞典》(第二版)虽说是日本最大规模的历史语言词典,但在用例采集方面明显呈现偏重文学的倾向,如上述两例均是取自著名文学家的作品,却并不是最早的用例。同样,宫岛达夫也举过“術科”一词,指出《近现代辞源》引用了《日本国志》(1890)、《游历日本观察兵制学制日记》(1899),而《日本国语大辞典》却只引了阿川弘之《春之城》(1952)的例子。“应该从小说以外军事方面的文献中寻找更早的例子,这显然是《日本国语大辞典》过于偏重文学方面的表现。”实际上我们往上细查一下,就会发现“術科”一词早在1890年的《步兵射击教范》(小林又七)里就使用了。[23]
另外,《近现代辞源》里早有了中文的用例,而《日本国语大辞典》(第二版)却只列词目,而给不出例句。比如,在《近现代辞源》里,下面四个词的最早出现年分别为:
[华氏温度]1942 [基肥]1925
[不成文法]1903 [儿童团]1942
可是《日本国语大辞典》(第二版)居然举不出例子来。如果按照以往的处理,这四个词当然要算作中文影响日文的例子了,可是再通过数据库往下仔细一查,就会发现在日本的文献里均能找出比《近现代辞源》更早的用例:
摂氏華氏温度比較表(伊谷以知二郎·松尾霊彦『鰛油漬缶詰製造書』水産書院、1907)
肥料の種類-石灰と稲作-施肥上の原則-施肥の時期-稲の成育と施肥-基肥と補肥(横井時敬『稲作改良論』博文館、1904)
成文法及不成文法より生する一般被治者の利害(河野和三郎『法律社会之現象』吉岡書籍店、1888)
家族兒童團規約貯金(『直江津郵便局誌 御大典記念』直江津郵便局、1916)
这就说明了一点:词源判断上的失误,多数是由辞书编纂的问题所引起的,即在用例采录方面尚欠努力。[24]反过来看中文也是一样,《汉语大词典》作为历史语言词典的缺陷是显而易见的。[25]
我们可以看出这种依靠辞书所做出的词源判断上的错误,多是起因于资料的不充分和调查的不足。欲以辞书的用例来建构具体词史,总是会因为材料的不足被误导。
关于这种近代词源研究的新取向,我们还可以关注宫岛达夫的《日中同形语之发掘》一文。过去一般是拿“学校”“科学”这类日中同形词来做对比研究的对象,但他以为像日语用テレビ、中文用“电视”这种完全分化的例子也应引起我们的注意,即“电视”这个词在过去的某一时期里,曾作为译词在日语里使用过,而后才进入中文,所以它是某一时期的日中同形词。像这类例子应该多加发掘,他拿吉泽典男、石绵敏雄编的《外来语的语源》(角川书店,1979)作为基础材料,看当时日本在翻译外来词时用过哪些汉字词,然后从中抽出日中同形的汉字词来,与《近现代辞源》的例子做比较,看看哪些词是在日本译出的“和制汉语”。这样细查一遍就会发现“《外来语的语源》对发掘日中同形词有着双重意义。第一,可以发现现代日语中已经不用,但中文里还在用的‘滑翔机’‘电视’等词;第二,可以给《日本国语大辞典》里那些只列有词目却无例句,或例句出现年代偏晚的词(如‘菜单’‘私刑’等)提供更早的例句”。[26]这就是说,“滑翔机”“电视”这两个词本身是出自日语的,只是日语后来采用了英语外来词,他们放弃的“汉语译语”通过英和辞典等被中国采纳。这类例子找下去,可能还会有很多(诸如“排球”“篮球”之类)。[27]
中日两国语料库的健全和完备,给我们在词源研究方面提供了强有力的支援。但中文语料库中多是按图索骥,只要是同一词形都被算作一例,这就需要我们花力气做去伪存真的工作。比如用《四库全书》的语料库来检索,出现三四十条的例子几乎都不以为证,只有到了上百条才比较有把握地验证出该词的存在和使用。强调这一点是因为有些人爱拿文献中出现的个别例子来当作一个既有的概念,确定该词的使用年限,而不去管它在当时是否已经成为一个固定的组合(成词与否)。