词汇的构成
词汇(vocabulary)是一种语言或方言中词和固定语的总汇。
固定语主要包括
熟语、专用语和
客套语。熟语主要有
成语(如「守株待兔」)、
惯用语(如「拖后腿」)、
歇后语(如「外甥打灯笼一照旧」)等,专用语主要有组织机构名称(如「北京大学」)、专有名词(如「
第一次世界大战」)、专业术语(如「
磁盘驱动器」)等,
客套语如「您好」、「对不起」等。
有时,词汇还指一个作家使用的全部词语的汇集,一部作品词语的汇集等,所以有鲁迅的词汇、《战争与和平》的词汇等说法。「词汇」是
集合概念,「词」是个体概念。
词是音义结合的定型单位,是表达思想时可以调遣的现成材料,是词汇的基本成员。除此之外,
固定语也是音义结合的定型单位,在使用时相当于词,可以看作词的等价物,也是词汇的成员。词是由
语素构成的,在分析词的结构的时候,少不了
语素这一级单位。因此,语素、词、固定语都是
词汇单位。
词汇的分类
基本词汇和一般词汇
早在19世纪初,丹麦语言学家
拉斯克(R.C.Rask)就提出了「基本词汇」概念。20世纪50年代,
斯大林在《
马克思主义和语言学问题》一书中作了进一步阐述,对中国大陆地区语言学界影响很大。
一种语言中处于基础地位的词是
基本词。所有
基本词的总汇构成
基本词汇(basic vocabulary)。基本词汇的核心是
根词。基本词以外的词的总汇构成
一般词汇。一般认为,基本词汇的特点有:
(1)普遍常用性。
由于
基本词汇表示的是跟人们日常生活关系极为密切的基本事物、基本动作和基本性状,
词义平白、
义域宽广、色彩中性,所以不同行业、不同阶层、不同文化背景的人在交际时都离不开它,不仅使用人群具有普遍性,而且适用范围也具有普遍性,适用于
口语和
书面语的各种
语域。常用性反映在量上就是
使用频率高,各种
词频统计数据可以说明这一点。基本词汇是普遍性和常用性的综合。
(2)历史稳固性。
基本词汇是
词汇系统中最稳固的部分。例如,汉语的「天」、「地」、「风」、「雨」、「生」、「死」、「大」、「小」、「一」、「二」,从
甲骨文时代到现在,历时几千年,基本没有变化。平常说的
语言结构要素即
语音、词汇、
语法三者中数词汇变化最快,是就
一般词汇而言的。
但不能说基本词汇就没有变化,如古汉语「目」现在叫「眼睛」,「视」现在叫「看」,不过,它们仍然作为基本构词语素存在于
合成词当中,如「目前」、「目标」、「项目」、「题目」,「视察」、「视野」、「电视」、「重视」等。
基本词可以作为
构词的基础,降级为构词
语素构成其他的词。如「人」,可以构成「人民」、「人群」、「人员」、「人工」、「人生」、「工人」、「为人」、「伟人」、「小人」、「新人」等。但有些基本词的构词能力很弱甚至没有,如「你」、「谁」、「的(de)」、「吗」。
关于基本词汇的三个特点哪个是最根本的特点,人们的看法并不完全一致。
葛本仪认为,「在这三个特点(按:指‘普遍性’、‘稳固性’、‘是构成新词的基础’)之中,应该说,‘普遍性’又是最根本的」;
刘叔新认为,「历史悠久和社会普遍使用,这两个特征充作确定基本词汇的条件,则是恰当的」②;
符淮青认为,「在三个标准(按:指‘普遍性’、‘稳固性’、‘是构成新词的基础’)中,构词能力是最重要的一个标准」③;
李如龙认为,「常用度和派生能力作为基本词汇的主要特征,还是无可争议的」。
安华林认为,基本词汇应该作为
共时的概念来理解,在某个时期,一种语言的词汇系统中处于基础地位的词汇就是
基本词汇,而不管它的历史长短和构词能力强弱,显性的表现就是全民在交际时经常使用,因此「普遍常用性」应该是基本词汇的最根本的特点。
普遍而经常使用的东西不容易变动,自然使基本词汇具有稳固性;人们乐于用熟知的
基本词作为构成
新词的基础,这样又加强了它的稳固性。「历史稳固性」是历时维度,而且时间段也不明确;「构词能产性」不能涵盖所有的基本词。
基本词汇和一般词汇没有绝对的分界线,两者可以互相转化。例如,「电脑」「手机」出现的时间并不太长,现在已经成为现代汉语的基本词了;「公社」、「工分」已经退出基本词汇的范围,成为一般词了。我们应该动态地看待基本词汇。
常用词汇和非常用词汇
常用词是在某一个时期经常使用的词。常用词的总汇是
常用词汇,其他词构成的集合是非常用词汇。
常用词汇和非常用词汇的划分根据词语的使用频率,可以靠词频统计得出。由于词频的高低是渐变的,因此常用词汇和非常用词汇的划分也是相对的,如可以分为最常用词汇、次常用词汇、非常用词汇等。
词频统计依赖一定的
语料基础,语料范围不同,结果就会不同。比如可以有口语常用词汇、书面语常用词汇、新闻常用词汇、法律常用词汇等。如果统计的范围足够大,涵盖所有的语言使用领域,就是一种语言的常用词汇。目前还不能完全做到。一般所说的常用词汇还只能是「局域」常用词汇。
统计显示,一种语言最常用的词大概就是那三四千个,对语料的覆盖率却达到85%以上,这就意味着,掌握了它们,就能懂得一般语言材料的85%以上的内容。
现代汉语词汇的计量研究和常用词的提取工作取得了一些成果。
词频统计的成果如:
《现代汉语频率词典》(北京语言学院语言教学研究所编著,1986年)统计了180万字的语料,收录不同词语31159条;
《现代汉语常用词表(草案)》(国家语委发布,2008年)统计了2.5亿字的语料,收录不同词语56008条。
常用词提取的成果如:
《普通话三千常用词表(初稿)》(郑林曦等编,1959年)收词3624个,1987年的增订本增加到3996个;
《现代汉语三千常用词表》(何克抗、李大魁主编,1987年)收词3000个;
《汉语水平词汇与汉字等级大纲》(刘英林主编,1992年)收词8822个,分为甲、乙、丙、丁四级,甲、乙级词共3051个,修订本由2001年出版。
但总起来看,统计的语料范围还不够广泛,数量还不够充足,口语语料所占比例还不高。
常用词汇与基本词汇的角度不同。基本词一定是常用词,但常用词不一定是基本词。如果一个词只在某个领域常用,而不具有普遍性,就不是基本词。如教育行业常用的「预备」、「上课」、「备课」、「口试」、「课件」等就不是基本词。可以认为,基本词是常用词中普遍常用的那一部分。
通用词汇和专用词汇
通用词汇是一种语言的全体成员都使用的词汇。基本词汇就是通用词汇。「
通用」着眼于词语
通行的范围广,不一定「常用」,如「天」和「天空」,「书」和「书籍」,都是
通用词,但每组后者都没有前者常用;「常用」着眼于词语使用的频率高,受语料范围的限制,常用词不一定是通用词,如「名词」、「动词」、「形容词」、「主语」、「谓语」等在语言研究领域常用,但不是通用词。
专用词汇是一种语言的部分成员使用的词汇。人有性别、年龄、地位、文化程度等方面的差别,不同行业、领域、学科都有自己的词汇,这就形成了只供一部分人使用、只限于某个范围使用的词汇。学科术语、
行业语、隐语、
黑话都具有专用性,外行人很少使用甚至不理解。
通用词汇和专用词汇也可以互相转化。通用词语「窗口」、「菜单」已经成为计算机用语,医疗用语「麻痹」已经成为通用词。
口语词汇和书面语词汇
口语词汇是主要用于口头语体的词汇。风格通俗随便,有的诙谐生动,有的直白粗俗。
书面语词汇是主要用于书面语体的词汇。风格庄重典雅,有的书卷气浓厚,有的艺术感染力较强。试比较下表的词汇。
口语词汇和
书面语词汇各有自己的使用场合。上体育课时,老师喊一声「立正」,然后讲解「立正」的动作要领:「两眼平视,双臂自然下垂,胸部挺起,腹部内收。」学生会按要求做好。如果全部改成口语词,说成「两只眼睛平着看,两条胳膊耷拉下来,胸脯鼓起来,肚子缩回去」,恐怕学生很难做好。
旧词和新词
旧词是产生历史较长的词。根据它在现代语言中的使用情况,可以分为两类。
一类是在现代语言里仍在使用的词,又分两个小类:①仍然很活跃,生命力很强,感觉不到它的陈旧气息的,可以叫作「
传承词」,如「人、杀、大、一」,狭义的旧词不包括这一类;②不那么活跃,在书面语里有时还会用到,带有明显的书面色彩的,可以叫作「文言词」,如「此」、「故」、「之」、「兹」。
另一类是在现代语言里基本不使用的词,也可以分为两个小类:①指称的事物已经消失,这些词语也随之成为旧词,可以叫作「
历史词」,如「太监」、「宦官」、「妃子」、「保长」;②指称的事物仍然存在,但已经被新的词语取代,可以叫作「旧彩词」,如「伙夫(炊事员)」、「戏子(演员)」、「薪俸(工资)」、「县令(县长)」。这些词在指称历史现象和营造历史氛围时,比如在历史著作、文艺作品里还会用到。
历史词和旧彩词都可能被重新启用,如汉语的「先生」、「小姐」在新的社会语言条件下又焕发了青春。
新词是产生历史较短的词。新事物、新现象出现后,需要有新的词语指称它们。如汉语的「多媒体」、「宽带」、「网民」、「网虫」、「炒作」、「宅男」、「宅女」都是历史不太长的词。
新词不同于
生造词。新词已经被大众接受,成为语言大家庭的成员,而生造词只是个人创造,还没有被社会接受。当然,生造词可以成为新词的来源。
旧词和新词没有严格的时间分界线。其实可以根据词语的时代色彩相对地分为三类:带有明显陈旧色彩的是旧词,带有明显新鲜色彩的是新词,时代色彩不明显的是中性词。
方言词和外来词
方言词(dialectism)是通行于某个地区的词语。与
全民词相对,主要出现在口语当中。例如,四川话的「
抄手」(馄饨)、「
锅魁」(烧饼),山西、陕西一带的「
地板」(地)、「
婆姨」(妻子),上海话的「
绢头」(手帕)、「
阿拉」(我),广州话的「
雪柜」(冰箱)、「
家俬」(家具)等。有人把方言词理解为「普通话从各方言中吸取来的词」,如
垃圾(吴方言)、
忽悠(东北方言)、
搞(西南官话)等。方言词是
民族共同语词汇的重要来源。
外来词(alien words/,foreignism)指从外民族语言吸收进来的词语。与
本族词相对。就输入方而言,叫
借词;就输出方来说,叫
贷词。它是不同民族语言文化交流的产物。
借词中有一种借出又借进的特殊现象,称为「回借」。汉语里的「
大风」借入
英语,音译为
typhoon,指发生在
太平洋上的一种强风暴,后来又从英语里借回来,变成了「
台风」。「博士」原是汉语词(古代一种传授经学的官员或专精某种技艺的人),蒙古语借去读为pakci,意思是「老师,师傅」。汉语又从蒙语借回来,写作「
把势」或「
把式」,指擅长某种手艺或有某种能耐的人。表示最高一级学位的名称是从日语借回的。
汉语吸收外来词主要采取以下方式:
(1)借音,形成
音译词。直接翻译外来词的语音,用字只记音,不表义。例如,打(
dozen)、米(
meter)、沙发(
sofa)、摩托(
motor)、麦克风(
microphone)。
(2)借义,形成
意译词。用汉语语素或语素组合表达外来词的概念。例如,电话(telephone)、电视(television)、话筒(microphone)。由于语素和构词法都是汉语的,所以意译词一般不认为是借词。
意译词中还有一类,如
football—一足球、
blackboard一黑板、honeymoon—蜜月,外语与汉语语素一一对译,格式相同,有人称为「
仿译词」(或「直译词」),一般也不认为是借词。汉语有较强的意译倾向。原来的一些
音译词,后来很多改成了
意译词,例如,
德律风(telephone)—电话、
赛因斯(
science)—科学、德谟克拉西(democracy)民主。有些词音译和意译形式并存,例如,
麦克风/
话筒、
盘尼西林/
青霉素。
(3)借形,形成借形词。直接借用外来词的书写形式。一种是借自日文的借形词。由于日文仍然保留有部分汉字,汉语就把用汉字书写的日语词直接借进汉语,只借形,不借音。例如,手续、场合、客观、绝对、课堂。一般所说的借形词即指借自日文的借形词。这种词和正宗的汉语词很难分别,许多人认为不是外来词。
熟语和缩略词语
熟语(
phraseological unit)是在语言长期使用过程中
相沿习用形成的、作用相当于词的固定形式。它们的结构或表现为
固定词组,或表现为固定短句。特点是:
(1)结构的定型性。
一般不能随意颠倒
语序,或插入、更换成分。例如,「指鹿为马」不能说成「指马为鹿」、「指鹿成为马」或「指鹿为牛」。
(2)意义的整体性。
熟语的整体意义一般不是成分意义的简单相加,多数不能按字面意义理解。例如,「胸有成竹」不能理解为「胸中有现成的竹子」,而是「做事之前有通盘的考虑」。
(3)功能的类词性。
尽管熟语的结构比词长,但功能与词相当,充当语言运用的备用材料。
汉语中,熟语主要包括成语,如「朝三暮四」、「本末倒置」;惯用语,如「拖后腿」、「拍马屁」;歇后语,如「千里送鹅毛—礼轻情义重」、「电线杆上绑鸡毛好大的胆(掸)子」等。
其他语言如英语同样存在熟语,例如,black and blue(青一块,紫一块)、Seeing is believing(眼见为实)、to kill two birds with one stone(一石二鸟/一箭双雕)。
缩略词语(
acronym/
abbreviation)是在原有词语的基础上通过
节略、缩合等方式而形成的简短形式。又叫「略语」,习惯上叫「简称」。缩略词语与原来说法表达的概念相同,只是形式更为简略,提高了交际效率。
缩略词语主要采用以下方式:
(1)节略。
截取原来形式的一部分,略去其余部分。例如,清华大学——清华、中国人民解放军—解放军、
laboratoryy——
lab(实验室)。
(2)缩合。
挑选有代表性的语素或字母重新组合。例如,中华人民共和国—中国、邮政编码—邮编、the United States of America—USA(美国)、Communication(通信)Satellite(卫星)—Comsat(通信卫星)。
(3)简代。
(4)标数。
把相同的语素或共同的语义特征合在一起用数字概括。例如,陆军、海军、空军—三军、《大学》、《中庸》、《论语》、《孟子》—「四书」。
就汉语的缩略词语来说,如何挑选有代表性的语素,值得研究。
按理说,应选处于中心地位的语素,其实不尽然。例如,「北京」简称「京」,为什么「北京大学」不说成「京大」而称「北大」呢?「
邮政编码」中,「邮政」简称为「邮」是为了明确,「
编码」的中心语素是「码」,为什么不说「邮码」而说「邮编」?
是不是都倾向于挑选每个词的第一个语素?也不尽然。例如,「中国共产党委员会」,不说「中委」或「共委」,而说「
党委」。
安华林觉得,一个
缩略词语最终定型,是形式的
简洁性(用尽量少的
语素概括原词意义)、意义的明确性(「师范学校」不说「师学」、「中等学校」不说「中校」,都为了明确)、使用的
区分度(「师范」、「师校」、「师专」、「师院」、「师大」形成相互区分的师范教育系列)相互作用的结果。
另外还有个心理接受程度的问题,「上海吊车厂」不称「上吊」,「自贡纺纱厂」不称「自纱」,就因为意思不好,不易被人接受。
从结果来看,通过缩略方式得到的单位可能是「语」,可称为「
缩略语」,如上面所举的「北大」、「四书」、「USA」;也可能是「词」,可称为「
缩略词」,如上面所举的「解放军」、「沪」、「lab」。合称「
缩略词语」。