本节内容继续对组织机构名称用词的词性分布进行进一步的深入分析。首先我们将用词总表中的词性标记大致对应到四种语言学词类中,以便从语言学角度对词语进行分析。
(1)名词:地名、名词、名语素、人名、方位词、其他专名、处所词、组织机构名称、简称、后接成分10类分词标记。
(2)动词:动词、动名词、动语素、副动词4类分词标记。
(3)形容词:形容词、形语素、副形词、名形词4类分词标记。
(4)区别词:区别词、区别词语素、前接成分3类分词标记。
名词、动词、形容词、区别词都是语言学中的基础词类。词性标记中的语素作为构成词的基本单位,是最小的意义单位,并非单独的词类。但分词标记系统针对单音节语素的构词功能,标记了名语素、后接成分、动语素、形语素、前接成分、区别词语素等。这里将其分别归入了名词、动词、形容词和区别词。
1.名词
一般而言,组织机构名称的任何位置都可能出现名词。组织机构名称中心词(如大学、医院等)、中心词限定成分(如有限责任公司、股份有限公司等)、内容说明成分(如航空公司、新闻网、农业厅等)、字号(如希望集团、农夫山泉等)以及表示地名范围的词(中国、国际、国家、华中、东亚等)。名词中的禁用词包括两类。
(1)非组织机构名称中心词。上一节对中心词作了统计分析,我们已经得到了一批在组织机构名称中心词位置上禁用的18个伪中心词,如基地、大厦、赛、会议、区等。它们都是名词。含有这些伪中心词的组织机构名称识别结果共11711种,占识别结果的1.9%。其总词次为36240,占识别结果的9.2%。
(2)大多数方位词、处所词。组织机构名称中出现的方位词和处所词一般单独出现或附加于地名上,在组织机构名称中起地名的作用。不同的是,方位词一般较为抽象,处所词一般比较具体。这两类词语中的禁用词如表7-10所示。
表7-10 禁用方位词、处所词示例
续表
(3)称谓词语。如奶奶、前妻、原配、姊、老伴、老伯、老父、老妈妈、老师傅、老天爷等。错误识别结果如:小丽的奶奶打电话到青少年事务社/ORG、老父将子告上法庭/ORG。
2.动词
组织机构名称中的动词可作为中心词限定成分和组织机构名称说明成分,对于不同类别的组织机构名称,其禁用组织机构名称有所差异。因此组织机构名称中的动词使用比较复杂。一般而言,以下类别的动词是禁用词语。
(1)心理动词类:认为、能否、知道、克制、依赖、爱恋、满意等。如:安徽省高校大学生若认为学校/ORG。
(2)系动词:系、是等。如:刘某系/ORG、刑警队长/ORG、title:同江边防心系敬老院/ORG、CBL联赛是篮管中心/ORG。
(3)动作动词类:告诉、来到、会见、状告、退出、拿到、搬进、提议、叩开等。如:MBA学员来到汇丰银行北京分行/ORG、北京车主状告交通队/ORG、阿拉伯国家提议召开联大/ORG。
(4)存现动词类:在于、共有、存在等。如:北京共有大小马术俱乐部/ORG。(www.xing528.com)
(5)抽象动词类:成立、建立、设立、成为、落户、转会、通过、上市、到、引发、改变等。如:电子信息产业类上市公司/ORG。
3.形容词、区别词
(1)人物正面评价、描写类形容词:著名、知名、自重、骁勇、丰满、诙谐、镇静、天真。如:APTECH是印度知名软件公司/ORG。
(2)人物负面描写类形容词:憔悴、着急、专横、阴郁、顽皮等。如:着急堵商场/ORG。
(3)实物描写评价类形容词:厚、幽雅、素净、国产。如:亮马桥一家环境幽雅的日式餐厅/ORG。
(4)抽象物描写评价类形容词:正规、真挚、深厚、合法、新任、原、首任。如:安徽华源这样正规药厂/ORG。
(5)事件描写评价类形容词:早、重要、庄严、神速。如:成为全球汽车零部件重要基地/ORG。
由于组织机构名称是一个公开使用的专有名词,其命名还受到法律法规的制约,词语选用的一般原则是使用书面语、使用正面语义的词语。因此,总体上看,以下两种词语一般不能出现在组织机构名称中[7]。
(1)口语色彩的词语。
①禁用的名词类词语:紧要关头、上头等。
②禁用的动词类词语:钻空子、主抓、瞎闹、打工、打电话等。
③禁用的形容词:好色、听话、老实、顺口等。
(2)负面评价描述、不雅的词语。
①禁用的名词:走狗、姘妇、缺陷、谎话、殒命等。
②禁用的动词:作弊、俨然、夭折、羁押、沾光、涉嫌等。
③禁用的形容词:郁闷、狂躁、荒唐、萧条等。
这两类词语占了禁用词语的主要部分。而在这两类词语之外,还有一部分禁用词受到其他的句法、语义功能的限制。这里仅做初步的考察研究。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。