根据2005—2007年国家语言资源监测与研究中心对中国主流报纸、广播、电视、门户网站语料的调查统计,因为共用词多为高频词,其总量不会有太大的变化,而年度独用词语(即只出现在当年的词语)约占当年词语的70%~80%(见表4-13)。这表明了社会语言生活中,每年使用的词语可能会有较大的差别。
表4-13 2005—2007年国家语言资源监测语料库语料词种数比较
从图4-1中看出,年度独用词语基本上就是命名实体。独用词语中有42%~45%的词为组织机构名称,该类词语使用率最高,相对于普通词来说最不稳定。
图4-1 2005—2007年度国家语言资源监测语料库语料独用词语的词性分布
以上是2005—2007年度多种媒体语料上的统计数据,但这些数据依然具有普遍的意义。从中我们看到了组织机构名称和其他词语相比所具有的特殊性。下面我们在2002—2006年度六种报纸语料的基础上对组织机构名称的年度分布进一步进行细致的考察分析。
从表4-14可见,每年独用组织机构名称种类与当年全部组织机构名称种数的比值约为0.6560,独用组织机构名称总数与全年组织机构名称总数的比值约为0.1990。年度独用组织机构名称一般为频次为1至2的组织机构名称。(www.xing528.com)
表4-14 2002—2006年组织机构名称年度分布统计
表4-15为2002—2006年高频的年度独用组织机构名称。高频的年度独用组织机构名称,则为当年较热门的组织机构名称。例如,2003年,皇马来华,中国足协临时组建了一支“中国龙队”进行足球比赛。所以“中国龙队”是一个临时性的组织机构名称。再如,2005年,国民党主席连战率领中国国民党大陆访问团访问大陆。2006年,齐齐哈尔第二制药有限公司爆出“假药”丑闻。国家食品药品监督管理总局紧急做出“在全国范围内停止销售和使用齐齐哈尔第二制药有限公司生产的所有药品”的要求。年度独用组织机构名称不等于该组织在其他年份未被报道过,只不过组织机构名称相异。而对于当年报道规模本来就较小的独用组织机构名称,往往就是名副其实的“过客”了。因此,组织机构名称的持续出现表明了组织在历时中的意义和影响力。然而,要切实从语言的角度调查组织在历时中的意义和影响力,就应该了解所有同义组织机构名称的历时分布情况。这里由于篇幅所限,就不具体展开讨论了。
表4-15 2002—2006年高频年度独用组织机构名称
从表4-16可见,相邻两年会重复用到的组织机构名称种数与全部组织机构名称种数的比值为0.2064。这个结果和国家语言资源监测与研究中心对三年共用词语种数的统计结果是一致的。这说明两年共用的词语一般也就是多年共用的高频词语和历时关注度较高的非高频词语。对于组织机构名称而言,也是如此。
表4-16 相邻年度组织机构名称重合情况
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。