现代语义学出现于20世纪20~30年代,蓬勃发展于60年代以后。当计算机分析语言时,首先接触到文字、语音,其次是语法,然后就是语义。如果说语法分析是试图找出句子各个部分以及各部分之间的结构关系的话,语义分析则是试图解释各部分(词、词组及句子)的意义。在自然语言的计算机处理中,对自然语言语义分析的需求促进了现代语义学理论的发展[16][17]。
1.结构语义学(Constructural Semantics)
结构语义学最主要的贡献是由德国语言学家特雷尔于30年代提出的语义场理论(the theory of semantic fields)[18]。语义场理论把语言的意义看做系统,开始了语义系统的研究。这无论是在理论上还是方法上,对传统语义学都是一个突破。
语义场是指义位形成的系统。如果若干个义位含有相同的表示彼此共性的义素和相应的表示彼此差异的义素,且连接在一起,相互规定、相互制约、相互作用,那么这些义位就构成一个语义场[19]。语义场介于单个词和整体词汇之间,作为整体的一部分,它们有可能被并入一个更大的语义场中,而作为词的集含,又有可能被分成较小的语义场。因此语义场具有层次性。
按照义位与义位之间的关系,我国一些学者把语义场分为静态语义场和动态语义场两大类;又对静态语义场分为下述7类:分类语义场、顺序语义场、关系语义场、反义语义场、两极语义场、部分否定语义场和同义语义场。
通过语义场,理论上可以对语言的语义进行全面的描述,但是由于自然语言的复杂性,目前尚未见到语义场在实际自然语言处理系统中的应用。
2.解释语义学(Interpretational Semantics)
解释语义学是乔姆斯基所提出的转换生成语法的一个组成部分。1957年,乔姆斯基提出转换生成语法时,并没有注意语义,后来他接受了其他学者的意见,在1965冬出版了《语法理论要略(Aspects of the Theory of Syntax)》一书,修改了转换生成语法,称为标准理论。
标准理论[20][21]包括语音、语法、语义三个部分,语法部分具有生成性(generative),语义部分没有生成性,只有解释性(interpretive)。标准理论中关于语义解释部分就是解释语义学。
解释语义学对句子的深层结构做出语义解释,即运用一些符号和规则对语义进行形式化的描写,它依靠语义规则。语义规则用来检验句子的各个组成部分是否搭配得当,从而确定句子是否正确,或者解决句子的歧义。
但是解释语义学把句法看做语言的基础,认为句法应该而且能够独立于语义之外进行研究,这一观点是许多学者不能接受的,解释语义学的出现促进了乔姆斯基理论的发展,引起了语言学界对语义问题的关注,在语言学界掀起了一场句法和语义关系的大辩论。
3.生成语义学(Generative Semantics)
乔姆斯基的一些学生不同意他对语法和语义的关系处理,提出了生成语义学[22]。他们认为句法和语义是不可分的,语义是基础,起中心作用,句法不是基础。他们认为不必假定语法的深层结构的存在,也不必区分处理语义的投影规则和处理句法、语音的转换规则,只需一套转换规则就行了,直接把语义解释和表层结构联系在一起。
生成语义学认为句法和语义是不可分的,在语言的分析中,要把句法和语义结合起来,这是对语言学的一个重要贡献;但它把语义当做基础,这又是一些人不能同意的。
4.格语法(Case Grammar)
格语法是由美国语言学家菲尔默(c.J.Fillmore)于1966年提出的一种语言理论。他先后发表了《关于现代的格理论(Toward a Modem Theory of Case)》、《“格”辩(The Case for Case)》、《再论<“格”辩>(The Case for Case Reo-pened)》及《词汇语义学中的论题(Topic in Lexical Semantic)》等论文,建立了系统的格语法理论[23]。
菲尔默认为格语法和传统语法是两个不同的理论体系,传统语法表示的是表层结构的语法现象,而格语法表示的是深层结构的语义现象。其基本思想是:一个句子由两部分组成,即S=M+P。S代表句子(Sentence),M代表情态(Mo-dality),P代表命题(Proposition)。情态是指句子的时态、语态等,命题指的是体词和谓词之间的物性关系(transitivity),即句子的核心谓词与周围体词的关系,即格关系,这种关系包括动作与施事者的关系,动作与受事者的关系等。这些关系是语义关系,这是一切语言中的普遍存在的现象。
为了反映客观世界存在的语义关系,菲尔默提出了11种格:施事格(Agent)、工具格(Instrumental)、与格(Dative)、使役格(Factitive)、处所格(Locative)、受事格(Objective)、经验者格(Experience)、来源格(Source)、目标格(Goal)、时间格(Time)和途径格(Path)。(www.xing528.com)
格语法最大的特点是承认语义在句法中的主导作用,由格语法分析可以得到句子的深层语义结构,给出各成分担当的语义角色。因此,格语法适应于汉语的分析。
但是格语法在汉语的分析中也存在一些缺点。格语法认为动词在句子中起中心作用,那么分析句子时首先要确定句子的核心,汉语缺乏形态特征,汉语句子中常常有多个动词同时存在,作为核心的主动词通常也缺乏形态特征。如何在有多个动词的连动式和兼语句中找出句子的核心主动词是汉语信息处理的一个很难的问题,也是格语法无法解决的问题。格语法提出的各种格关系都是名词短语和动词短语之间的语义关系,对于名词短语内部和动词短语内部各成分关系的确定没有给出,因此,无法确定短语内部各成分之间的语义关系。
5.逻辑-数学语义学
逻辑-数学语义学是一个十分严密的语义学模式,以数学逻辑为基础,用其概念和方法研究自然语言,特别是研究自然语言所表述的各种语义现象,其中最著名的是蒙塔古语法(Montague grammar)[24]。
蒙塔古语法是美国逻辑学家蒙塔古于20世纪70年代提出的,它主要研究语义,也研究句法和语用。蒙塔古认为自然语言和形式语言之间没有本质的区别,对自然语言也可以用数学方法、逻辑方法进行研究,对其形式化。他提出了一个PTQ系统,建立了一种语义理论框架,用数理逻辑的方法解释自然语言的语义。
蒙塔古理论有三个基本部分组成:真值条件理论、模型论和可能世界理论。真值条件方法说明语言内在的相关性,语句的含义是什么,指称外界事物的有关描述是如何组织在这个世界中的。模型论用来计算真假条件语义,模型及其语义计算规则规定了目标语言的基本符号的语义值,以及计算由此组成的组合表达式乃至语句的语义值。一个语句为什么会取真值,归结到在什么样的环境下使语句成立,这些环境条件称为可能世界。它关系到语句在模型下求的语义值。
蒙塔古语义理论开辟了用严格数学方法研究自然语言语义的新方向,对于可计算的语义理论来说其影响是深远的。
6.情景语义学(Situation Semantics)
情景语义学是20世纪80年代初美国斯坦福大学J.Barwise和J.Perry提出的[25]。他们认为句子的语义不仅和逻辑语义有关,而且和句子被用情景有关。为了弥补语义和情境脱离的缺陷,在逻辑语义表达式中引入一些与情景有关的变量,如时间变量、事件变量等,并对这些变量加以限制,用逻辑“与”算子把句子语义的逻辑式和对事件的限制连在一起。
情景语义学提出了六个重要问题,即语言的外部意义问题、语言的能产性问题、语言的效率问题、语言角度相对性问题、语言的歧义问题、语言的心理意义问题。情景语义学给自己定了比较高的目标,即希望能用情景语义学的理论处理各种各样的语言问题。
7.概念依存理论(Conceptual Dependency Theory)
概念依存理论是由美国计算语言学家香克(R.C.Schank)在20世纪70年代提出的描述句义和言语义的方法[26]。香克认为,人在理解自然语言时依赖的是潜在的概念表述,而不是具体的词或句子。人们总是用以前遇到的更简单、更基本的事来理解现在所遇到的事情。因此当计算机理解自然语言时,要模拟人理解自然语言的心理过程。
该理论由三个层次。第一个层次是概念依存层次,规定了一组动作原语,其他动作都可以由这些动作原语组合而成,这是概念依存理论的基本思想。第二层次是剧本,主要用来描写平时在遇到的一些常见场景或场合时所采取的一些基本固定的成套动作。第三个层次是计划,为完成某项任务或达到某个目的,往往需要有个计划,计划中的每一步都是一个剧本。这样,从小到大,我们就可以用最简单的一组动作来表示很复杂的行为。
CD理论希望对常识进行系统而又具体的描写,并利用那些基本动作进行方便的推理,从而达到对语言的自动理解。但从另一方面看,CD理论对常识的描写是相当刻板和定式的。总的来说,这套理论对范围有限的应用领域是非常有用的。CD理论是针对理解的,是逻辑语义学的形式化方法,在自然语言理解特别是人工智能技术当中有一定影响。
8.优选语义学(Preferential Semantics)
优选语义学是由美国斯坦福大学的维尔克氏(Y.A.Wilks)在20世纪70年代初研制的一个英法机器翻译系统时提出的[27]。它的核心是放松词与词之间的语义限制,视这些限制为最佳选择,同时也允许有其他选择。动词可以根据其主、宾位置上词的语义特征,赋予不同的数值,动词的语义取向和名词的语义特征距离越远,获得的数值就越低。除了在动词和名词之间,形容词和名词之间、介词和名词之间都可赋予这种优选数值。简单句中句子的语义合理性是由各搭配词间优选数值之和标明的。复杂句的语义合理性是由各子句优选数值之和表明的。
对于计算语义学中一词多义和一句多解的难题,优选语义学提供了一条有效的途径,即优选数值大的语义更趋合理。但是优选语义学本身没有说明如何获得各词之间的优选数值,也没有说明优选数值的合理性以及随着上下文的变化这些数值应该如何变化。近年来,他的学生直接从英语词典中提取这些数值,并为建立大型而又实用的分析系统提供词汇资源。另外一些研究人员开始用统计的方法来获取这些优选数值,并已经取得一些成果。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。