首页 理论教育 基于Agent的辩论谈判的研究现状与趋势

基于Agent的辩论谈判的研究现状与趋势

时间:2023-07-18 理论教育 版权反馈
【摘要】:在将博弈论应用于Agent的谈判研究中,研究者们通过对同等参与者之间的博弈谈判来决定最优策略,并寻找均衡[7]。就目前有关文献中所做的研究来看,有关博弈论的Agent谈判的研究通常只包括交互的Agent之间的报价交换,直到达成一致[10]。但是,博弈论在Agent谈判中具有一定的局限性。综合来说,主要存在如下几个问题[12]:①博弈论假定能根据可能结果对Agent的偏好特征做出界定。

基于Agent的辩论谈判的研究现状与趋势

1.3.1 基于Agent的谈判的主要方法

现有的基于Agent的谈判的研究涉及管理学人工智能、计算机、经济学、运筹学心理学等许多学科,是一个值得研究的综合了各交叉学科的基本原理和方法的研究对象。目前为止,国内外学者对此作了广泛的研究,主要可分为以下三种:

第一,基于Agent的博弈谈判。前面提到,博弈论(Game Theory)是经济学中最早被用来研究利己且经济的Agent之间进行策略谈判的一个重要分支,起源于Neuman和Morgenstern所做的工作,近来被广泛用来研究利己的Agent间的谈判[1]。它主要假设参与者具有完美理性(Perfectly Rational),且这些理性是一般知识(Common Knowledge)。然而,完美理性并不能支持真实生活中以人作为参与者的场景。此外,基于Agent的博弈谈判还认为智能代理具有无限的计算能力和谈判时间,并且完全知道其结果空间。

第二,基于Agent的启发谈判。随着人工智能方法的发展,为较好地解决有关博弈论方法在基于Agent的谈判中的局限性问题,出现了大量基于启发式(Heuristics)的方法,主要在于谈判的过程中使用如决策树、Q-Learning和演化机制等技术。这种方法由一些能产生足够好的(而不是最优的)结果的规则组成,并且这些结果一般都在有关Agent个体理性和资源较为松散的假设环境下产生,但对这种方法的支持一般都需要经过经验测试[2]

第三,基于Agent的辩论谈判。随着研究的不断深入以及人工智能的不断发展,越来越需要将Agent在人工智能方面的长处进一步在谈判的过程中得到充分发挥,因此,在现有研究中,有的试图将人类的辩论方式或策略等与之进行有机结合,以充分发挥Agent代表人类进行谈判的功能,从而更大程度地节约成本和提高效率,并能得到谈判各方都更为满意的谈判结果。因此,这也成为本书的研究重点。

为了对基于Agent的谈判的研究现状从整体上进行更好地综述,本书接下来的综述主要都是建立在以上分类的基础之上。

1.基于Agent的博弈谈判

Osborne和Rubinstein认为,博弈是对包括参与者可能采取行为的限制和参与者利益的谈判策略的描述,但没有规定参与者所采取的行为。博弈论在谈判过程中所寻求的解决方案是对在假设参与者具有完美理性并且此理性是一般知识的基础上的博弈结果的系统描述。一般来说,应用博弈论能得出合理的博弈结论并能检验他们的属性。此外,他们还认为构成模型的元素主要包括如下几个[3]

交易协议。规定谈判参与者之间的遭遇规则。协议的设定称为机制设计,好的机制应当具有稳定性、简单性和分布性等特征。

②交易策略。对Agent在谈判过程中计划完成的行为(一般为报价或对报价应答)顺序的规定。

③信息状态。描述Agent有关谈判参数的信息,如参与者的效用函数、保留值、折扣因素、最后期限等,分为完全信息及不完全信息。

④交易均衡。保持谈判机制稳定的交易模型中的重要因素。具有个体理性、有效性、单一性、对称性等属性。

最近,N.R.Jennings和P.Faratin指出,有关博弈论在Agent谈判中的应用主要被用来解决下面两个关键问题[4]

①设计合适的协议。以管理谈判参与者之间的谈判,协议规定了参与谈判的Agent之间的“遭遇规则”[5]。正式来说,协议是谈判参与者所能做出的一套有关提议限制的规则。可以设计协议,使特别的谈判历史具有一定的令人满意的属性。如成功的保证、社会福利最大化、帕累托效率、个体理性、稳定性(纳什均衡)、简单化、分散化[6]等。规定谈判参与者之间的遭遇规则。协议的设定称为机制设计,好的机制应当具有稳定性、简单性和分布性等特征。

②设计特别策略(Agent的决策支持模型)。以使个体Agent在谈判中能被使用——Agent的目标是使用相关策略来使其个体利益最大化。然而,一般来讲,用博弈论设计的策略难以计算,因此,在实践中难以得到普遍使用。

在将博弈论应用于Agent的谈判研究中,研究者们通过对同等参与者之间的博弈谈判来决定最优策略,并寻找均衡[7]。在假定的博弈规则、假定的支付状况、假定的参与者目标和假定参与者彼此之间并不知道对方任何情况的前提下,通过博弈论所做出的策略对参与者来说有时是最佳的。根据假定理性选择理论[8],可以更进一步假定参与者行为,这种方法能指导谈判机制的设定,可以强迫Agent的行为服从一定的方式[9]

就目前有关文献中所做的研究来看,有关博弈论的Agent谈判的研究通常只包括交互的Agent之间的报价交换,直到达成一致[10]。在这种情况下,发送报价方的每个报价暗示一个有条件的承诺,当且仅当接受者发送一个“同意”的消息时,报价方会颁布报价内容,报价或参与谈判对象的内容可以非常简单(如仅是基于价格和质量),也可以非常复杂的(如包括价格和质量间的谈判)[11]

但是,博弈论在Agent谈判中具有一定的局限性。综合来说,主要存在如下几个问题[12]

①博弈论假定能根据可能结果对Agent的偏好特征做出界定。然而,人们很难根据结果对其自身偏好做出一致定义。一般来说,人类的偏好并不能通过一个简单的对结果的排序来对其偏好特征做出界定,更不用说数字效用[13]。在偏好较为明显的情况下(如某人想以最低价格购买一个特别的CD),博弈论将会起相当大的作用,如涉及更复杂的偏好(多问题),使用博弈论将会难以解决问题。

②在相互依赖的情况下,博弈论不能产生管理理性选择的一般模型[14],相反,它能产生许多特定的可应用于相互依赖的决策制定(如Neumann-Morgenstern有关两人博弈的解决方案)的特殊类型的模型。

③博弈论模型通常假定较好的计算理性,这意味着在结果可行的范围内不需要通过计算来寻找相互间都可以接受的解决方案。此外,可能的交易中的谈判空间一般都被认为可以被Agent完全知晓,但此假设在现实世界中并不真实,因为Agent可以知道他们自己的信息空间,却并不一定能知道对手的信息空间。此外,即使知道双方都具有的联合信息空间,知道解决方案的确存在与知道解决方案到底如何也是完全不同的。因此,个体理性的偏好虽然在设计、语言和证明系统属性方面有用,但在实践中并不一定有用。首先,它不能被真实地得到,因为自然机制需要花费时间来处理信息和选择行为,因此,真的Agent行为不能立刻反映环境的变化,一般来讲是次优的[15];其次,它没有提供一个能分析Agent内部机制设计的方法。

近来,有一些学者就博弈论中不完全信息方面在Agent谈判中的应用进行了研究。M.Bac和H.Raff开发了一个具有内在议程的模型,并将Rubinstein的单一蛋糕模型扩展为增加第二块蛋糕的不完全信息模型[16],与内在议程相似的研究包括S.Fatima等人的研究。M.Bac和H.Raff考虑了有关最后期限的不确定性,S. Fatima等人的研究则视对手的最后期限和保留价格为不确定信息。此外,S.Fatima等还认为每个Agent的信息是不为对手所知的其自身所私有的知识(Private Knowledge)。虽然上面的模型都涉及了不完全信息,但他们都认为议程和程序是固定参数。Fatima和Wooldridge等(2004)将议程和程序视为不固定的参数,表明虽然Agent对于议程—程序的混合可能有同样偏好,但由于缺乏完全信息,还是不能识别这样的情况,因此,需要设计一个能使他们这样做并且能使效用增加的机制。

2.基于Agent的启发谈判

虽然基于Agent的启发式方法被选用来弥补更传统的基于Agent的博弈论模型中的计算中的缺陷,但这种方法认为存在着与计算和决策制定相关的成本,因此致力于以一种非详尽的方式来寻找谈判空间,以求尽力达成好的输出结果,而不是最优结果[17]。相比之下,最大化参与Agent效用总和的最优输出结果通常都是博弈论所寻求的[18]

有关此方法在Agent谈判中的研究可参见P.Faratin(1997, 2000),Faratin、Sierra和Jennings在他们所做的论文中对此提出并做了大量描述,各种启发式的决策函数被用来在多属性谈判[19]中评估和产生报价或提议(如潜在交易),同时,他们也提出了一个产生交易的方法,帮助在整个谈判过程中[20]建立可替代的报价。Kowalczyk和Bui提出了一个谈判模型[21],其决策过程建立在分散限制满意的基础上[22],后来被拓展入多重并发谈判[23]和可容纳的模糊控制[24]中。使用模糊控制更进一步研究的有S.Fatima et al. (2002,2004),X.Luo et al.(2003),研究了在特定的启发式模型中信息和时间限制对谈判均衡的影响。

通过对以上学者在此方面研究的探索,可以看出,虽然启发式方法确实克服了一些博弈论方法的缺点,但仍存在许多不足之处。可以将启发式方法在Agent谈判中的有利之处和不利之处归纳如下[25]

①有利之处。模型主要建立在对现实的假设基础上,因此能提供较为合适的谈判基础,从而被广泛应用;Agent的设计者没有结合博弈论,能被替代,限制较少,可以针对不同的Agent体系开发相关的理性模型。

②不利之处。模型一般选择次优结果。因为他们采取了一个有关个体理性的适当概念,同时,模型没有检查可能输出结果的全部空间;模型需要进一步评估,一般通过模拟和经验分析。这是因为不可能对系统和构建的Agent在一个较为广泛的环境中进行精确预测。

考虑到上述基于启发式谈判方法的优点和缺点,近来有许多学者在此方面作了大量的相关工作,较有代表性的有Nguyen和Jennings(2003)开发和评价的一个能使Agent参与竞争环境下(Agent不具备优先的有关谈判对手偏好的知识)的多重、并发的双边遭遇的模型,他们认为此环境具有信息不确定和最后期限的特征。

在Nguyen和Jennings所做的较为前沿的相关研究中,首先,令i代表购买商的Agent或代表销售商的Agent,令表示满足服务的谈判最后期限。所有Agent都具有自身有关服务的偏好,且他们所拥有的信息是私有的,谈判中所使用的语内表现行为非常广泛,主要包括报价(Offer)、反报价(Counter-offer)、接受(Accept)、决定(Finalize)、拒绝(Decline)和终止(Withdraw),并提出了有关代表购买商的智能代理的组成部分,即一个协调者(Coordinator)和一些谈判线程(Negotiation Thread)。

其次,研究对协调者的工作机制作了相关描述。他们认为,协调者以类似于黑板机制的方式来处理正在进行的遭遇中的共享信息。更重要的,他将决定每个线程中的谈判策略以及是否应当随时间的改变反映他们所达成的一致。策略可以分为三类[26]

令Sc表示让步者(Conceder),Sl表示线形者(Linear),St表示顽固者(Tough),且S=Sc∪Sl∪St,所有策略都有与最后期限和保留值有关的初始值,让步者策略很快降低自己的值,直到达到其自身的保留值,线性者策略以一种平缓的方式降低到他自身的保留值,顽固者策略一直坚持初始值,直到最后期限到来后迅速降低至其自身的保留值。

对协调者作如下分析:在时刻t(2<t≤tmax),协调者决定销售商是让步者(Conceder)还是非让步者(Non-conceder)。特别地,假设代表销售商的Agenti在时刻j(0≤j≤t)提出的报价值,如果∀k∈[2,t]:>α,则代表销售商的Agenti被认为是让步者,其中,α是让步行为中的极限值。如果代表购买商的Agent为让步者,将具有同样特征。

根据以上分析,进一步令Ac和An分别表示让步者Agent和非让步者Agent,策略集S={Sc,Sl,St},Agent集合A={Ac,An},协调者根据谈判线程中参与谈判的Agent类型来改变策略,属于集合Ac的Agent为了结束谈判,将会作出让步。如果Agent与其余Agent谈判时保持顽固的态度,得到的交易值可能会比坚持目前情况下得到的交易值要高。然而,如果以这种方式与所有的Agent谈判,他将最终达不成任何交易。因此,出于平衡的原因,此Agent将会以一种顽固的方式与Ac子集中的Agent谈判,特别地,会与他们中的一个百分比进行谈判,而对剩余的Agent,谈判策略将保持不变。

类似地,相信集合An中存在一个特别的Agent(Agent t),为了确信其能与集合中的一些Agent达成交易中的一致,会采取更加调和的策略。特别地,对集合An中的Agent,固定百分比的值将会使他们的行为更具有调和性,而其余的Agent策略不变。

此外,在谈判线程中,每个谈判线程都集成了代表重要购买商的Agent的偏好,包括有关每个谈判主题的可接受值的范围、谈判的最后期限和目前的保留值(Agent认为能接受的报价的最低效用值)。协调者为每个谈判线程决定谈判策略,每个谈判回合后,线程会将他们的状态汇报给协调者,如果线程与一个特别的销售商达成了一笔交易,他会终止此谈判,将此新的保留值通知给其余的谈判线程,并可能通过此方式改变他们中某些谈判策略。

但是,在他们的研究中,没有将协调者和协调线程嵌入本质上不同的双边谈判模型(如基于限制—满意度、博弈论或其余任何有效的方法),也没有进一步提炼将谈判对手分为让步者或非让步者的分类方式,以使其能在一个正在进行的谈判基础上起作用(而不是一个一次性的决策),因此,还存在许多问题。

3.基于Agent的辩论谈判

从以上分析来看,虽然基于Agent的博弈谈判和基于Agent的启发谈判能够产生复杂系统,并能广泛应用,但存在许多问题,其应用也有很大的局限性[27]。此外,除了上述已经说明的局限性外,还存在更多的局限性,具体归纳如下:

首先,在许多基于Agent的博弈谈判和基于Agent的启发谈判的模型中,Agent交换提议(如潜在的一致或潜在的交易)。例如,可以是在英式拍卖中对购买特定价格的货物的承诺,也可以是分配给一个具有多重属性的多维拍卖值,还可以是一个在交易遭遇[28]中的可替代报价。Agent不允许交换其在提议中表达的信息以外的额外信息,这将成为问题所在。例如,在Agent对环境信息有限的情况下,或他们的个体理性选择依赖于其余Agent的情况下。

其次,这两种模型的另一个局限是Agent的效用或偏好通常都被假定为在谈判之前就有完全的特征,因此,Agent被认为具有能评估和比较任何两个提议的机制。这也许会变得容易。例如,当谈判对象的效用按照其货币值(如手机的收费率)被定义时,Agent能通过简单比较两个手机服务提供商所提供的每分钟的收费来比较两者的服务。然而,在许多复杂的谈判情况下(如工会谈判中),Agent可能会拥有不完全的信息,这些信息会限制其能力,因此,Agent可能:

①缺乏在两个潜在结果间作出比较的相关信息;

②资源有限,限制其得到这些信息;

③拥有信息,但缺乏做出比较的处理时间;

④对环境的信念不一致或不确定;

⑤具有未成型或未决定的偏好(如新产品);

⑥偏好不一致。

为克服这些局限,得到信息、解决不确定性、修改偏好等经常会出现在谈判中。有关Agent谈判的传统模型的更进一步研究却表明Agent有关提议的偏好通常被认为是适当的。从这个意义上来说,他们反映了Agent从满足其偏好中得到的真实信念。例如,某个Agent想要购买一辆小汽车,他可能会根据自己的信念将较高的值分配给一个特殊的商标,这个商标的小汽车比其他商标的小汽车要安全。如果此信念是错误的,偏好就不能适当反映其真实利益。

最后,基于Agent的博弈谈判和基于Agent的启发谈判假设Agent的效用或偏好是固定的,它不能直接影响其余Agent的偏好模型,或任何能产生其余Agent偏好模型的心理态度(如信念、愿望、目标等),理性的Agent只会根据其所得到的新信息修改其偏好,传统的基于Agent的谈判机制不能完成这些信息交换。

鉴于以上背景,逐渐出现了基于Agent的辩论谈判,主要致力于克服上述缺陷,基于Agent的辩论谈判允许Agent在谈判过程中交换额外信息或对其信念及其他的心理态度做出“辩论”。在谈判环境中,如果将谈判视为一种信息,它将允许Agent:

①为其谈判姿态找出合适的理由;

②影响其余Agent的谈判姿态[29]

因此,除了接受或拒绝一个提议外,Agent能提出一个相关评论,这能协助做出更有效的谈判。通过理解为什么对手不能接受一个特殊的交易,Agent能有一个较好的状态来提出一个有更高被接受机会的可替代的报价。例如,在工会争论问题中,代表工人联盟的Agent可能会拒绝作为组织管理的Agent所提出的修改的养老金计划[30],而作为回答,作为管理的Agent可能会提出一个不同的养老金计划,如果工会Agent能解释他们的初始提议不是为了养老金而是希望减少工作时间的话,代表管理者的Agent将会不再为探索不同的养老金计划而烦恼,相反,他们会关注寻找一个减少工作负荷的安排。

另一种能被交换的信息是有关此提议的理由,表明为什么Agent能做出此决定或为什么对手能接受此提议,这将有可能改变其余Agent可接受的范围[31]或者改变谈判空间的属性。例如,雇员Agent就工资上调与管理者Agent谈判,他们可能会提出一个较大的上涨幅度,但这将被管理者Agent拒绝,在雇员Agent就他们本年度工作所取得的巨大成绩做出表述并以此作为提议的正当理由时,管理者Agent可能会接受。通过给谈判对象介绍新的属性(或维度),Agent也能交换导致谈判对象改变结果的信息。例如,管理者Agent可能会改变谈判对象,使谈判不仅包括工资上调,还包括工作时间的改变。通过这种方式,管理者Agent可能会提出减少工作时间,而不是增加工资。为了给对手施加压力,Agent还有可能做出威胁或奖励,以得到一个可接受的提议。例如,管理者Agent为了使一个项目在较短的规定期限内完成,将会许诺增加工资(或威胁解雇员工),以诱使他们分配更多的时间在这个特殊项目上。

许多学者认为,辩论是一种语内表现行为(在特定语境中一讲出话即完成的言语表达行为,如答应、允许等),包括提出某报价的理由(或信息)或在是否接受此报价的基础上对某行为过程的承诺。事实上,基于辩论的谈判还可以作如下细分:

①基于理由的辩论谈判(Justification-based ABN)。这些理由或者是对为什么某报价被拒绝的详细阐述,或者是对为使一个报价被接受而需要做出的变化的详细阐述[32]。此外,这样的理由能揭示有关Agent的普遍利益的附加问题。

②基于劝说的辩论谈判(Persuasion-based ABN)。在对接受者的回答(如此Agent是否接受或拒绝)的条件下对行为所做出的承诺决定了能在谈判中使用的劝说策略。这样的承诺为Agent提供了一个可通过劝说式的辩论来影响对手的方法,如威胁(如果某报价被拒绝将会被实行)、奖励(如果某报价被接受将会被实行)以及申诉等。

基于理由的辩论谈判由于其对所有参加谈判的Agent都要求同样的推理机制,因此相当严格。同时,每个Agent需要相信所有的谈判对手所提供的东西都是完全正确的[33]。相比之下,基于劝说的辩论谈判在对行为做出承诺的基础上提供了一个更加稳定且较不严格的框架,这使他们更有吸引力

在现有的许多基于劝说的辩论谈判机制中,辩论(如威胁或奖励)的定义一般较为抽象,不能随意应用于现实中。特别地,奖励或威胁一般被定义来增加或减少对手的效用。在这种情况下,这些行为被认为是可靠的奖励或威胁的代表。然而,Agent需要搜索其余的空间以寻找最合适的(威胁或奖励)来发送。

鉴于以上分析,我们认为基于劝说的辩论谈判具有以下优点:

①用于行为中的辩论能很容易地被看作是对应用于未来的谈判遭遇的限制,通过这种方式,辩论能减少在未来谈判遭遇中为达成一致所需做的搜索的行为空间(因此减少了有关行为集合的不确定性),并且能影响其余Agent,使他们可以接受目前谈判遭遇中的报价(因此减少了为寻找与Agent相匹配的偏好所需花费的时间)。

②通过辩论限制未来的谈判遭遇,Agent能确信他们在目前或未来的谈判遭遇中得到了一个正面的效用,无论他们何时拥有能随时间变化而进行预测的资源或者容量,这能通过将限制应用于未来的谈判遭遇而得到,因为这些遭遇能确保一定的适合Agent动态限制的输出结果。

从以上分析来看,与基于Agent的博弈谈判和基于Agent的启发谈判相比,基于Agent的辩论谈判具有较大的优点,而其中的基于Agent的劝说型辩论谈判(以下简称为基于Agent的辩论谈判)则显得尤为重要,因此,本书将主要针对这方面进行更为深入细致的研究。

研究表明,基于Agent的辩论谈判作为多Agent社会中Agent谈判的一种重要方式出现并发展得很快[34]。最早,在经典的辩论框架中,有关基于Agent的辩论谈判开始强调不同种类的辩论,如威胁、奖励、申辩等。这些辩论被认为是具有预先状况(Pre-conditions)和过去状况(Post-conditions)的演说行为(Speech Act) [S.Kraus et al.(1998),S.Ramchurn et al.(2003)]。许多有关基于辩论的谈判的文献主要是研究相关的协议[35]、逻辑[36]、反驳和削弱辩论[37]。他们认为辩论是逻辑语句,如果辩论不被信任,只是简单地被拒绝(或接受,直到提供反面证据)。同时,他们认为Agent彼此之间完全信任,但这并不存在于许多非合作谈判中[38]。此外,这些描述普遍倾向于对对话的形式化研究[39]以及协议的交互。他们并没有讨论有力的辩论谈判形式,如威胁和申辩(如利己或一般性的行为)等,也没有建立相关模型来决定发送哪一种辩论给具有一定内在信念知识的接受者,更没有谈到Agent t如何评价他通过接受一个辩论中的特别暗示所能获得的经济效用。

综合以上现状,同时根据前面对Agent t种类和基于Agent的谈判阶段的划分来看,基于Agent的辩论谈判过程中的第二、三阶段(即有关合作伙伴选择的辩论谈判和有关具体谈判内容的辩论谈判)是本书的重点研究内容,并在建立相关协议的基础上,通过一个相关系统的原型开发对这两个方面的研究进行验证。此外,关于Agent社会性在基于Agent的辩论谈判方面的研究,本书也对有关的社会制度进行了分析,在给出相关定义和分类的基础上对其产生模型进行了描述,并提出了在谈判过程中所使用到的策略和模型。因此,下面先对这几个方面的研究现状作一个综述。

1.3.2 基于Agent的辩论谈判协议

在基于Agent的辩论谈判的研究中,已经有一定的文献对相关的协议进行了分析和研究。一般认为,协议主要规定了辩论谈判过程的每个状态,即在每个状态中,哪个Agent被允许发表辩论,该提出什么样的提议或辩论等。例如,在某个Agent作出提议后,其余的Agent必须能够接受、拒绝或批评它,但不能忽视它。因此,协议有可能仅仅建立在语素的确定上,也有可能建立在一些Agent之间的以往比较复杂的通信历史的基础上。

较有代表性的是M.Esteva et al.(2001)认为相关的协议主要包括如下几个部分:

①允许规则:规定了Agent在什么样的情况下及什么时候能参与辩论谈判;

②退出规则:规定了Agent在什么样的情况下及什么时候能退出辩论谈判;

③结束规则:规定了辩论谈判在什么样的情况下结束;

④提议有效规则:规定了提议需要符合什么样的情况才能被认为有效;

⑤决策规则:规定了谈判结果在基于什么样的辩论理论的基础上能被采用,例如,如果Agent不能对某个请求作出辩论的话,就必须接受它。

C.Sierra et al.(1998)认为,协议的实现需要使用有限的状态机制。研究表明,如果辩论谈判中涉及的语素不多,这种思路可能具有一定的效果,但如果辩论谈判需要使用大量的语素,这些研究的局限性就容易表露出来,当不同的Agent开发者使用这种协议来开发其所需的Agent时,由于对协议中涉及的相关标准等的理解可能产生很多问题,因而可能对开发造成很大障碍

此后,Mc Burney等提出了一种协议[40],主要对相关语素的标准作出了如下规定:以willing_to_sell(P1,T,P2,V)表示代表销售方的Agent愿意提供相关的销售服务,其中,P1表示发起辩论谈判的Agent(可以是购买方,也可以是销售方),T表示参与辩论谈判的其余的Agent,P2表示代表销售方的Agent,V表示销售目标的集合;以seek_info(P3,S,p)表示P3所代表的Agent开始搜索相关的销售服务,其中,P1∈S,并且V需要满足p所表达的限制,然后在此基础上进一步提出了有关的辩论谈判过程中的对话协议,具有一定的研究价值。他们的研究大量地使用了博弈论的方法,因此,可以说并不是真正意义上基于Agent的辩论谈判的协议,而更多地是体现了基于博弈论的谈判思路。

F.Sadri et al.(2001,2002)通过使用if-then规则,在一定的逻辑限制的基础上建立了相关的协议,制定了一定的标准,并且作为Agent程序的一部分被嵌入进了相关的系统开中。这些规则的主要形式有P(t)∧C(t)⇒P′(t+1),表示如果Agent在时间t收到谈判提议P′,并以状态C来描述这个Agent在此时的心理状态变化。由于其中没有对如何使用辩论进行更加明确或详细的规定,因而对相关的系统开发可能也具有一定的局限性。

S.Ramchurn et al.(2003)制定了一种规则,他们的研究思路与M.Esteva et al.(2001)研究的第五条(即决策规则)类似,即如果Agent不能就某个请求发出辩论的话,就必须接受这个请求,他们认为,同样的情况也会发生在Agent就其信仰作出辩论的时候,即如果某个Agent不能对某个提议作出相关的辩论,他就必须接受这个提议。

从以上分析来看,在基于Agent的辩论谈判协议的研究中,已经有一定的文献对其进行了探索和分析,但其中的语素及相关的推理规则对如何体现辩论的思想还不能提供更为详尽的表述和解决方法,因此需要进一步展开研究。

1.3.3 基于Agent的辩论谈判策略及模型(www.xing528.com)

在基于Agent的辩论谈判策略及模型的研究中,M.Dung (1995)研究了人类辩论谈判的机制及其Agent实现,提出了一种基于Agent的抽象辩论谈判框架。L.Amgoud和N.Maudet(2002)对基于Agent的辩论谈判中的策略和模型选择进行了探索,提出了一种三层框架;H.Prakken(2000)则认为基于Agent的辩论谈判策略及模型中特定对话的结果是不确定的,也就是说,如果一个参与辩论谈判的Agent没有足够智能的策略和模型,将会输掉本来可以赢的辩论谈判。

C.Emele et al.(2006)对以上文献进行了分析和总结,在此基础上,提出了一个基于Agent的辩论谈判策略和模型的学习框架,允许Agent对其他Agent的辩论谈判策略进行学习,调整自己的辩论谈判策略,并建立针对其他Agent的辩论谈判策略和模型,然后在此基础上对其进行分类。该框架分为三个阶段:①交互中Agent的行为特征和组织角色是明显的、可观察的,其私有机制(Private Policy)是可能通过学习获得的;②随着时间的推移,通过建立辩论谈判策略和模型,可以预测其中哪些策略和模型可以更好说服对方;③在建立基于Agent的辩论谈判策略和模型的基础上,对Agent进行概括和分类,为以后的辩论谈判提供经验。

H.Prakken et al.(2002)提出了一种基于Agent的辩论谈判策略和模型的框架,包括4个层次:①逻辑层(Logic Layer):描述基本概念和基本事实,通常含有非单调逻辑;②辩证层(Dialectic Layer):辩论的特定概念(Specific Concepts),如一个辩论击败另一个辩论的能力等;③程序层(Procedural Layer):控制辩论谈判策略发生的方式;④启发式方法层(Heuristic Layer):包含决定哪一种辩论谈判策略和模型的裁定(Adjudicating)技术,但该文献所提出的框架主要应用于法律中的辩论谈判领域。随后,C.Chesnevar etal.(2000),H.Prakken et al.(2002)对以上文献进行了后续研究,研究主要集中在第1层和第2层;而D.Walton(2002), P.Mc Burney et al.(2000)的研究则主要集中于第3层。

L.Amgoud和N.Maudet(2002)在基于Agent的辩论谈判策略和模型的研究中,提出了建立(Build)和破坏(Destroy)这两种类型的策略和模型,并在此基础上建立了一个具有Moore所说的启发式特征的基于Agent的辩论谈判策略的计算系统。系统对辩论谈判的框架要求很少,但需要确定对所有辩论谈判策略的偏好顺序和有关谨慎程度的等级。此外,Agent根据谨慎程度的级别并依据建立的策略产生一个符合要求的辩论谈判策略,但如果没有符合条件的辩论谈判策略,则转向破坏策略,并在尽可能的条件下攻击对方的辩论。

L.Amgoud和H.Prade(2004)认为,Agent在基于Agent的辩论谈判中拥有两种辩论谈判策略:一是自由的辩论谈判策略和模型(Unrestricted Arguments),二是受限的辩论谈判策略和模型(Restricted Arguments),受限的辩论谈判策略和模型用来防御(Defend)自由的辩论谈判策略和模型。该文献扩展了Dung的辩论谈判策略和模型的框架,使Agent在辩论谈判过程中尽量少暴露自身信息,并提供了一种最少暴露信息的推理过程。但由于Dung所提出的辩论谈判策略和模型的框架过于抽象,使这种辩论谈判策略和模型的框架难于应用于一些具体环境。此外,文章所提出的该启发式框架应用的对话设置(Dialogical Setting)还显得不够完善,因为在基于Agent的辩论谈判中,受限的辩论谈判策略和模型只能用来防御自由的辩论谈判策略和模型,所以,这种启发式方法在信息受限情况下的效果还有待检验。

C.Cayrol et al.(2002)在对以上文献进行分析对比的基础上,提出了另外一种基于Agent的辩论谈判策略和模型,即尽可能少地暴露自身信息给其他对手,并在建立了形式化的概念后,提出了一个启发式的辩论谈判策略和模型的框架,最后对如何应用启发式方法及如何将其应用于更加复杂的环境进行了描述。

从以上研究中可以看出,基于Agent的辩论谈判策略和模型的研究还存在一定的问题,例如,对辩论谈判策略和模型的计算量非常之大,效率难以保证,也没有提出有效的评价模型。究其原因,主要在于这些研究都试图给出一种一般性的策略和模型,并没有针对基于Agent的辩论谈判过程中的每个具体阶段进行研究。为克服以上困难,同时使研究更具有说服力,本书主要研究基于Agent的辩论谈判中的合作伙伴选择阶段和合作伙伴选择后的具体交互阶段的策略及模型,相应综述如下:

1.基于Agent的辩论谈判中的合作伙伴选择策略及模型

威胁、奖励、申辩作为基于Agent的辩论谈判中的合作伙伴选择策略及模型中的三种重要方式最早出现在N.Oren et al.(2006)和J.Daniel(1990)的研究中,主要将这三种辩论谈判的方式细分为六种:①对被威胁方来说,既有可能被采纳也有可能不被采纳的威胁;②用一个有关未来的奖励的承诺来引诱谈判对手;③有关过去奖励的申辩;④有关谈判对手的反面例证的申辩,在此申辩中,谈判对手的说法和其以往的行为相矛盾,从而说服谈判对手;⑤有关谈判对手的普遍行为的申辩,申辩中所提议的行为将会使谈判对手相信这样的行为能够进一步完成其目标,因为这样的行为在过去已经进一步完成此目标;⑥有关谈判对手自我利益的申辩,它能使谈判对手相信,采取这样的行为能完成一个更高的目标。

S.Kraus et al.(1998)则将以上分类进一步应用于基于Agent的辩论谈判中,通过将能代表Agent心理状态的信念、愿望、意图和目标的四个主要参数与几种细分方式的结合,提出了有关威胁、奖励和申辩的逻辑模型,并在此基础上提出了威胁的评价模型。此外,模型中还包括心理状态多次交换后的情况和相应的时间,具有一定的合理性。但模型也存在一定的局限性,首先,模型没有考虑到谈判双方的知识、经验等,即对谈判对手重要性的评价;其次,模型中的参数只是局限于心理状态和时间,而没有对谈判内容(如威胁本身)进行评价;最后,由于研究了多个时间段的心理状态变化,模型中的参数太多,过于复杂,难以理解,因此,模型有待进一步简化和改进。

此后,有一些文献对威胁或奖励进行了单独研究,其中,有一定代表性的如D.Pruitt(1981)和A.Agogino(2004),从Agent学习的角度提出了一种奖励的评价方法,并作了一定的模拟分析,研究认为这种方法在更加困难的动态领域内较为有效。此外,奖励还可以被修改,以满足计算和信息的需要,而这些结果都能适应复杂的多Agent系统,以提高Agent之间的合作效率。但是,他们研究的只是有关奖励在实现Agent中的一种计算方法,还不够全面。

A.Agogino(2005)则着重研究了面向状态领域中Agent间辩论谈判的消极威胁部分。文中认为,消极威胁的形式为:“如果你不同意我给你提出的交易,我将会退出,让你达到你满意的目标,在你达到满意目标后我将会满足自己的目标,同时保持你的目标满意。如果你也选择退出,我将会通过一种对你来说更糟的方式来满足自己的目标。”并在此基础上将其应用于Agent谈判中的对称合作和非对称遭遇中,以研究在这样的情况下这种威胁形式可能导致的Agent之间的合作,然后做了举例阐述,研究重点仅在于消极威胁在面向状态领域中的作用,因此,所建立的模型还不够全面,是否适用于其余的威胁形式或者奖励、申辩等形式还需要进一步深入研究。

D.Ramchum(2005),I.Rahwan et al.(2004),B.Weinberger (2004)将基于Agent的辩论谈判和信任的研究联系在了一起,并主要对信任进行了建模和分析,研究还涉及了奖励,但对奖励的产生和评价都是从数学的角度进行计算,而没有考虑到建立合适的模型。

赵书良(2006)将威胁和信任联系在一起,提出了“可信威胁”的概念,认为在无外部强力介入情况下得到的联盟中,成员向联盟提出的合作报酬存在一个下界,当联盟所给合作报酬低于该下界时,该成员对联盟解体的威胁是可信的,简称为可信威胁,反之,为不可信威胁。然后给出了度量算法,并以一个三方冲突协商谈判算例进行验证。研究涉及的Agent的商务谈判方面较少,并且较少涉及奖励和申辩。

最近,田厚平、郭亚军(2004)对奖励作了单独的研究,主要研究在未来的谈判遭遇中,Agent如何给出和要求相关的奖励以及通过建立相应的奖励产生机制和奖励策略选择机制来实现,并通过计算机模拟说明了机制的有效性。在他们的研究中,效用函数建立在多方囚徒博弈(Mulit-Move Prisonser's Dilemma)理论的基础上,因此,虽然研究了多轮重复谈判和谈判对象选择中的奖励策略,其理论基础还是博弈论,并不是真正意义上的辩论谈判。此外,文献还认为,威胁和申辩的策略会给研究带来一定的问题,例如,申辩策略的使用通常需要假定所有Agent都使用同样的推理机制,这是因为该研究认为,申辩将直接影响到其他Agent的信仰和目标,因此意味着这样的申辩需要具备一般性的表示方法,使信仰和目标容易被其他Agent所理解,而威胁的策略则相反,这使谈判遭遇中威胁和申辩的策略和模型很难得到评价。因此,他们的研究虽然对奖励的策略和模型及评价作出了很大贡献,但仅仅局限于奖励,而无法扩展到威胁和申辩,所以,其研究很难说具有一般性,缺乏说服力。

此外,有学者从另一个角度对这三种形式进行了研究,例如,I. Rahwan(2003),D.Ramchurn et al.(2007),K.Sycara(1990)研究了这些辩论方式是如何产生的;L.Amgoud &N.Maudet (2002),S.Kraus et al.(1998),D.Ramchurn et al.(2003)研究了如何选择这些辩论方式;S.Parsons et al.(1998),C.Sierra et al.(1998)研究了如何评价这些辩论方式。然而,这些研究中的模型同样都较为偏向于数学计算,除了缺少一定的逻辑性之外,还显得过于复杂,难以理解,也没有将这三种方式的产生、评价和选择综合起来进行考虑,其可行性有待进一步论证。

从以上一些相关的研究来看,有关威胁、奖励和申辩的产生、评价和选择都偏重于数学计算,这样只能将Agent在谈判中的功能仅仅局限于简单的谈判提议和反提议的交换中,很难体现出其在人工智能方面的优势。为解决这个问题,需要考虑进一步建立有关这三者的形式化模型,并建立相关的系统,对模型进行模拟计算和分析,以验证系统的有效性。

目前,有关这方面的研究中有一定代表性的是Amgoud等所做的研究。她们建立了有关威胁、奖励和申辩的形式化模型,模型主要将Agent对周围的信息进行简单分层,然后采取给定权重后对权重取最大值或最小值的方法进行评价。模型除了具有之前研究的不足之外,还存在其他的有待改进的地方。一方面,这样的简单分层并没有真正达到量化的目的,因此,对评价作用不大;另一方面,他们没有建立相关的评价模型,并对其进行模拟或实证分析,因此,模型不仅较难实现研究目标,其有效性还有待于进一步验证。此外,他们的研究还只是局限于对威胁、奖励和申辩这三种方式的研究,没有涉及事实上还存在的许多其余的辩论方式,如反驳、削弱等。

在国内,也有一些文献对此进行了论述和研究。其中, L.Amgoud &H.Prade(2005)论述了辩论Agent的结构组成,即信息库、目标集合及有关其他Agent的目标集合三部分组成,三部分均由命题组成,每一命题具有自己的权重。在此基础上,文章用逻辑方法定义了威胁、奖励(文章中称为报答)和解释性辩论等辩论形式,并对其力度、论证冲突及评估作出了简要的论述。毛文燕(2007)主要改进了Rahwan等人提出的一种基于辩论谈判的Agent概念模型,并对对手模型、自身模型和环境模型进行了定义,对三者的相互组合关系作了进一步的描述,并简单举了一个例子,较少涉及威胁、奖励、申辩。

综合以上国内外有关威胁、奖励和申辩的研究现状来看,虽然这方面的研究很早就有学者提出,但到目前为止,最为深入的也只是进行了较为简单的分类和定义,对这三者及其辩论力度强弱进行评价的较为有效的形式化建模和对模型的有效性验证进行深入研究的文献还较少。此外,还存在许多其他的基于Agent的辩论谈判方式(如反驳等),有关这方面的研究则更是少之又少。

从以上分析来看,这方面的研究虽然已经开展,并且进行到了一定的程度,但至少还存在以下两个不足之处:①较为系统和全面地对Agent在合作伙伴选择阶段的主要的辩论形式进行形式化建模和阐述的研究不够;②较为系统和全面地对这些主要的辩论形式进行评价和模拟分析的研究也不够。而这些研究对Agent间辩论谈判的顺利完成(即在保证谈判各方利益最大化的基础上实现合作)都具有较大意义,因此,有关这些方面的研究都是值得并且急需的。

2.基于Agent的辩论谈判中的具体交互过程策略及模型

到目前为止,有关这方面的研究已经积累到了一定的程度,其中,有代表性的主要有以下几个。

Faratin等提出了一种基于Agent间谈判的形式化模型,定义了具体谈判内容,即谈判所涉及的问题(如价格、质量等),并且将这个阶段的谈判策略定义为函数集合的形式,通过考虑一个简单的标准来决定如何计算每个问题的值,这个标准主要包括时间、资源、报价和反报价等,他们定义的谈判策略是针对谈判所涉及的某一个问题来说,有一个已经设置了权重的反提议,这个反提议由能产生相关值的策略通过线性的方式组合而成,并随着不同的谈判阶段(即不同的时间点)而不同,其中的策略集合是有限的。这些定义为多策略的产生提供了一个比较强而有力的形式化基础,并能实时地修改谈判策略[41]

Amgoud等在将具体谈判内容形式化地表示为某个论据后,通过比较两个论据之间的优先顺序对谈判内容进行选择。关于如何比较两个论据之间的优先顺序,他们采取的方法是首先给出定义,认为当且仅当存在着两个论据,其中一个论据的支持元素是另一个论据所对应支持元素的反面时,称这两个论据是互相削弱的,然后在此基础上给出论据的比较原则,主要根据一个预先在命题中设置的偏好顺序来进行比较和判断。

Zeng和Sycara提出了另一个有关这方面的谈判模型,称为Bazaar模型,主要是基于贝叶斯信念网络的。他们认为,每个参与谈判的Agent都能在收到谈判对手有关价格等谈判条款的预设信息(如预先设定的价格)后,通过贝叶斯信念网络对自己的信念库进行更新。例如,如果低于某个供应商Agent预设的销售价格,它将不会同意任何交易。因此,Agent将不断地对最新更新的预设价格作出判断,以决定是否接受报价[42]

从以上研究来看,有关这方面的研究都只是简单地通过Agent之间的提议和反提议的形式就谈判条款进行讨价还价,甚至只是比较而没有涉及辩论,因此,很难体现Agent作为人工智能的一面。S.Fatima et al.(2005),J.Katzav et al.(2004)则就人类的辩论机制和分类进行了一定的研究,具有一定的可取之处,但他们的研究有些不适合这方面的谈判,他们也没有考虑到将其应用于基于Agent的自动谈判中。

J.Katzav &C.Reed(2004)就Agent谈判中的实时交互过程进行了建模,较少涉及谈判中的辩论部分。Leen-kiat(2005)初步对基于Agent的自动谈判中有关谈判条款的辩论进行了简单的形式化建模和分析,但他们没有对事实上在辩论过程中还存在的反辩论进行研究,即没有实现谈判中的辩论的交互;他们也没有提供一种较为有效的思路来对辩论和反辩论所导致的谈判条款如何修改进行有效的分析。

与基于Agent的辩论谈判中的合作伙伴选择策略及模型相比,基于Agent的辩论谈判中的具体交互过程策略及模型显得较为薄弱,也没有一种较为有效的方法来体现辩论的思想和解决这方面的问题,因此,也需要进一步展开研究。

1.3.4 基于Agent的辩论谈判的社会性研究

根据前面有关Agent的分类和其所具有的社会性来看,由于社会属性的不同,可能对其所参与的辩论谈判产生一定程度的影响,如使辩论谈判的时间延长或缩短、参与辩论谈判的Agent的种类或数目受到限制等,从而使整个辩论谈判的结果有所偏差。因此,对这方面进行研究也是有必要的。

在基于Agent的辩论谈判的研究中,主要是就Agent如何产生有效的辩论来进行建模和分析的,因而对Agent所具有的社会属性等的研究不是很多。其中,Leen-kiat(2004)提出了一个较为一般的框架,以使Agent能在相关的计算环境中对相关的机制做出规定。C.Reed &D.Walton(2005)则在此基础上使用这些机制解释了Agent做出这些行为后所涉及的一些对话。S.Kraus et al.(1998)主要对辩论的产生进行了一定的计算,而且研究中还使用了威胁、奖励、申辩等一些策略及模型。但他们的研究主要在于就两个Agent之间的影响进行一定的公式计算,而没有考虑多Agent社会中由于Agent所具有的社会属性而产生的社会制度等方面的影响,因此,他们对多Agent社会中的Agent如何在社会制度等方面的影响下进行推理和计算涉及的也较少。

C.Sierra et al.(1998)在S.Kraus et al.(1998)研究的基础上,将基于Agent的辩论谈判在社会环境的影响下的研究工作做了一定程度的拓展,但他们的研究主要是考虑基于授权的社会关系下的Agent的辩论谈判,这只能用来解释一些特定的社会环境下的特殊的辩论谈判。事实上,处于多Agent社会中的Agent的行为或多或少地都会与其所处的社会环境相关,而社会环境由于制度、其所处的角色和关系的不同而不同,因此,他们的研究是否具有一定的普遍性还值得进一步商榷。

K.Atkinson et al.(2004)通过提出以信念、愿望和义务作为基本思维属性来描述Agent的思维状态和社会属性,并考虑了奖励、惩罚、承诺和承诺解除问题,在此基础上建立了社会Agent的BDO模型。

马光伟等(2001)提出了一个基于角色和关系的多Agent社会结构的抽象模型,并分析了几种常见关系。这些研究虽然对Agent作为社会成员的一些属性和规范等进行了建模和分析,但都还没有将其与谈判(尤其是使用辩论的谈判方式)结合。

综合来看,以上研究都还没有将处于一定社会结构中的Agent作为社会成员与辩论的谈判方式进行结合。何汉明、李永强(2005),N. Karunatillake et al.(2005)初步进行了这方面的探索,在定义了相关的角色和关系及社会承诺的基础上给出了Agent作为社会成员如何进行辩论的谈判的模型。但一方面,他们没有考虑作为社会成员的Agent在一定的社会结构中还受到一定的社会制度约束或激励的问题,相应地也没有对这种社会制度的产生等方面进行分析和研究;另一方面,他们也没有对相关的辩论做出评价,即如何解决辩论谈判中的冲突问题,尤其是对相关的社会制度产生之后,如何结合社会角色和社会关系这几个重要的方面来对相关的辩论谈判策略及模型进行选择和评价的研究还不够完善,因此,这方面的研究需要进一步深入。

[1] Rosenschein,J.and Zlotkin,G.,Rules of encounter:designing conventions for automated negotiation among computers,Cambridge,MA:MIT Press.1994,pp. 145-286;Sandholm,T.,Mediator:a next generation electronic commerce server, Computational Intelligence,Special issue on Agent Technology for Electronic Commerce, Vol.18,Iss.4,2002,pp.656-676.

[2] Faratin,P.,Automated service negotiation between autonomous computational agents,Ph D Thesis,Dapartment of Electronic Engineering,Queen Mary and Westfield College,University of London.2000,pp.46-88;Kraus,S.,Strategic negotiation in multi-agent environments,Cambridge,MA:MIT Press,2001,pp.265-287.

[3] Osborne,M.J.and A.Rubinstein,A course in game theory,The MIT Press, 1994,pp.345-396.

[4] N.R.Jennings,P.Faratin,A.R.Lomuscio,S.Parsons,C.Sierra,and M. Wooldridge,Automated negotiation:prospects,methods and challenges,Group Decision and Negotiation,Vol.10,Iss.2,2001,pp.199-215.

[5] Rosenschein,J.and Zlotkin,G.,Rules of encounter:designing conventions for automated negotiation among computers,Cambridge,MA:MIT Press.1994,pp. 145-286.

[6] T.W.Sandholm,Distributed rational decision making,In Multiagent Systems (ed.G.Weiss)MIT Press,1999,pp.201-258.

[7] Rosenschein,J.and Zlotkin,G.,Rules of encounter:designing conventions for automated negotiation among computers,Cambridge,MA:MIT Press.1994,pp. 145-286;von Stengel,B.,Computing equilibria for two-person games,In Aumann,R. and Hart,S.(eds.),Handbook of Game Theory,Amsterdam:Elsevier,Vol.3,2002, pp.1723-1759.

[8] Coleman,J.S.,Foundations of social theory,Cambridge,MA:Harvard University Press,1990,pp.564-596.

[9] Varian,H.R.,Mechanism design for computerized agents,In Proceedings of the USENIX Workshop on Electronic Commerce,New York,1995,pp.265-284;Conitzer V.and Sandholm T.,Complexity of mechanism design,In Darwiche,A.and Friedman,N.(eds.),Proceedings of the 18th conference on University in Artificial Intelligence(UAI-2002),2002,pp.103-110.

[10] Sarvapali Dyanand Ramchurn,Multi-Agent Negotiation using trust and persuasion,Ph D Thesis,Faculty of Engineering and Applied Science,School of Electronics and Computer Science,University of Southampton,Southampton,England, 2005,pp.5-9.

[11] M.Klein,P.Faratin,H.Sayama,and Y.Bar-Yam,Protocols for negotiating complex contracts,IEEE Intelligent Systems,Vol.18,Iss.6,2003,pp.32-38;P. Faratin,C.Sierra,and N.R.Jennings,Using similarity criteria to make trade-offs in automated negotiations,Artificial Intelligence,Vol.142,Iss.2,2002,pp.205-237.

[12] Shaheen S.Fatima and Michael Wooldridge and Nicholas R.Jennings,A comparative study of game theoretic and evolutionary models of bargaining for software agents,Kluwer Academic Publishers,Printed in the Netherlands,2004, pp.1-18.

[13] S.Russell and P.Norvig,Artificial intelligence:a modern approach,Prentice Hall,1995,pp.10-78.

[14] D.Zeng and K.Sycara,How can an agent learn to negotiate,In J.Müller,M. Wooldridge and N.R.Jennings,Intelligent Agents III,Springer Verlag,1997, pp.233-244.

[15] H.A.Simon,Models of bounded rationality,MIT Press,1982,pp.2-68.

[16] A.Rubinstein,A bargaining model with incomplete information about time preferences,Econometrica,Vol.53,1985,pp.1151-1172.

[17] N.R.Jennings,P.Faratin,A.R.Lomuscio,S.Parsons,C.Sierra,and M. Wooldridge,Automated negotiation:prospects,methods and challenges,Group Decision and Negotiation,Vol.10,Iss.2,2001,pp.199-215.

[18] A.Muthoo,Bargaining theory with applications,Cambridge University Press,1999,pp.96-125.

[19] Faratin P.,Sierra C.and Jennings N.R.,Negotiation decision functions for autonomous agents,International Journal of Robotics and Autonomous Systems,Vol.24, Iss.3-4,1998,pp.159-182.

[20] P.Faratin,C.Sierra,and N.R.Jennings,Using similarity criteria to make trade-offs in automated negotiations,Artificial Intelligence,Vol.142,Iss.2,2002,pp. 205-237.

[21] Kowalczyk R and Bui V,On constraint-based reasoning in e-negotiation agents, In Dighum F.and Cortes U.(eds.),Agent-Mediated Electronic CommerceⅢ(Lecture Notes in Computer Science),Vol.2003,Berlin:Springer-verlag,2001,pp.31-46.

[22] Yokoo M.,The distributed constraint satisfaction problem:formalization and algorithms,IEEE Transaction on Knowledge and Data Engineering,Vol.10,Iss.5, 1998,pp.673-685.

[23] Rahwan I.,Kowalczyk R.and Pham H.H.,Intelligent agents for automated one-to-many e-commerce negotiation,In Oudshoorn M.(ed.),Proceedings of the 25th Australian Conference on Computer Science,Australian Computer Society Press,2002, pp.197-204.

[24] Kowalczyk R.,On negotiation as a distributed fuzzy constraint satisfaction problem,In Proceedings of the 3rd International Symposium on Soft Computing for Industry,World Automation Congress,2000,pp.631-637.

[25] N.R.Jennings,P.Faratin,A.R.Lomuscio,S.Parsons,C.Sierra,and M. Wooldridge,Automated negotiation:prospects,methods and challenges,Group Decision and Negotiation,Vol.10,Iss.2,2001,pp.199-215.

[26] P.Faratin,Automated service negotiation between autonomous computational agents,Ph D Thesis,Queen Mary College,London,England,2001,pp.235-286.

[27] Iyad Rahwan,Sarvapali D.Ramchurn,Nicholas R.Jennings,Peter Mcburney, Simon Imon Parsons and Liz Sonenberg,Argumentation-based negotiation,The Knowledge Engineering Review,Cambridge University Press,Vol.18,Iss.4,2004,pp. 343-375.

[28] Larson K.and Sandholm T.,An alternating offers bargaining model for computationally limited agents,In Castelfranchi C.and Johnson L.(eds.),Proceedings of the 1st International Joint Conference on Autonomous Agents and Multi-Agent Systems (AAMAS-2002),2002,pp.135-142.

[29] Jennings N.R.,Parsons S.,Noriega P.and Sierra C.,On argumentation-based negotiation,In Proceedings of the International Workshop on Multi-Agent Systems,Boston,1998,pp.1-7.

[30] Sycara K.,Arguments of persuasion in labour mediation,In Proceedings of the 9th International Joint Conference on Artificial Intelligence,1985,pp.294-296;Sycara K.,The PERSUADER,In Shapiro,D.(ed.),The encyclopedia of artificial intelligence,New York,John Wiley and Sons,1992,pp.349-386.

[31] Jennings N.R.,Parsons S.,Noriega P.and Sierra C.,On argumentation-based negotiation,In Proceedings of the International Workshop on Multi-Agent Systems,Boston,1998,pp.1-7.

[32] R.Fisher and W.Ury,Getting to yes:negotiating agreement without giving, In Penguin Books,New York,USA,1983,pp.456-489;I.Rahwan,L.Sonenberg, and F.Dignum,Towards interest-based negotiation,In J.S.Rosenschein,T. Sandholm,M.Wooldridge,and M.Yokoo,editors,Proceedings of the 2nd International Joint Conference on Autonomous Agents and Multiagent Systems(AAMAS 2003),Melbourne,Australia,2003,pp.773-780.

[33] L.Amgoud and N.Maudet,Strategical considerations for argumentative agents (preliminary report),In S.Benferhat and E.Giunchiglia,editors,9th International Workshop on Non-Monotonic Reasoning(NMR 2002):Special session on Argument, Dialogue and Decision,2002,pp.399-407;S.Parsons,C.Sierra,and N.Jennings, Agents that reason and negotiate by arguing,Journal of Logic and Computation,Vol.8, Iss.3,1998,pp.261-292;F.Sadri,F.Toni,and P.Torroni,Abductive logic programming architecture for negotiating agents,In Proceedings of the 8th European Conference on Logics in Artificial Intelligence(JELIA 2002),Lecture Notes in Computer Science,Springer,Vol.2424,2002,pp.419-431.

[34] L.Amgoud and N.Maudet,Strategical considerations for argumentative agents (preliminary report),In S.Benferhat and E.Giunchiglia,editors,9th International Workshop on Non-Monotonic Reasoning(NMR 2002):Special session on Argument, Dialogue and Decision,2002,pp.399-407.

[35] P.Mc Burney S.,Parsons R.,Van Eijk and L.Amgoud,A dialogue-game protocol for agent purchase negotiations,Journal of Autonomous Agents and Multi-Agent Systems,Special Issue on Argumentation in Inter-Agent Communication,2002, pp.235-273.

[36] F.Sadri,F.Toni,and P.Torroni,Abductive logic programming architecture for negotiating agents,In Proceedings of the 8th European Conference on Logics in Artificial Intelligence(JELIA 2002),Lecture Notes in Computer Science,Springer,Vol. 2424,2002,pp.419-431.

[37] S.Parsons,C.Sierra,and N.Jennings,Agents that reason and negotiate by arguing,Journal of Logic and Computation,Vol.8,Iss.3,1998,pp.261-292;L. Amgoud,N.Maudet,and S.Parsons,Modelling dialogues using argumentation.In Edmund Durfee,editor,Proceedings of the Fourth International Conference on Multi-Agent Systems(ICMAS 1998),IEEE,2000,pp.31-38.

[38] N.R.Jennings,P.Faratin,A.R.Lomuscio,S.Parsons,C.Sierra,and M. Wooldridge,Automated negotiation:prospects,methods and challenges,Group Decision and Negotiation,Vol.10,Iss.2,2001,pp.199-215;Jordi Sabater and Carles Sierra, Regret:a reputation model for gregarious agents,In Proc.of the 1st Int,Joint Conference on Autonomous Agents and Multi-Agent Systems,2002,pp.475-482.

[39] L.Amgoud,S.Parsons,and N.Maudet,Arguments,dialogue,and negotiation,In W.Horn,editor,Proceedings of ECAI2000,IOS Press,2000,pp.338-342.

[40] P.Mc Burney S.,Parsons R.,Van Eijk and L.Amgoud,A dialogue-game protocol for agent purchase negotiations,Journal of Autonomous Agents and Multi-Agent Systems,Special Issue on Argumentation in Inter-Agent Communication,2002,pp.235-273.

[41] Faratin P.,Sierra C.and Jennings N.R.,Negotiation decision functions for autonomous agents,International Journal of Robotics and Autonomous Systems,Vol.24, Iss.3-4,1998,pp.159-182.

[42] L.Amgoud and S.Parsons,Agent dialogues with conflicting preferences,in Proceedings of the Workshop on Agent Theories,Architectures and Languages (ATAL'01),Seattle,WA,USA,2001,pp.190-205.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈