在识别获取和语义描述情境的基础上,我们提出一种基于情境感知的信息资源推荐算法。首先,算法集成基于资源内容的用户偏好情境匹配和Bayesian学习方法的物理情境匹配,计算对目标资源的评分;同时,算法应用Jena规则引擎执行规则推理,根据当前网络情境将推荐的资源以适当的显示模式和数据格式标准推送给目标用户,形成混合的多维推荐算法。基于情境感知的信息资源推荐算法流程如图7-2所示。
(1)基于Bayesian学习方法的物理情境匹配
该算法步骤利用Bayesian学习方法,计算目标信息资源与用户当前所处物理情境之间的匹配度,实现推荐系统对物理情境的智能感知。物理情境既可以是单一类型情境,也可以是多种类型情境的组合。这里,单一情境仅指一种特定类型的物理情境,例如日期、具体时间或者地理位置等;多种情境则是所有单一情境的组合,例如{晚上8点,周末,家里}是多种单一情境的组合值,它表示用户当前时间是周末晚上8点,并且正在家里。
基于Bayesian学习方法,我们可以计算目标信息资源与用户当前物理情境的匹配相似度。显然,它表示用户在当前物理情境下访问信息资源的概率。
图7-2 基于情境感知的信息资源推荐算法流程
基于Bayesian学习方法的物理情境匹配计算模型为:设当前物理情境为C(单一类型情境或多种类型情境的组合),目标信息资源为Dj(1≤j≤N),则在物理情境C给定条件下,用户选择访问信息资源Dj的概率为:
其中,N为资源集D中的资源数量,P(C|Dj)为先验条件概率,表示用户过去在访问资源Dj条件下物理情境C所出现的概率,该值可以通过对用户访问资源的历史记录进行计算;P(Dj)表示用户过去访问资源Dj的概率,其值也可由目标用户的历史访问记录计算。由于Bayesian学习方法具有自适应学习能力,随着目标用户使用和访问信息资源的历史时间增长,Bayesian学习方法对物理情境感知能力将越来越强。在给定的物理情境下,能够较精准地计算目标资源与当前物理情境之间的匹配度,并将匹配度较高的目标资源推荐给目标用户。
(2)基于资源内容的用户偏好情境匹配
该算法步骤采用基于资源内容的方法计算信息资源与用户偏好情境的相似度,实现目标资源与偏好情境的语义匹配。基于内容的推荐采用标识用户偏好的特征词来提取资源内容的特征,以此预测目标用户对该资源的喜好程度,该推荐方法仅将与用户偏好相似度最高的前若干个信息资源推荐给目标用户。
如前所述,用户偏好情境包含该用户使用资源的口味及偏好信息,偏好情境可以通过分析用户浏览行为获取,并且可以使用信息检索中的关键词分析技术构建用户的偏好情境模型[18]。我们使用经典的向量空间模型(Vector-Space Model,VSM)对用户偏好情境进行建模。在基于本体的模型构建基础上,将用户当前偏好情境P进行本体建模,构建为当前偏好情境语义向量,即P={p1,p2,…,pk},其中权重值pk∈[0,1]表示特征概念ck表达当前偏好情境的重要程度。权值pk越高,表明该用户对概念ck越感兴趣;反之,用户对概念ck越不感兴趣。基于领域本体,用户偏好情境在语义上可以准确地表示,减少或消除由传统特征词所带来的语义“模糊性”问题。
考虑到用户偏好具有一定时间连续性,其随时间t的推移不断变化,而当前偏好情境只是局部反映了用户当前短时间内的偏好。因此,为实现情境感知的信息推荐服务,需要考虑到用户随时间推移不断累计的历史偏好情境,并通过当前偏好情境与历史偏好情境的更新合成形成综合用户偏好情境,以便更精准地反映用户的行为偏好。在推荐模型中,我们通过设置n个时间窗口来构建综合偏好情境,每个时间窗口Wini(0≤i≤n-1)的时间间隔相等,它表示距离当前时间间隔为i个时间窗口的一段时间。因此,将当前时间窗口中的当前偏好与过去时间窗口中的历史偏好进行集成,可以更为精准地反映用户真实的偏好情境。值得注意的是,随着时间的推移,每个时间窗口中的历史偏好情境将随着时间的推移而自动递减。这是因为:距离当前时间间隔越近的偏好情境,对综合情境影响越大,反之则越小。设Pi(0≤i≤n-1)表示时间窗口Wini中的偏好情境,当i=0时为当前偏好情境,当i≥1时为历史偏好情境,目标用户的综合偏好情境P则可以通过公式(7-5)进行计算。(www.xing528.com)
类似地,我们对资源文档Dj(1≤j≤N)采用相同的特征概念进行语义标记,并构建信息资源的语义空间向量。TF-IDF(Term Frequency/Inverse Document Frequency)方法是确定特征词权重最著名的计算方法,其中特征词权重值与特征词在该文档中出现的频率正相关,而与文档集中包含该特征词的文档数量呈负相关。在信息推荐模型中,资源文档的内容可以构建成由TF-IDF方法计算出的特征概念权重所组成的语义空间向量。一般地,信息资源Dj(1≤j≤N)可以构建为资源语义向量Dj={d1,d2,…,dk},其中权重值dk∈[0,1]是特征概念ck表达信息资源的重要程度。在信息资源Dj的语义向量空间模型中,特征概念ck被分配为相应的权重值dij(1≤i≤k,1≤j≤N),基于TF-IDF方法进行如下的计算[19]:
其中,freqij是特征概念ci在文档资源Dj中出现的频率次数;max i freqij是在文档资源Dj中出现频率最高的特征概念的频率;m表示系统中文档资源的数量;ni为文档集D中出现特征概念ci的文档资源数量。根据公式(7-6),可以计算出文档集D中每个文档资源的权值。因此,在资源文档向量空间中,资源文档Dj的语义向量可进一步表示为Dj={d1j,d2j,…,dij,…,dkj}。当用户的综合偏好情境语义向量和资源语义向量产生后,我们使用余弦向量度量法[20]计算目标资源Dj与目标用户综合偏好情境P之间的语义匹配,计算公式表示为:
(3)基于情境感知的混合多维信息推荐算法
如同前面所述,物理情境匹配方法是用来计算目标资源与当前物理情境的匹配度;而用户偏好情境匹配方法是用来计算目标资源与目标用户综合偏好情境之间的匹配度。在基于情境感知的信息推荐系统中,我们集成这两类情境的匹配方法,从而产生对目标资源的推荐评分,其计算公式为:
其中,λ∈[0,1]为情境因子,表达用户偏好情境或物理情境在多维推荐服务模型中重要性。当λ=1时,推荐算法仅考虑用户的偏好情境,实现对用户偏好情境的智能感知;当λ=0时,推荐算法仅考虑物理情境,实现基于Bayesian学习的物理情境感知。根据公式(7-8),算法对所有的候选信息资源进行评分,并将排名Top-N的资源推荐给目标用户。
当产生推荐的信息资源之后,系统采取基于规则的情境推理方法来决定推荐资源的合适显示模式,以适应泛在环境下复杂、易变的网络情境。首先,系统使用Jena技术在推荐过程开始前预先定义一组网络情境推理规则,每个基于Jena语法的规则本质上是“if-then”形式的语句。当推荐过程开始后,混合推荐算法应用Jena通用规则引擎执行情境规则推理,并且从情境知识库中通过查询本体语义化的网络情境对规则进行解析。具体来说,根据当前的网络情境,算法利用预定义的Jena规则推理出当前网络情境下所推荐资源的显示模式(文本、图像或视频等)。因此,在基于本体的语义网络情境基础上,Jena规则推理引擎负责对规则进行解释和执行,将推荐的目标资源以当前网络情境所支持的显示模式及其相应的数据格式标准主动推送给目标用户,从而形成提供两维推荐输出(包括资源评分和显示模式)的混合多维推荐算法。基于规则的网络情境推理实例如图7-3所示,这些规则根据不同的网络情境能推理出当前的网络状况,并决定将推荐资源以相应的显示模式推送给目标用户。
图7-3 基于规则的网络情境推理
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。