用户生成性学习资源在聚合方式上分为两个维度:微观知识聚合维度和宏观知识聚合维度,具体如图6-3所示。微观知识聚合是基于分类法、主题法和用户标注的微观知识聚合方式,通过逐级映射从而对资源条目和知识内容进行局部的深度知识聚合。“分类法—主题词—用户标签”的映射是实现微观知识聚合的主要途径。在大多数用户生成性学习资源的生成平台中,可以实现主题词与分类空间的映射,然后对资源主题与用户兴趣标签进行相似性计算。在此聚合过程中,用户兴趣标签实际是作为分类法和主题法的一种有力补充,从而为用户实现较为个性化的微观知识聚合方式。

图6-3 用户生成性学习资源的知识聚合方式
宏观知识聚合通过知识链接、KOS链接和资源链接三层结构来对知识单元进行聚合。最底层的资源链接是指通过元数据对资源进行描述和标注,如基于IEEE-LOM对资源进行基本描述,这样可以形成方便于共享和互操作的数字化学习资源。特别是语义网络等技术的出现,可以通过URI(Uniform Resource Identifier)和元数据等对信息资源进行规范化描述和控制,从而实现各类资源之间的有效链接。KOS链接是指对各类分类表和主题词表进行链接、融合和集成,并使之形成一个有机整体。生成的数字化学习资源往往会包含多种维度和多种粒度的知识单元,这些资源可以采用文本、图像、音频或者视频方式进行展现。知识单元之间的语义关联最终构成一个复杂的网状结构,因此需要对这些知识单元的属性和关联关系进行深度的挖掘。与此同时,知识单元之间的链接主要体现为资源条目层面的相互关联,可以使用用户标签统计、本体语义关联、共现计算等方法不断提高知识单元之间的语义内聚性[29]。
在知识的具体聚合方式上,主要有以下几种策略:
(一)基于微内容搜索引擎的知识聚合
搜索引擎技术从海量的互联网信息中搜集到与用户需求相关的信息,并通过一定的方式进行组织和处理后呈现给用户。为了适应用户生成内容迅速发展的现状,一些专门面向微内容的搜索引擎已经面世了。它们主要针对博客(Blog)、社会性网络服务(SNS)、维基(Wiki)等互动生成的微资源进行搜索,聚合与用户需求相关的微资源,使之由一种低可用状态变成了一种高可用状态,由无序状态发展成有序状态。比如,Google开发了博客搜索工具Blogsearch。该工具除了可以搜索博客内容外,还可以搜索他人对博客的评论信息,搜索结果可以以RSS订阅形式输出。在此之后,百度、搜狐等也相继推出了针对博客或微博等微内容生成平台的搜索引擎。随着标签技术和语义维基技术的不断开发和普及,可以预见,这些技术将使检索工具变得更加智能化和准确化,能更好地聚合微内容,实现知识的聚合和重组。
(二)基于RSS技术的知识聚合
RSS技术为内容的提供者提供了一个实时、高效、安全而且低成本的内容发布方式,为内容的接收者提供了一种全新的阅读和学习体验。在对RSS技术的特性进行分析的基础上,以对维基百科的知识聚合为例,本书提出用RSS技术实现维基百科知识聚合的基本框架(如图6-4所示)。该框架主要由三个部分组成:

图6-4 利用RSS技术实现维基百科知识聚合的基本框架(https://www.xing528.com)
1.词条库
词条是维基百科知识组织的基本单位,维基百科实质是一个海量化的词条数据库,词条库按学科或主题进行分类。词条在创建的同时也包含了对词条进行描述的RSS文件。因此词条库除了包含词条数据外,还应包含与每一词条对应的RSS文件。
2.内容聚合器
内容聚合器用于收集所有词条的RSS文件,并按不同的学科或主题进行分类,建立索引,同时兼具根据词条元数据来搜索词条资源的功能。但是从学习资源的角度而言,词条的RSS文件并不一定符合学习资源的元数据描述标准。因此,需要将RSS与IEEE-LOM等学习资源元数据标准进行绑定。因为RSS模块是以RDF规范的,需要将IEEE-LOM以RDF形式绑定。Stephen Downes提出了一个RSS-LOM模型,该模型提出通过IEEE-LOM与RSS相关模块的绑定来允许使用RSS对维基百科词条进行标准化描述。
3.内容阅读器
内容阅读器可以将所需的词条资源以列表的形式呈现给用户。用户只需要点击列表中某一条目,就可以直接定位到维基百科的相关词条了解和查看该词条的具体内容,同时还可以对词条进行诸如离线阅读和本地保存等一系列操作。
参与者将维基百科所有词条的元数据制作成相应RSS文件,并提交至内容聚合器。用户自发地通过词条元数据搜索引擎来搜索其所需要的词条内容。词条元数据搜索引擎将符合条件的词条以标题、作者、URL、描述的组合形式呈现在内容阅读器中。用户只需要浏览列表,选择其感兴趣的词条,然后点击链接,就可以在阅读器中直接查看该词条的所有内容[30]。
(三)基于自组织模式的知识聚合
自组织,顾名思义,即自我自主地组织化,可将其理解为一个系统不依靠任何外来干预而获得的一种空间、时间或功能的结构。按照关系的不同,可以将用户生成性学习资源过程中的自组织分为信息自组织、关系自组织和关联自组织。信息自组织是指网络中的信息由于用户与用户之间、用户与网络其他元素之间的交互性、相关性、协同性或默契性而形成特定结构和功能的过程;关系自组织是指用户之间利用信息交互来实现关系的自组织;关联自组织是指用户与资源内容之间关系的自组织。结合用户生成性学习资源内容本身的特征,自组织模式就是指用户会自发地进行内容的聚合,使之达到一个有序化的层面。随着越来越多的用户加入到资源生成活动中,众多用户通过发布、分享、转载、评论、回复、收藏、注释、推荐、标注、搜索、点击等信息行为产生大量有用的资源。用户行为为不同资源之间构建了链入和链出关系,比如博客中可以通过转载内容、添加链接或标签、加入博客圈子以及对博客内容进行分类归档等来实现内容的聚合等,这些都属于用户生成内容自组织的行为和表现。这种聚合模式在实际的操作过程中,其意义往往会超出对内容本身进行重组,同时具备了对某些现象规律给出新的解释、促进资源不断进化等作用[31]。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
