1.大众分类技术
大众分类技术主要采用的是大众分类法。大众分类法(Folksonomy)除了译为“大众分类法”外,还可译为“自由分类法”、“分众分类法”、“通俗分类法”、“民众分类法”和“社群分类法”等。Tomas V W在讨论Flickr和Delicious所发展的信息架构时,首次将Folks和Taxonomy进行组合,创造出新词汇Folksonomy,并将它称为“自底向上的社会分类法”,认为它是“社会创造的典型平面化命名空间”。可见,如果从词源上进行解释,Folksonomy是由Folks和Taxonomy组合而成,Folks表示一群人或一伙人的意思,Taxonomy则是指分类法,由此,Folksonomy可以理解为群众自发性定义的非等级结构的标签分类体系。
Sturtz D N认为,大众分类法是一个分布式的分类法,一般是由使用者个体或群体,将网络信息资源加上对应的分类标签,让其自由地伴随社会情境所产生的一种分类结构[16]。维基百科将Folksonomy定义为一种由使用者以任意关键词进行分类的协同工作。吴开华认为Folksonomy就是由网络信息用户自发为某类信息定义一组标签,并最终根据标签被使用的频次选用高频标签作为该类信息分类名称的一种网络信息分类方法[17]。
总而言之,“大众分类法”是一种由用户决定的分类方式,用户可以根据自己的理解,为博客文章、上传的图片、收藏的网页、订阅的RSS内容源等添加一个或多个标签,从而自行对其内容进行分类和组织。较为具体的体现就是标签云(Tag Cloud)。标签云用颜色深浅、字体大小直观地显示每个标签的使用频率。标签的主要功能包括以下几个方面[18]:
标签使用户更加方便地对资源进行整理、分类和查找。用户可以对各种类型的内容进行储存、分类、管理和分享等。
标签采用多维度分类方式。标签作为Web 2.0的标准组件之一,其设计的初衷是为了满足多维度分类的需要。
标签可以对资源内容进行描述。这种描述除了针对资源内容外,同时还可以对圈子进行界定,从而辨识出同一维度的用户是否属于同一圈子,以及是否具有相同或相似的属性等。
标签可以独立于内容存在。对标签的搜索相对于内容搜索独立出来,形成多维度的搜索,而不仅仅限于对内容的搜索。
大众分类法应用于用户生成性学习资源的知识组织中有如下优势[19]:
实现资源的共享性。标签体现出的含义从某种程度上表现出用户对某一资源内容认识的深度。当用户发现与自己关注相同资源内容、具有相同兴趣或意见的其他用户时,使用特定的社会性标签可以找到相关内容,然后通过内容找到与内容相关的人,从而有利于不同用户之间进行思想交流,并通过查看标签所属信息进而了解该信息的最近更新情况,再者也便于个人创建的资源内容为他人所发现,进而达到知识共享的目的。
实现资源的大众化和易用性。大众分类法的类目往往来源于日常自然语言而不是采用预先设定好的分类规则和词汇表,这种分类方式的特点之一是能迅速适应大众词汇的动态变化,不断吸纳和采用新的词汇分类,并可实时反映用户个体的观点,从而实现分类的大众化和个性化,体现出资源的易用性和动态更新。
2.语义维基技术
语义维基是指使用语义网络技术如RDF(Resource Description Framework)、WOL(Web Ontology Language)、主题图和概念图对现有的维基系统进行扩展,使现有的维基系统得以改进。语义维基技术的核心是使用代理或服务自动分析和处理维基系统页面间的链接关系。语义维基技术的特征主要体现在如下几个方面[20]:
可以对链接进行标注。即通过对链接赋予一定的语义从而对链接进行标注。用户所创建的链接不光只是简单地用于导航,其本身都会附带有一定的语义,根据其语义可以进行解释性标注。
上下文敏感的表达方式。许多语义维基系统可以根据语义标注来改变内容的表达方式。例如,可以将语义相关的两个或两个以上页面同时显示在一个独立的链接框中,从而显示来源于底层知识库的信息,甚至可以根据上下文语境使得同一个页面的内容以不同的方式显示。
增强的导航功能。对链接进行语义标注可以提供更多的信息以方便导航。普通的维基系统只能按链接的方向进行导航,而语义维基系统则同时可以提供链接关系之外的额外信息,这些信息可以为创建更为智能化的导航方式提供帮助。
3.RSS聚合技术
丰富站点摘要(Rich Site Summary,RSS)是一种用于Web内容共享的XML格式标准,同时也可以将其视为一种互联网上被广泛采用的内容包装与投递协议。在该技术的帮助下,网络用户只需要在客户端安装支持RSS的内容聚合软件,便可以在无须打开网站内容页面的情况下直接阅读支持RSS输出的网站内容。
RSS聚合技术的工作原理如下:首先内容提供者在其网站上发布相应的RSS文件,由相应的入口程序获取该RSS文件并把它提供给用户,用户使用相应的阅读工具来阅读该内容。网页按照RSS的形式为其内容提供一个通过URL获得的提要。RSS提要文件一般会包含大量离散的新闻项,每一个RSS文件包含一个频道(Channel)。一个频道必须至少具备以下元素:标题(Title),对频道的简单介绍(Description),链接对应的目标网页(Link),频道语言(Language)。每个频道由若干个项(Item)组成,每个项包含了一个URL、一个标题和一个摘要。RSS技术主要包含两个重要组成要素:RSS提要(Feed)和RSS阅读器[21]。以某个博客的入口为例,其基本语法如下:
<channel>(www.xing528.com)
<title><!--channel的标题--></title>
<description><!--简要描述--></description>
<link><!--channel的URL--></link>
<!--可选/可扩展元素-->
</channel>
<item>
<title><!--项标题--></title>
<link><!--项URL--></link>
<description><!--简要描述--></description>
<!--可选的/可扩展的元素-->
</item>
RSS阅读器,顾名思义,用于对RSS文件进行读取并将内容展现出来。一般只需将RSS文件的URL输入进去就可以实现对内容的订阅。使用这种阅读器阅读内容的感觉有点类似于阅读电子邮件,其突出特点是可以对内容项进行缓冲处理从而方便用户进行离线阅读。另外还有一些在线RSS阅读器能直接将RSS提要和某个独立的网站捆绑在一起,这样更易于对软件参数进行设置并且可以从任何客户端存取提要内容[22],图6-1展示的是较为常用的新浪点点通阅读器的界面。该界面分为三个部分,依次如下:
频道:处于频道列表区,一个XML地址对应于某一个频道。可以通过添加相应的URL从而在阅读器上生成相应的频道。频道也可以被看作一个具体的栏目或某一类特定主题内容的集合。
标题区:处于阅读器主体右侧上方。标题区会根据用户自行设置的排序方式列出频道内所有内容的阅读状态、标题、发布时间及创作者等。
图6-1 RSS阅读器示例
内容区:处于阅读器主体右侧下方。内容区与一般IE浏览器的样式较为相似,由工具栏、地址栏、信息提要及详细内容的显示窗三部分构成。
目前该技术已经在博客型资源订阅等方面产生了广泛应用。在具体技术流程上,首先由内容采集系统从各生成内容发布平台采集各种由用户自主生成的资源,然后将其转化为RSS文档,接着将其归入事先规划好的分类体系之中,也就是对其进行归类,最后建立索引,从而实现内容的聚合和重组。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。