首页 理论教育 大数据信息的形态与表现

大数据信息的形态与表现

时间:2023-06-28 理论教育 版权反馈
【摘要】:另外,这种信息还可对结构数据库信息进行排序和查询。总而言之,大数据的结构就体现了它最突出的特征。

大数据信息的形态与表现

从IT角度来看,信息结构类型大致经历了3个阶段。必须注意的是,旧的阶段仍在不断发展,如关系数据库的使用。因此3种数据结构类型一直存在,只是其中一种结构类型往往主导其他结构。

1.1.6.1 结构化信息

这种信息可以在关系数据库中找到,多年来一直主导着IT应用,是关键任务OLTP系统业务所依赖的信息。另外,这种信息还可对结构数据库信息进行排序和查询。

1.1.6.2 半结构化信息

包括电子邮件、文字处理文件及大量保存和发布在网络上的信息。半结构化信息是以内容为基础的,可以用于搜索,这也是Google(谷歌)等搜索引擎存在的理由。(www.xing528.com)

1.1.6.3 非结构化信息

该信息在本质形式上可认为主要是位映射数据。数据必须处于一种可感知的形式中(如可在音频、视频和多媒体文件中被听或看到)。许多大数据都是非结构化的,其庞大的规模和复杂性需要高级分析工具来创建或利用一种更易于人们感知和交互的结构。

总而言之,大数据的结构就体现了它最突出的特征。结构化数据,一般包括预定义的数据类型、格式和结构的数据,可进行事务性数据和联机分析处理。半结构化数据具有可识别的模式并可以解析的文本数据文件,如自描述和具有定义模式的XML数据文件。非结构化数据是那些数据结构不固定,按不同类型文档保存的数据信息,如TXT文本文档、PDF文档、图像和视频等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈