首页 理论教育 探究大数据的本质:信息技术支持的信息群

探究大数据的本质:信息技术支持的信息群

时间:2023-06-10 理论教育 版权反馈
【摘要】:[1]美国著名物理化学家吉布斯在数学物理中创立了向量分析找到了一个全新的角度研究事件的不确定性和偶然性,用熵表示物理系统信息的量度。美国信息管理专家霍顿认为,信息是经过加工处理的数据,可以满足用户决策的需要。性质可分为表示事物属性的定性数据和反映事物数量特征的定量数据。数据本身并没有意义,数据只有对实体行为产生影响时才成为信息。大数据可以被看作是依靠信息技术支持的信息群。

探究大数据的本质:信息技术支持的信息群

人类认识史中可以发现,对信息的认识史就是人类的认识进步史与实践发展史。人类历史上经历过四次大的信息革命。第一次是创造语言,语言是即时变换和传递信息的工具,人类通过语言建立相互关系认识世界。语言表明人类要求表达、认识世界并开始作用于世界,通过语言产生思维。将事物的信息抽象表达为声音这个即时载体,但语言的限制和缺点是无法突破个体和时空。第二次是创造文字以及随之而来的造纸与印刷的技术,实现了人类远距离和跨时空的思想传递,人类因此扩大联合,文字虽然突破了时间、空间上的限制,但需要耗费太高的交流成本和传播成本。第三次是发明电信通信电报、广播、电视实现了文字、声音和图像信息的远距离即时传递。为电子计算机互联网创造奠定了基础。第四次是电子计算机与互联网的创造,是一次空前的伟大综合,其特点是所有信息全部归结为数据,表达形式为数字形式,只要有了0和1加上逻辑关系就可以构成全部世界。现代通信技术和电子计算机的有效结合,使信息的传递速度和处理速度得到了巨大的提高,人类掌握信息利用信息的能力达到了空前的高度,人类社会进入了信息社会。在一定意义上,人类文明史是一部信息技术的发展进化史。

(一)信息

哈特莱在《信息传输》一文中指出,信息是指有新内容、新知识的消息。信息的奠基人香农认为信息是消除随机不确定性、是肯定性的确认和确定性的增加,并提出信息量的概念和信息熵的计算方法,从而奠定了信息论的基础。美国数学家诺伯特·维纳在《控制论——动物和机器中的通信与控制问题》中指出,信息是指适应控制外部世界的过程中同外部世界交换的内容,信息就是信息,既非物质,也非能量。

1956年英国学者阿希贝提出信息是集合的变异度,认为信息的本性在于事物本身具有变异度。1975年意大利学者 G.Longo在《信息论:心得趋势与未决问题》中指出,信息是反映事物构成、关系和差别的东西,包含在事物的差异之中而不在事物的本身。[1]美国著名物理化学家吉布斯在数学物理中创立了向量分析找到了一个全新的角度研究事件的不确定性和偶然性,用熵表示物理系统信息的量度。美国信息管理专家霍顿认为,信息是经过加工处理的数据,可以满足用户决策的需要。

本体论层次信息可定义为事物的存在方式和运动状态表现形式,事物泛指存生于人类社会、思维活动和自然界中一切可能的对象,存在方式指事物的内部结构和外部联系。运动状态指事物在时空变化的特征和规律。从认识论层次看信息是主体所感知或表述的事物存在的方式和运动状态。主体所感知的是外部世界向主体输入的信息,主体所表述的则是主体向外部世界输出的信息。

(二)数据(www.xing528.com)

数据是指能够客观反映事实的数字和资料,可定义为用意义的实体表达事物的存在形式,是表达知识的字符集合。性质可分为表示事物属性的定性数据和反映事物数量特征的定量数据。按表现形式可分为数字数据和模拟数据,模拟数据又可以分为符号数据、文字数据、图形数据和图像数据等。

数据在计算机领域是指可以输入电子计算机的一切字母、数字、符号,具有一定的意义能够被程序处理,是信息系统的组成要素。数据可以记录或传输,并通过外围设备在物理介质上被计算机接受,经过处理而得到结果。计算机系统的每个操作都要处理数据,通过转换、检索、归并、计算、制表和模拟等操作,经过解释并赋予一定的意义之后便成为信息,可以得到人们需要的结果。分析数据中包含的主要特征,就是对数据进行分类、采集、录入、储存、统计检验、统计分析等一系列活动,接收并且解读数据才能获取信息。

(三)数据与信息

数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。但进入信息时代后,“数据”二字的内涵开始扩大:不仅指“有根据的数字”,还统指一切保存在电脑中的信息,包括文本、图片、视频等。其中的原因是,20世纪60年代软件科学取得了巨大的进步、发明了数据库,此后,数字、文本、图片都不加区分地保存在电脑的数据库中,数据也逐渐成为“数字、文本、图片、视频”等的统称,也即“信息”的代名词。

简单地说,信息是经过加工的数据,或者说,信息是数据处理的结果。信息与数据是不可分离的,数据是信息的表现形式,信息是数据的内涵。数据本身并没有意义,数据只有对实体行为产生影响时才成为信息。信息可以离开信息系统而独立存在,也可以离开信息系统的各个组成和阶段而独立存在;而数据的格式往往与计算机系统有关,并随载荷它的物理设备的形式而改变。大数据可以被看作是依靠信息技术支持的信息群。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈