首页 理论教育 海量数字信息资源的存储技术:理论与实践

海量数字信息资源的存储技术:理论与实践

时间:2023-07-30 理论教育 版权反馈
【摘要】:海量数字信息资源的存储就是指人们要发展更强大的存储技术来存储越来越多的信息,总之就是扩大信息储存的载体。[2](一)海量数字信息资源存储技术及其特点1.直接连接存储传统的数据共享存储方案是以文件服务器为中心,通过加大网络文件服务器存储容量,解决整个网络的存储问题。

海量数字信息资源的存储技术:理论与实践

在当今社会生活中,人们在工作学习或娱乐中产生了一些信息,并且这些信息是人们需要或想要记录下来的,长期以来,这些数字信息就会越来越多。海量数字信息资源的存储就是指人们要发展更强大的存储技术来存储越来越多的信息,总之就是扩大信息储存的载体[2]

(一)海量数字信息资源存储技术及其特点

1.直接连接存储

传统的数据共享存储方案是以文件服务器为中心,通过加大网络文件服务器存储容量,解决整个网络的存储问题。这时的服务器在进行网络通信管理的同时,更主要的是一个大容量的文件服务器。直接连接存储(Direct Attached Storage,DAS)同样是以文件服务器为中心,通过SCSI接口、磁盘阵列等在文件服务器周围连接一些可共享的设备,网络用户通过文件服务器间接地迂回访问数据及网络资源。

DAS没有独立的存储操作系统,不能提供跨平台的文件共享功能,数据存储模式是分散的,各系统下的文件需要分别存储;没有自身的管理软件数据管理需要第三方软件支持;数据只能异地备份,且安全性较弱。这种模式的好处是前期投入低,但后续成本大,总拥有成本(TCO)高。

另外,这种以服务器为中心的存储模式,工作站通过局域网接口和网络连接,然后取得一个或多个普通文件服务器上的共享文件。这种存储模式不仅给网络服务器带来额外负担,而且导致网络性能的降低和用户等待延迟时间的明显增加。

2.网络连接存储

网络连接存储(Network Attached Storage,NAS)是一种独立地直接存储的联网方案,它转变“以服务器为中心”的存储方案为“以数据为中心”的智能网络服务器方案。它基于LAN,按照TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据信息传输。换言之,NAS使用的是平时大家一直在用的基于TCP/IP的局域网,并在上面进行数据传输。由于数据的传输可以在原有的局域网上进行,所以NAS的建设相对简单,对数据的管理也较为方便。

与DAS相比,NAS已经完全可以实现异构平台之间的数据级共享,支持Windows NT、UNIX、LINUX等操作系统,特别适合于文件传输协议(File Transfer Protocol,FTP)等文件共享服务的应用;集中式的数据存储模式,方便网络存储管理,降低了数据信息的管理成本;集成本地备份软件,实现服务器备份,全面保护数据,并且恢复及时、准确;前期投入较高,但后续投入较少,总拥有成本(TCO)较低。但是由于使用了与平时网络通信相同的网络,所以在网络带宽条件有限的情况下,它占用了宝贵的网络带宽资源,影响了网络的利用率,同时使得NAS无法发挥其应有的性能。

3.存储局域网

存储局域网(Storage Area Network,SAN)是在原来的局域网外,另外构建一个专门用于存储的网络结构,可以把这个存储网络可以看作一个高速的子网,这个子网中的设备可以从主网卸载流量。通常SAN由RAID阵列连接光纤通道(Fibre Channel)组成,SAN和服务器与客户机的数据通信通过SCSI命令而非TCP/IP协议,数据处理是“块级”(block level)。SAN结构以数据存储为中心,采用灵活的网络拓扑结构,通过具有高传输速率的光纤通道连接,以传统SCSI协议传输数据。

与前面两种存储方式相比,SAN有许多优点:第一,SAN可以自由扩展,用户可以灵活地在SAN结构上添加各种存储设备,整个系统扩展起来较为方便;第二,SAN结构采用光纤通道传输数据,传输速率较高;第三,SAN上数据传输是以“块”方式进行的,有利于数据的大规模传输;第四,存储设备都集中在一个网络上,节省了管理成本;第五,在SAN结构中,数据的备份、恢复、迁移都通过存储局域网本身来完成,不需要借助于服务器和现有的LAN/WAN,大大减少了现有服务器和网络的工作负载。

但是,由于SAN存储方式要构建一个专门用于数据存储的网络结构,使得建设费用大为增加,同时在SAN结构中存储的数据以“块”的形式存在,也就是每个应用在存储介质中都有一个专属于自己的区域,其他应用是难以访问这个区域的,这使得SAN互操作性较差,难以应用于大量存在的文件共享服务。另外,SAN的建设难度大,需要具有专业知识的人员管理。

4.小型计算机系统接口技术

由于网络存储SAN结构投资较大,一般信息用户很难承受。与此同时,NAS技术虽然成本低廉,但是在使用的时候需要消耗有限的网络带宽资源,无法完成大容量存储的应用,于是,人们又开发出了小型计算机系统接口(iSCSI)技术。这种技术是将现有iSCSI接口与以太网络(Ethernet)技术结合,使服务器可与使用IP网络的储存装置互相交换资料。此技术不但价格较目前使用的业界技术标准Fibre Channel低廉,而且系统管理人员也可以用相同的设备来管理所有的网络,无须其他设备。iSCSI作为IP Storage中最先得到应用的技术,它特别适合需要利用现有IP网络资源及IT技能拥有集中存储,但又不具备建设SAN结构的用户使用。

iSCSI技术具有以下优势:

(1)iSCSI的基础是传统的以太网和互联网,近年来,网络技术的迅猛发展使传统网络无处不在,iSCSI有很好的基础,同时能大大减少总体拥有成本。

(2)随着技术的进步,IP网络的带宽发展相当迅速,1Gbps以太网早已大量占据市场,10Gbps以太网也已研究出来,而且,该协议由包括IBM、Cisco、Intel、Brocade等业界的支持,一批新型厂商也竞相参与,如SAN Valley、CNT、3Ware等。

(3)在技术实施方面,iSCSI以稳健、有效的IP及以太网架构为骨干,使忍受性增加。

(4)iSCSI是基于IP协议的技术标准,实现了SCSI和TCP/IP协议的连接,对于以局域网为网络环境的用户,只需要不多的投资,就可以方便、快捷地对信息和数据进行交互式传输及管理。

(5)完全解决数据远程复制(Data Replication)及灾难恢复(Disaster Recover)的难题。

5.内容寻址存储

内容寻址存储(Content Addressed Storage,CAS)的提出是基于这样一种统计,即存储的数字化信息中,除需要不断更新的数据外,有更大的一部分内容是以固定的形式存在的最终信息,也就是说这些信息的内容是长期不变的,如电台、电视台已经播放的广播、影视,医学诊断中使用的MRI、X光、检查图像等,已经完成的文档、CAD/CAM设计文档等。

现有的网络存储技术,不管是NAS还是SAN都没有对这种以固定形式存在的内容进行优化。应用CAS技术存储的数据都含有一个全球唯一的标识符。用户访问该信息的时候,只需要在网络上发出带有这一标识符的信息,而不必去追踪该资源的物理位置,系统会自动根据这一标识符在网络上搜寻到用户寻找的资源所存的位置,然后再将结果反馈给用户。(www.xing528.com)

由于CAS存储对数据会分配一个标识符,存储的信息不能任意改动,所以CAS只适用于存储内容固定不变的应用中。

(二)海量数字信息资源存储技术的适用领域

从纯技术的角度来看,DAS是一种较简单的网络存储方案,技术实现简单,初期投资成本也较低,适用于较小规模的数据分布存储。NAS和SAN技术实现要求较复杂,追求存储管理的性能和数据传输速度,初期投资成本较大,适用于大规模数据存储和文件共享。NAS与SAN都是在DAS的基础上发展起来的新型数据存储模式,比常规的存储技术具有更大的可伸缩性和灵活性。NAS系统是建立在现有LAN和文件系统协议之上的,技术相对成熟,因此,在跨平台应用中的应用性和可靠性上“领先”SAN技术,应用更注重于实现异构环境下的文件共享。SAN是一个独立的数据存储网,可以向一个存储网络的任意空间上分配数据,应用更注重于实现数据资源的存储、合并、转移和服务器中的数据共享。DAS、NAS、SAN作为目前三种主要的网络存储技术方案,在技术上各有特点,因此在实际应用中要综合考虑选择。

一般而言,NAS适合于投资有限,但需要大量文件共享的环境中,如办公自动化系统、Ftp等文件服务器系统等。SAN适合于投资比较充裕,同时存在大量数据库信息的对数据吞吐、传输要求较高的应用,如企业的ERP系统、联机处理系统、数据仓库等大型系统中。iSCSI则适合于投资有限,又想得到类似SAN功能的环境中。CAS则在有大量固定内容的影视资料库、医学影像系统、档案系统中可以发挥较好的作用。不过CAS系统目前还处在推广阶段,真正的应用还不多。DAS适用于那些数据信息量较小,投资十分有限的个人、工作组、小企业应用。

1.电子

电子书代表人们阅读的数字化出版物,区别于以纸张为载体的传统出版物,利用计算机技术将一定的文字、图片、声音、影像等信息,通过数码方式记录在以光、电、磁为介质的设备中,借助于特定的设备来读取、复制、传输。

电子书是指将文字、图片、声音、影像等信息内容数字化的出版物以及植入或下载数字化文字、图片、声音、影像等信息内容的集存储介质和显示终端于一体的手持阅读器。

(1)电子书的构成。

1)电子书(E-book)的内容,它主要是以特殊的格式制作而成,可在有线或无线网络上传播的图书,一般由专门的网站组织而成。

2)电子书的阅读器,它包括桌面上的个人计算机,个人手持数字设备(PDA),专门的电子设备,如“翰林电子书”。

3)电子书的阅读软件,如ADOBE公司的Adobe Reader,Glassbook公司的Glassbook,微软的Microsoft Reader等。可以看出,无论是电子书的内容、阅读设备,还是电子书的阅读软件,甚至是网络出版都被冠以电子书的头衔。

(2)电子书的主要特点。

1)记录信息量大。占用很小的存储空间,并且可以存储成千上万的文字。

2)便于携带和存放。一方面需要用的文字信息可以下载到手机、计算机、mp3等工具上面,可以解决原来的图书厚重不便于携带的问题;另一方面,电子书克服了图书不便于保存的弊端,传统纸质图书会因为天气的潮湿或人为原因受到损坏,相对于这一点,电子书更方便于保存和收藏

3)便于传递和交流。人们可以通过蓝牙和各种文件传输服务来传递给别人。特点主要包括:第一,方便性,可搜寻内容,改变字体大小及字形。第二,容量大,随时可网络下载,不受地域限制。第三,降低图书成本,价格便宜。设计精美,灵活多样,有多媒体功能。节省保存书本所需空间。电子书实现了产品零库存,全球同步发行,购买方便快捷。节省纸张,减轻地球负担,实现零树木砍伐量,真正的环保低碳。

(3)电子书的原理。电子书是将书的内容制作成电子版后,放在网上出售。购买者用信用卡或电子银行付款后,即可下载并使用专用浏览器在计算机、其他可以添加阅读器应用的工具,如手机、电子纸上离线阅读。电子图书不同于现在网上的免费线上阅读,它是与纸质版同步推出的最新书籍,所以阅读它要支付一定的费用;与光盘图书不同,电子书是基于互联网购买使用。

(4)电子书的功能。可以订阅众多电子期刊、书和文档,从网上自动下载所订阅的最新新闻和期刊,显示整页文本和图形,通过搜索、注释和超链接等增强阅读体验,采用翻页系统,类似于纸制书的翻页,可随时把网上电子图书下载到电子阅读器上,也可以把自己购买的书和文档储存到电子阅读器上。电子书是传统的印刷书籍的电子版本,它可以使用个人计算机或用电子书阅读器进行阅读。它流行的原因在于电子书允许进行类似纸张书本的操作——读者可以在某页做书签,记笔记,对某一段进行反选,并且保存所选的文章。

(5)电子书的制作。电子杂志、电子书制作软件iebook超级精灵是全球第一家融入互联网终端、手机移动终端和数字电视终端三维整合传播体系的专业电子杂志(商刊、画册)制作推广系统。例如,2019年数字阅读用户规模达7.4亿人,数字阅读市场规模达到204.8亿元。

2.多媒体记事本

多媒体记事本现在一般特指Windows操作系统附带的一个简单的文本编辑、浏览软件notepad,exe。记事本只能处理纯文本文件,但是,由于多种格式源代码都是纯文本的,所以记事本也就成为使用最多的源代码编辑器

多媒体记事本只具备最基本的编辑功能,所以体积小巧,启动快,占用内存小,容易使用。“记事本”的功能虽然不如“写字板”,但它有自己的独门绝技。

3.其他文字记录媒体

例如,人们平常所用的Word文档、WPS文档等,这些都参与到了人们日常生活中的信息记录,所以它们也是信息存储技术的重要组成部分之一。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈