首页 理论教育 开放科学数据:免费获取和再发布的无版权限制的数据

开放科学数据:免费获取和再发布的无版权限制的数据

时间:2023-07-23 理论教育 版权反馈
【摘要】:开放科学数据是指任何人都可以自由获取和再发布的,并且不受版权、专利限制的数据。2002年我国启动了国家科学数据共享工程。2004年中国签署了《获取公共资助科学数据宣言》。re3data.org的目的是促进文化共享,增加研究数据的可访问性和可见性。截至2013年1月28日,re3data.org平台中共有329条记录,其中116条是经过re3data.org审查的,在审查的数据中,有79个是提供开放访问的,有29个研究数据仓储提供认证或者支持仓储标准。

开放科学数据:免费获取和再发布的无版权限制的数据

开放科学数据是指任何人都可以自由获取和再发布的,并且不受版权专利限制的数据。一般意义上的开放数据主要是指各种实验数据、统计数据、观测数据、仿真数据,不仅包括原始数据,也包括元数据和数据集。

欧美国家都很重视OA数据的使用和发展。欧洲研究大学联盟(The League of European Research Universities,LERU)认为开放数据代表了未来科学研究的方向,是研究方式的变革。在欧洲数据政策(GHG-Europe Data Policy)中,为了确保数据拥有者积极参与科学工作的机会,确保数据拥有者的著作权以及统一发布数据的规则。该数据库被分离成一个公共领域和内部项目领域。数据库中的数据将被立即公开,除非个人版权的限制或推迟出版。在后者的情况下,数据被存储在数据库的内部项目域。2013年2月,美国科技政策办公室(OSTP)在备忘录中提到,公开非保密的研究科学数据供访问,并且支持检索、查询和分析,是公众享有的一项权利。大学和科研机构更要重视数据驱动研究的转变,数据驱动的研究是未来全球性的发展方向。高校和科研机构应实施数据管理的政策;应建立支持研究的技术和基础设施;需要建立解决上述所有问题的宣传方案,并明确研究人员管理自己的出版物和数据的职责。

2002年我国启动了国家科学数据共享工程。2004年中国签署了《获取公共资助科学数据宣言》。2006年10月,我国政府承诺,到2020年80%以上的公益性、基础性科学数据资源将通过互联网面向全社会共享。

图4-6 北京大学开放研究数据平台

为了更好地让科研人员利用好数据存储,国际上出现了数据仓储的注册和目录系统,如Datacite、OAD、Databib、re3data.org等,帮助人们更好地了解数据存储,更好地找到科研数据的在线信息库。下面对主要的开放获取目录做一介绍:

(1)DataCite

DataCite(International Data Citation Initiative,国际数据引用倡议)是一个非营利性组织,于2009年12月1日成立于伦敦。DataCite是一个国际联盟,主要由德国和其他欧洲国家的机构组成。由于DataCite是一个全球性的研究机构,它拥有成员机构,为有需要的研究者提供服务和建议。DataCite目前将德国科技国家图书馆(German National Library of Science and Technology,TIB)设立为管理代理人,成员和合作伙伴遍布全球,包括来自11个国家的15个地区的成员。其目的就是增加数据的引用性和便捷性。并支持数据归档,以便对未来的研究进行验证和重新利用。帮助用户发现、访问和再利用数据,进行数据对象标识的分配,集中元数据存储、检索和OAI数据提供者。DataCite的所有数据都采用数字对象标示符(Digital Object Identifiers,DOI)标识,以便能够检索和加以引用。DataCite中的研究数据主要包括:数据集(datasets)、数据论文(data papers)、灰色文献(grey literature)。

(2)Open Access Directory(开放获取目录):

OAD中收集了许多与OA相关的材料,相当于OA的汇编和参考列表。为了便于维护,采用了WIKI形式。截至2013年2月28日,共包括108个数据仓储资源。

(www.xing528.com)

图4-7 108个数据仓储资源学科分布图

(3)Databib

Databib是一个合作的、带注释的以研究数据仓储为主的参考书目,Databib目录主要包括如下信息:仓储的名称、仓储URL、仓储维护机构、主题、描述、访问(open/closed)、开始日期、国家、可再利用、数据提交人、仓储类型。

Databib目标是创造、分享和增强研究资料库的书目记录的描述,帮助人们识别和查找科研数据的在线信息库。Databib主要收集可以再现或重用的研究数据,如表格、记录副本(transcript)、图像、传感器和仪器输出、基因序列、调查表、软件源代码、录像等。Databib是研究数据仓储的可查询的目录,提供按照学科分类、首字母进行数据仓储的浏览,支持关键词检索或者高级的布尔逻辑检索、元数据字段。

截至2013年3月6日,Databib已经包括了519个数据仓储,具体如图4-8所示。

图4-8 Databib数据仓储学科分布图

(4)re3data.org

re3data.org由德国研究基金(DFG)资助,参加者包括德国洪堡大学的柏林图书馆与信息科学学院(BLIS)、德国地学中心(GFZ)卡尔斯鲁厄理工学院(KIT)。

re3data.org(Registry of Research Data Repositories)的目标是建立全球性研究数据仓储的注册,包括不同学科领域的研究数据仓储。re-3data.org将为研究人员、资助机构、出版社和学术机构提供仓储数据集的永久性存储和访问。re3data.org帮助研究人员找到合适的仓储来存储和访问研究数据,帮助资助机构来加强对他们资助项目所产生的研究数据的永久性访问,为出版社和研究机构提供数据存储的研究数据仓储工具。re3data.org的目的是促进文化共享,增加研究数据的可访问性和可见性。截至2013年1月28日,re3data.org平台中共有329条记录,其中116条是经过re3data.org审查的,在审查的数据中,有79个是提供开放访问的,有29个研究数据仓储提供认证或者支持仓储标准。将来可以不受限制地对re3data.org的元数据进行再利用(依赖于re3data.org的技术发展)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈