首页 理论教育 大数据在科普工作中的应用分析:科技馆与科普信息化

大数据在科普工作中的应用分析:科技馆与科普信息化

时间:2023-08-05 理论教育 版权反馈
【摘要】:大数据产业正在成为新的经济增长点,将对未来信息产业格局产生重要影响。应用大数据成为重塑国家竞争优势的新机遇。大数据现已成为提升政府治理能力的新途径。图10-8为大数据平台应用架构。高度信息化的大数据智能综合服务平台是信息技术与科普产业的深度融合,贯穿科普活动全过程、服务全链条、经营全流程,以技术

大数据在科普工作中的应用分析:科技馆与科普信息化

10.5.1 发展形势和重要意义

科技馆的“智慧化”代表了科技馆通过引入多种信息技术元素来对科技馆赋以更人性化的一种发展趋势。科技馆智慧化一方面是得益于现代信息技术的快速发展,另一方面是智慧城市概念的提出及其实践发展,为智慧科技馆的未来发展提供了现实的模式和动因。信息化的过程蕴含着媒介的演变,当代的信息化发展可以概括为数字化、网络化和智能化三个阶段,这也符合科技馆信息化的整体进程和趋势。因此,通常可以将智慧科技馆视为科技馆在信息化驱动下的某种目标形态,科技馆的信息化则成为实现智慧科技馆这一目标的必要过程。随着信息化的发展,全球范围内,运用大数据推动经济结构调整、完善社会治理手段、提升政府服务模式和监管能力正成为趋势,有关发达国家相继制定实施大数据战略性文件,大力推动大数据发展和应用。目前,我国互联网、移动互联网用户规模居全球第一,拥有丰富的数据资源和应用市场优势,大数据部分关键技术研发取得突破,涌现出一批互联网创新企业和创新应用,一些基层政府已启动大数据应用的相关工作。坚持应用数据创新驱动产业发展,加快大数据基础设施建设,深化大数据应用实践,已成为稳增长、促改革、调结构、惠民生和推动政府治理能力现代化的内在需要和必然选择。

应用大数据技术成为推动经济转型升级的新动力。以数据流引领技术流、资金流、人才流,将深刻影响社会分工协作发展的组织模式,促进生产组织方式的集约和创新。大数据推动社会生产要素的网络化共享、集约化整合、协作化开发和高效化利用,改变了传统的生产方式和经济运行机制,可显著提升经济运行水平和效率。大数据持续激发商业模式创新,不断催生新业态,已成为互联网等新兴领域促进业务创新增值、提升企业核心价值的重要驱动力。大数据产业正在成为新的经济增长点,将对未来信息产业格局产生重要影响。

应用大数据成为重塑国家竞争优势的新机遇。在全球现代信息技术快速发展的大背景下,大数据已成为各个国家重要的基础性战略资源,正引领新一轮科技创新。要充分利用大数据发挥我国的数据规模优势,实现提升数据质量和发展应用水平同步提升发展,发掘和释放数据资源的潜在价值,更好发挥数据资源的战略作用,增强网络空间数据主权保护能力,维护国家安全,提升国家竞争力。

大数据技术应用能够揭示传统技术手段难以发现的关联关系,大力推动政务数据资源共享,促进社会公共事业数据融合,大数据技术将极大提升政府、企业整体数据挖掘分析能力,为有效处理复杂社会问题提供新的辅助分析手段。大数据现已成为提升政府治理能力的新途径。实现基于数据的科学决策,将推动政府管理理念和社会治理模式进步,逐步实现政府治理能力现代化。

10.5.2 科普大数据建设的意义

全民科学素质行动规划(2011—2015年)》中提出如下建议:培育、扶持若干有较强吸引力的品牌科技馆,研究开发网络科普的新技术和新形式,开辟网络科普新途径,促进科普网站之间开展科技传播的交流,加强网站之间合作。国家对现代信息技术在科学传播领域所起作用的重视程度日益凸显,信息技术在科学技术普及领域的应用也亟待进一步发挥。

科普信息化建设是社会进步的需要,现代社会发展进程中,信息的交流与传播具有举足轻重的地位,特别是在当今高速发展的信息化时代,文化的生命力、创造力、影响力、凝聚力在很大程度上取决于媒体的覆盖范围和传播实力。与科学技术传播方式如出一辙,互联网既是社会科技文化的载体新时代传播科普的渠道,也是科技文化的组成部分,更是国家科技竞争力的表现。随着互联网等新兴媒体的快速发展,人们获取知识的渠道不再是单一的购买科普图书、收看科普电视节目。公众可以通过网络直播,目睹科学活动,并参与评论发表感想。以互联网为主体的现代信息技术的广泛应用为科学文化传播提供了全新的传播模式,使网民接受科学知识的渠道多样化,获取的知识更加多元化。

科普信息化建设是国家、社会和公众的普遍需求。第八次科学素质调查的结果表明,我国公民对科技信息的兴趣程度显著增长。与2005年比较,2010年我国公众对与科学技术相关的报道感兴趣的比例显著增长,其中与人们日常生活相关的科技信息是人们关注的热点。这充分说明科普不仅仅是国家政府的大政方针,同时也是普通大众的本质需求。信息化科普不仅能够为公众提供更加便捷的科学文化消费途径和渠道,提供更加丰富多样的消费内容,还改变了公众参与其中的被动消费地位,使其具有了共同创造的平等话语权

科普信息化建设是加快科技成果应用转化的基础。我国为了提高自主创新能力,高新技术的研发投入大幅度提高;但是科技项目成果的科普重视程度不高,亟待充分利用现代科技手段,把科研试验基地搬上互联网、手机应用等媒体,产生更广更好的社会效果。

10.5.3 智慧科技馆大数据应用的内容

在传播角度上,贯彻整体性的宣传目标和策略来提升科技馆与潜在受众的交流互动。在运营方面,体现了科普服务和工作协同的创新,其核心是整合部门资源,重构业务流程,以工作流的服务串联信息化的协作。教育的角度指向信息通信技术元素与展览、教育之间的融合。科普技术的发展进步基于信息化快速的发展,服务和协作创新是信息化不断向前发展的应用创新之一。信息通信技术与展览可吸引更多的人参观学习,信息化创新又为科技馆运营绩效提供支撑,让科技馆更科技,在科普技术的发展中,大数据功不可没。图10-8为大数据平台应用架构

图10-8 大数据平台应用架构

10.5.3.1 基础支撑系统

建设基于大数据平台支撑的科技馆服务平台,集中解决管理和业务发展,以信息技术为基础,接入物联网,地理信息系统集成,构建贯穿整个科普过程的感知与智能服务体系

基于大数据标准体系和科技馆全局业务分析,数据管理和服务平台提供统一的数据访问、交换和展现服务,支持多方系统集成,实现资源共享,提供基于主题的综合查询服务,并可按照具体业务需求扩展应用主题和信息查询。实现经营、服务、管理、运行的全业务流集成管理,建立智慧化的科普旅游服务、营销和管理的全新方式。高度信息化的大数据智能综合服务平台是信息技术与科普产业的深度融合,贯穿科普活动全过程、服务全链条、经营全流程,以技术创新增强科普竞争力,优化观众体验,提高场馆管理水平,实现科技馆的智能化管理和运行。

10.5.3.2 坚持政府数据与社会数据相统一

当前,随着互联网、物联网、移动通信等社会化数据源渠道的飞速发展,全社会数据资源正在从过去政府掌握80%的全社会公共数据资源逐渐转变为社会化数据资源占绝大多数的新格局。在当前万物互联化、数据泛在化的大背景下,越来越多物理实体的实时状态被采集、传输和汇聚,从而使数字化的范围蔓延到整个物理世界,物联网数据将成为人类掌握的数据集中最主要的组成部分。正因如此,习近平总书记在中央政治局第二次集体学习时指出,要加快公共服务领域数据集中和共享,推进同企业积累的社会数据进行平台对接,形成社会治理强大合力。要想系统描述和刻画全社会经济运行全貌,就要形成覆盖政府、企业、社会机构、个人和海外相关信息,跨层级、跨地域、跨系统、跨部门、跨业务的数据采集汇聚机制,强化陆海空天电网数据资源全领域、全要素统筹,实现对全国范围内信息化、网络化、可视化和智能化的数字集成创新,实现国家一体化数据资源体系框架,有效增强国家数据资源的纵横联动和协同管理能力。

10.5.3.3 建立面向参展的动态本体库体系

科技馆信息化的过程中,立足于现代信息技术视角,综合利用多种形态的信息传播技术来改善情境中的混合观感体验。在归集汇聚相关数据的基础上,构建人流、展品、交通、事件、展馆、安防等对象的动态本体库。以参观人员信息、展区展品信息、电子参展卡路线为主线,依托统一编码对接相关数据资源,对本体对象(Objects)、属性(Properties)和关系(Relationships)进行抽象化处理,依托复杂网络分析方法及大规模图计算技术,实现动态本体图谱的展现、布局、搜索、统计、分析、推理、演绎和学习,支持动态本体混合检索、路径发现、频繁子图挖掘、关键节点识别、社团发现等功能,形成多维度分析、多视角监测、多领域应用的动态本体图谱分析能力。

10.5.3.4 以复杂网络分析为核心的行为依赖性仿真分析

与自然科学研究不同,社会科学研究的对象与人高度相关。批判实在论认为,社会活动关系、结构和机制的存在具有对人类活动的依赖性,它既是人自身各种行为的社会化结果,又是存在于行为者之间的相对持久的社会关系。行为经济学则认为,情境往往决定了人们如何决策,因此我们可以利用对情境的研究来解释甚至预测人们的参观行为。大数据相比传统统计手段一个最大的优势就是可以通过非干预的方法获取主体行为方方面面的“痕迹”数据。通过归集行为数据,可以刻画展馆与展品之间、展品与展品之间、展品与观众之间、观众与观众之间(如社交关系、亲友关系、位置关联等)的主体关系,构建以微观主体为节点、以主体间关联关系为边的展馆社会运行复杂网络,并运用图计算、网络社群挖掘、复杂网络演化分析、社会网络等分析方法识别经济运行主体的行为依赖性凸现现象和演化规律,并基于网络拓扑结构刻画科技馆运行的复杂性,实现对科技馆发展的预测。利用“展馆-展品”矩阵关系和非线性迭代算法刻画科技馆发展潜力和展品布展复杂性,较好地预测科技馆竞争力展品布展趋势。

10.5.3.5 以地理信息系统为依托的时空依赖性仿真分析

巴斯卡认为,既然社会关系、结构和机制是依赖于人们的行为与观念,那么其就不可避免地对行为主体所处的时空条件产生依赖,而不会具备时空上的恒定性和普遍性。保罗·克鲁格曼也指出,新古典传统的通用做法是“避开地理问题——大部分模型构建将世界想象为没有运输成本的世界”,是“没有尺度的仙境”。大数据时代的到来,使得基于个体粒度的海量时空轨迹来获取人类移动模式成为可能。现实世界中,超过80%的数据都与地理位置有关,对于经济研究而言,个体、企业、产业、工程项目等研究对象都有十分明确的时空分布特征。正因为如此,时空大数据研究是当前大数据领域十分热门的一个分支。构建以地理信息系统为依托的时空依赖性仿真分析平台,大致包含三个方面技术功能:一是传统意义上的地理信息技术在科技馆参展分析中的应用,开展数据融和、变化检测、目标特征提取等技术研究;二是将各种科技馆运行相关数据在一个地理信息平台上实现时空叠加和比对分析,可以基于项目位置信息叠加卫星高分遥感图片、周边人流密集度、路网拥堵情况等多重图层,实现对科技馆运行效果的精准分析;三是从时空关联的角度开展分析挖掘。

10.5.3.6 建立科技馆运行预测分析平台

当前,大数据手段已经与商业化场景紧密结合,通过运用基于大数据的分析和挖掘技术手段,使得商业智能从过去的报告和决策支持模式跃升到商业预测和未来决策模式。人们试图通过大数据手段,从各种实时、交互、离散化、非结构化的海量数据中,发现场馆社会运行的各种先行指标信号,并形成多种预测模型。

(1)对传统预测模型的优化改进

通过将大数据指标整合到传统统计预测模型中,实现对传统预测效果的提升。该方法的基本步骤包括两步:第一步仅使用传统统计信息选择初步最优预测模型;第二步将互联网搜索行为加入选择的模型中,最终确定最优模型。

(2)基于复杂网络的预测模型

目前,复杂网络中的链路预测方法已经成为该领域研究的一个重要热点,即通过网络中已知的节点信息、网络结构信息等预测网络中任意两个节点之间产生链接的可能性。在构建参观主体关联网络的基础上,可以综合运用相似性预测、最大似然估计预测、概率模型预测等方法开展复杂网络链路预测,从而实现对科技馆运行复杂网络未来走势的预测。(www.xing528.com)

10.5.3.7 构建风险监测预警平台

(1)构建风险识别模型库

针对自然人方面,重点围绕犯罪热点预测、疫情传播预测、人群聚集点风险、互联网金融、网络诈骗、非法传销等问题进行风险识别建模。针对法人方面,重点围绕涉及重大政策和重大项目的违法违规、社会纠纷、实施进度、金融杠杆率、流动性风险、社会信用风险违法犯罪、外部冲击等重点风险领域开展建模分析。例如,在互联网金融领域,可以重点围绕非法集资企业精准画像、核心控制人捕捉、异常风险事件发现、欺诈风险识别等显性风险点,开展风险模型训练、数据测试集校验建模,不断强化科技馆对往来单位和参观人员的风险识别和应对处置能力,切实防范潜在运行风险。

(2)构建风险评级体系

利用机器学习、风险模型、专家评分等手段,构建覆盖自然人和法人的风险识别特征库,在整合归集多种数据源的基础上,对不同行业、不同层级的评估对象进行风险评级,以实现更加精准、超前的风险识别与预测预警。

10.5.3.8 运营指挥

大数据所带来的重点变革之一,是对领导决策思维、管理模式和处理方法的变革。基于工作经验的决策彻底让位于基于数据计算的决策。决策就是通过数据分析对行动方案优化设计并最终选择行动方案的过程。科技馆运营指挥利用云计算、物联网、互联网、大数据技术等将科技馆海量信息归集,通过智能化分析,为科技馆管理者提供一个智能可视化平台,实时了解科技馆状态,对科技馆的规划管理决策提供依据,如图10-9所示。对科技馆进行监测、巡查、分析、预警、评价、公共安全、资源统筹和服务的全周期管理,解决综合管理难的问题。

图10-9 科技馆大数据标准体系

10.5.3.9 运营数据分析平台

随着我国科学技术水平的不断发展,计算机网络技术的广泛应用,我国已经步入了大数据时代。在大数据背景下,各种繁杂的数据层出不穷,一时难以掌握其基本特征及一般规律,这也给科技馆的运营数据分析工作增添了不小的难度。在大数据的背景下,基于大数据前沿技术构建科技馆运营数据分析平台受到越来越多的企业的重视,在具体的数据分析工作中,也起到了越来越重要的作用。

运营数据分析平台建设,其一,要满足业务管理系统上线以来日益增长的数据分析需求,快速掌握业务状况,发现业务问题与偏差,促进管理改进,利用准确、及时的信息制定业务决策。其二,迎接大数据时代科技馆面对的诸多内外部挑战,从不断加速产生的大量数据中攫取有价值信息,发现和创造新的机会;优化科技馆业务流程,控制风险、提高效益。本次项目摒弃传统的数据分析平台建设模式,将运营数据分析与大数据平台建设相结合,打破不同应用系统、信息来源的界限,对海量数据进行有效组织、存储,加以分析并转化为有价值信息。

平台建设将以展现整体业务现状和服务决策层为主要目标,以业务管理系统的数据为核心,结合系统外部已获取的产品运维数据,实现相关业务数据展现和数据透明化。在技术实现上,采取先进的大数据应用技术作为企业整体数据管理的基础结构,借助云计算数据处理与应用模式的广泛运用,为科技馆处理日益增长的海量数据,实现高效、可扩展的低成本解决方案。深化和拓展公司商业智能和知识服务能力,提高经营决策效率,实现从“业务驱动”到“数据驱动”的转变。通过智能软件平台、网络系统、核心数据、数据中心四大方面建设,实现科技馆信息的大数据整合和深度开发激活,形成与展馆服务相关的休闲餐饮、旅游导览、展区布置、文化娱乐、人员流动、交通动态、热点主题等数据资源池,并为观众可视化展现,为科技馆管理者提供管理决策的依据,如图10-10所示。

图10-10 以人为中心的科技馆运营分析

运营数据分析平台要求满足数据处理采集、存储、计算、应用,能够同时满足PB级的结构化和非结构化数据的快速处理需求。其关键技术如下:平台整体架构采用虚拟化云计算及分布式计算架构设计,主要由基础设施层、支撑软件层、安全保障体系、服务保障体系组成;实现基于Hadoop的大数据开发和运行环境;实现基于大数据的HDFS分布式文件系统存储;针对小文件优化的分布式文件系统,充分考虑公司未来的数据增长,满足海量数据存储需求;实现基于Hive数据仓库及数据集市建设分析;实现基于HBase的快速响应数据存储支撑;实现基于Oozie的数据分析Job配置管理;提供面向非结构化数据的NoSql数据库服务功能;提供行业业务数据的大数据分析引擎;根据公司业务需求及数据特点,提供Spark分析计算框架,确保数据的并行计算和实时分析以及系统的响应效率;提供机器冷数据(非业务数据)的数据分析引擎和算法工具;提供基于HTML5等技术的系统页面设计和展示;基于Echart、D3、Jquery等开源软件实现丰富的图表展现;能提供大数据云化服务平台,封装数据接口服务和大数据分析云服务以及大数据读写存储云服务。

甘肃科技馆数据分析:通过整合科技馆内部核心业务数据与外部产品数据,基于运营分析平台汇总分析,通过直观生动的展现方式,采用不同颜色的预警和异常提示,以整体视角呈现科技馆运营状况,为科技馆决策提供直观、数据化的有力参考依据。运营数据分析平台是建设一套卓越的管理决策支持系统,深化数据应用,可满足科技馆现阶段的管理要求及未来业务发展的需求,提升科技馆整体信息化水平,进一步促进科技馆未来的快速发展。

截至2020年5月21日,甘肃科技馆官网访问总人数约为3285000人,日访问量约为3650人/日。通过票务系统预约参观的人数约为448756人,男性游客约为187000人,约占预约总人数的41.66%,女性游客约为261756人,约占预约总人数的58.34%,如图10-11所示。

图10-11 性别结构统计

其中,18~24岁的游客数量为66906人,约占游客总人数的15.55%;25~30岁的游客数量为52053人,约占游客总人数的12.1%;31~35岁的游客数量为96201人,约占游客总人数的22.37%;36~40岁的游客数量为79624人,约占游客总人数的18.51%;41~50岁的游客数量为57803人,约占游客总人数的13.44%;50岁以上的游客数量为77542人,约占游客总人数的18.03%。游客年龄分布统计如图10-12所示。

图10-12 游客年龄分布统计

访问地域方面,来自甘肃省内的公众号关注人数为205406人,约占90%;省外人数约为25800人,约占10%(见表10-1)。

表10-1 甘肃科技馆公众号地区关注统计表

如图10-13所示,访问设备方面,通过安卓系统访问公众号的用户数约为171336人,约占75.29%;通过苹果系统访问的用户数约为56241人,约占24.71%。

图10-13 终端分布统计

语言分布方面,简体中文用户人数达225882人,占99.25%;英文用户人数为864,占0.38%;繁体中文用户人数为443人,占0.19%。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈