首页 理论教育 大数据采集与应用:2019年软件工程论文专集

大数据采集与应用:2019年软件工程论文专集

时间:2023-11-06 理论教育 版权反馈
【摘要】:硬件终端透过搭载的4G 模块向后台服务器发出服务请求,服务器端接收到请求后,建立连接,提供数据录入服务。在实际运行中,基于大数据算法的触控模组故障报警功能极大节省了快递柜运营公司和制造厂商的运维人力,其节省的资金已超过本系统的部署费用。采用该系统的自助设备运营商可以依照热力统计图所表示的对不同广告区域的交互频率,向不同的广告主有差别地收取更合理且更令人信服的投放费用。

大数据采集与应用:2019年软件工程论文专集

系统的软件部分实现了对触控模组监测数据的预处理、传输、存储、运算及展示等功能。监测系统运行的总体流程图如图3所示。

系统的后台与数据库运行在具备固定IP 地址的公有云系统上。硬件终端与后台以Socket 通信,其基于TCP /IP 方式建立连接。硬件终端透过搭载的4G 模块向后台服务器发出服务请求,服务器端接收到请求后,建立连接,提供数据录入服务。本设计采用的4G模块硬件集成了TCP /IP 协议栈,采用此种方式既简化了开发工作量,又保证了传输的正确性与完整性。

数据录入数据库后,后台运行的大数据算法会对其进行持续的增量分析。如前文所述,大数据运算的一个重要功能,就是依照预设的运行故障模型,对数据进行分类、统计、评估。根据触控模组的运行特点和数据形式,数据采集终端从多个维度采集和分析数据,其分析也是从多种模型出发。

图3 监测系统运行流程图

以其中一个维度为例,其大数据算法通常设计为,根据实际情形,自助售卖设备作为一种服务设施,其中一定时间内到达的人数,以及触控模组在该时间内出现的故障数,符合泊松分布[4]。基于这个预判的模型,算法从统计技术出发,以固定的时间长度作为数据抽样及分组的基础,连续不断地更新合理值域并计算其与个别当前值的关系,并将符合判定条件的数据区间标记为异常行为时段。

当后台算法筛选出异常行为时,该异常行为数据将作为参数导入到另一种算法当中。该算法将进一步分析或分类这种行为,从预置的“现象-故障”列表中比对从而得出触控模块最可能的失效原因,并结合数据库里记录的产品序列号、4G 模块定位的坐标等信息,通过前端网页或手机端APP,即时通报给前端用户(一般为设备制造商)。

依靠项目支撑,在近年间,本系统在某快递柜项目中部署了超过10 万部硬件终端,地点遍布全国。在实际运行中,基于大数据算法的触控模组故障报警功能极大节省了快递柜运营公司和制造厂商的运维人力,其节省的资金已超过本系统的部署费用。图4 是部分硬件终端的主要信息截屏。

(www.xing528.com)

图4 触控模组监测系统web 前端页面截图

前文提到,大数据运算的另一大优势,是脱敏分析自助设备的用户行为并从中获取具备商业价值的结果。最常用的分析是绘制屏幕区域的热力统计图,对于在屏幕上不同显示区域投放来自不同资源方的交互内容的运营商来说,此类分析最为重要。出于各方自身利益的考虑,通常自助设备运营商无法从不同的内容来源方获取可信的点击率报告,从而无法准确地制定出最有利于整体运营利益的策略,而通过分析触控模组监测系统获取的用户真实互动数据,则可以取得非常可靠的,分时段统计的运营效果报告。如图5所示,运营商在自助咖啡机触控交互屏幕上不同显示区域内播放广告,并通过吸引等待现制咖啡的用户的点击等交互操作来全屏展示更进一步的内容。而全屏或弹窗显示将占据其他广告展示的区域。采用该系统的自助设备运营商可以依照热力统计图所表示的对不同广告区域的交互频率,向不同的广告主有差别地收取更合理且更令人信服的投放费用。

对于同一种自助设备在不同地点投放的运营商来说,本系统也可以迅速地统计自助设备在不同地点的交互频率,其在一定程度上表达了人流量的概念。此种统计不依赖于内容提供商的流量或服务接口,从而第一时间为运营商调整运营策略提供了有力的保障。

图5 某自助设备触控模组采集到的热力图

对于同一个运营地点分布有多台终端设备的情况,典型的如博物馆或展览厅,对监测到的大数据进行分析,也可以为运营方提供有价值的分析结论。如通过对交互频率的分时统计,可以判断观众对展示内容的喜好程度,合理调整展品的布局。图6 展示了在山东省东营市某农业成果展览馆内各互动设备在一天内的互动频度情况。

图6 某展览馆内各互动设备触控模组数据量一览表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈