首页 理论教育 电子商务的数据分析概念解析

电子商务的数据分析概念解析

时间:2023-05-21 理论教育 版权反馈
【摘要】:数据分析的作用。目前大数据尚未有一个公认的定义,已有的定义基本是从大数据的特征出发,对其特征的阐述和归纳。

电子商务的数据分析概念解析

1.数据分析

数据分析是指收集、处理数据并获取信息的过程。具体来说,数据分析是指在业务逻辑的基础上,运用简单有效的分析方法和合理的分析工具对获取的数据进行处理的一个过程。

(1)数据分析的目的。数据分析的目的是把隐藏在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实际生活中,数据分析可帮助人们做出判断,以便采取适当行动。

(2)数据分析的价值。数据分析的价值包含三个方面,一是帮助领导做出决策;二是预防风险;三是把握市场动向,如图1-2所示。通过数据分析,可以帮助企业发现做得好的方向、需要改进的地方,以及指出企业出现的问题。

(3)数据分析的作用。数据分析在企业日常经营分析中,具有以下三方面的作用。

①现状分析,提供企业现阶段整体运营,以及企业各项业务的构成情况,包括各项业务的发展以及变动情况。

②原因分析,发现企业存在问题的原因,并依据原因制订相应的解决方案

图1-2 数据分析的价值

③预测分析,对企业未来的发展趋势做预测,便于企业制订运营计划。

(4)数据分析的应用。数据分析有极广泛的应用范围,在产品的整个生命周期内,从产品的市场调研到售后服务以及最终处置都需要适当运用数据分析。例如,企业会通过市场调查分析所得数据,以判定市场动向,从而制订合适的生产及销售计划。同样,在淘宝店铺运营过程中,数据分析也起着积极的作用。

(5)数据分析的分类。一般把数据分析分为三类:EDA(Exploratory Data Analysis,探索性数据分析)、CDA(Confirmatory Data Analysis,验证性数据分析)和定性数据分析。

EDA是指对已有的数据在尽量少的先验假定下进行探索,侧重于在数据之中发现新的特征。EDA讲究的是从客观数据出发,探索其内在的数据规律,让数据自己说话。

CDA是指在进行分析之前一般都有预先设定的模型,侧重于已有假设的证实或证伪。定性数据分析是指对词语、照片、观察结果之类的非数值型数据进行分析。如图1-3所示。

2.大数据

大数据本身是一个比较抽象的概念,单从字面来看,它表示数据规模的庞大。目前大数据尚未有一个公认的定义,已有的定义基本是从大数据的特征出发,对其特征的阐述和归纳。在这些定义中,比较有代表性的是3V定义,即认为大数据需满足3个特点:规模性(Volume)、多样性(Variety)和高速性(Velocity)。维基百科对大数据的定义则简单明了:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。

知识链接

数据分析从小数据开始

大数据最引人注目的是“大”,但是有时从小一些的数据集开始也是可以的,只要你能够分辨出你所寻找的是什么。如果你的研究对象为开业小于一年的零售店,那么你不需要一个大的IT系统来帮助你获取、贮存以及分析所有信息。如果你想要获得更愿意购买你的商品的顾客的统计资料,有很多免费的资源(如Google Adwords以及其相关的分析工具)可以帮助你达到目的。一旦你明白数据分析如何使你受益以及使你明白去获得什么,你将会非常确定地想要更大规模以及更可信的数据和方法。

3.云计算

图1-3 数据分析的分类

Google作为大数据应用最为广泛的互联网公司之一,在2006年率先提出云计算的概念。云计算是一种大规模的分布式模型,通过网络将抽象的、可伸缩的、便于管理的数据能源、服务、存储方式等传递给终端客户。根据维基百科的说法,狭义云计算是指IT基础设施的交付和使用模式,指通过网络以按照需求量的方式和易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按照需求量和易扩展的方式获得所需服务。目前云计算可以认为包含三个层次的内容:服务(IAAS)、平台即服务(PAAS)和软件即服务(SAAS)。国内的阿里云与云谷公司的XenSystem,以及在国外已经非常成熟的Intel和IBM都是云计算的忠实开发者和使用者。(www.xing528.com)

云计算是大数据的基础平台与支撑技术。如果将各种大数据的应用比作一辆辆“汽车”,支撑起这些“汽车”运行的“高速公路”就是云计算。正是因为云计算技术对数据存储、管理与分析等方面的支撑,才使得大数据有用武之地。

4.数据挖掘

大数据分析的理论核心就是数据挖掘。数据挖掘的各种算法基于不同的数据类型和格式,能更加科学地呈现出数据本身的特点,从而帮助人们更快速地处理大数据。如果采用一个算法需要花好几年才能得出结论,那大数据的价值也就无从说起了。因此,算法不仅能够满足处理大数据的数据量要求,也能一定程度地满足处理大数据的速度要求。

数据挖掘的重点不在数据本身,而在于如何能够真正地解决数据运营中的实际商业问题。但是,要解决商业问题,就得让数据产生价值,就得做数据挖掘。

5.数据质量

更好的数据意味着更好的决策,数据分析的前提就是要保证数据质量。因此,在数据分析和数据挖掘之前,必须完成数据质量的处理工作,即对数据的集成和处理。

数据质量的处理工作主要包括两方面:数据的集成和数据的清洗,关注的对象主要有原始数据和元数据两方面。

(1)数据的集成。数据的集成主要解决信息孤岛的问题,包括两方面:数据仓库对源数据的集成和元数据系统对不同数据源中的元数据的集成。相应的,数据质量管理也关注两方面:对数据仓库中的真实数据的质量探查和剖析,以及对元数据系统中元数据的数据质量的检查。

元数据的管理目标是整合企业信息资产、支撑数据在使用过程中的透明可视,提升数据报告、数据分析、数据挖掘的可信度,所以元数据的数据质量检查着重在于对元数据信息的唯一性、一致性、准确性的检查。

(2)数据的清洗。数据质量处理主要是采用一些数据清洗规则处理缺失数据、去除重复数据、去除噪声数据、处理异常(但真实)的数据,从而保证数据的完整性、唯一性、一致性、精确性、合法性和及时性。

6.数据预测分析

数据预测分析是大数据技术的核心应用,如电子商务网站通过数据预测分析顾客是否会购买推荐的产品,信贷公司通过数据预测分析借款人是否会违约,执法部门用数据预测分析特定地点发生犯罪的可能性,交通部门利用数据预测分析交通流量等。预测是人类本能的一部分,只有通过大数据预测分析才能获取智能的、有价值的信息。

数据预测分析能帮助企业做出正确而果断的业务决策,让客户更开心,实施成功的数据预测分析有赖于以下几个要素。

(1)数据质量。数据是预测分析的血液。数据通常来自内部,如客户交易数据和生产数据,但通常还需要补充外部数据源,如行业市场数据、社交网络数据和其他统计数据。与流行的技术观点不同,这些外部数据未必一定是大数据。数据中的变量是否有助于有效预测才是关键所在。总之,数据越多,相关度和质量越高,找出原因和结果的可能性越大。

(2)数据分析师。数据分析师必须理解业务需求和业务目标,审视数据,并围绕业务目标建立预测分析规则,如如何增加电子商务的销售额、保持生产线的正常运转、防止库存短缺等。数据分析师需要拥有数学统计学等多个领域的知识。

知识链接

数据分析师应具备的能力

对于数据分析师来说,熟悉业务逻辑和掌握数据分析的方法与工具同样重要。数据分析师不可能在没有理解业务逻辑的基础上,提出一个基于数据的解决方案。因为每个行业都有不同的趋势、行为和驱动因素。事实上,一个不懂业务逻辑的数据分析师,其分析结果不会产生任何使用价值;而一个只懂业务逻辑而不精通数据分析方法与工具的数据分析人员,充其量只能算数据分析爱好者。现实情况是懂数据分析的人很多,懂业务逻辑的人更多,但既懂业务又懂数据分析,称得上“数据分析师”的人却非常少。

(3)预测分析软件。数据分析师必须借助预测分析软件来评估分析模型和规则,预测分析软件通过整合统计分析和机器学习算法发挥作用。

(4)运营软件。找到了合适的预测规则并将其植入应用,就能以某种方式产生代码,预测规则也能通过业务规则管理系统和复杂事件处理平台进行优化

7.数据可视化

数据可视化是指将数据分析结果用简单且视觉效果好的方式展示出来,一般运用文字、表格、图标和信息图等方式展示。Word、Excel、PowerPoint、水晶易表等都可以作为数据可视化的展示工具。现代社会已经进入一个速读时代,好的可视化图表可以清楚地表达数据分析的结果,大大节约人们思考的时间。

数据分析的使用者包括大数据分析专家和普通客户,他们对于大数据分析最基本的要求就是数据可视化,因为数据可视化能够直观地呈现大数据的特点,让数据自己说话,让观者直接看到结果,这就是数据可视化的作用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈