首页 理论教育 统计学概念及应用简介

统计学概念及应用简介

时间:2023-07-19 理论教育 版权反馈
【摘要】:第一节统计学的概念及应用本节主要介绍统计学的概念及统计学的应用领域,强调了基于统计数据分析探索和发现现象变化规律的重要意义。

统计学概念及应用简介

第一章 导 论

在日常学习生活和工作的各个领域,经常会接触到大量的信息,有时我们会因为经营、管理以及决策的需要收集大量的信息。如何从大量的信息中发现有用的信息,怎样运用大量的信息对现象加以准确的描述,把握现象的变化规律及趋势,提高信息的使用效率,为决策所用,就成为我们需要研究和解决的问题。统计学以其独特的分析数据的方法,为我们从大量的数据中发现现象的特征及变化规律提供了一套科学的方法。

第一节 统计学的概念及应用

本节主要介绍统计学的概念及统计学的应用领域,强调了基于统计数据分析探索和发现现象变化规律的重要意义。

一、统计学的概念

统计学是收集、整理、分析和解释数据并从数据中发现现象变化规律的一门学科。对这一定义的理解应把握3个要点:第一,统计学是关于数据的科学,其内容包括数据收集、数据整理、数据分析和数据解释。数据收集即取得统计数据。统计学既然是关于数据的科学,那么它就要研究如何收集统计数据,收集统计数据的具体方法有哪些,各种不同的方法有哪些特点及其适应条件。数据收集是决策、管理、研究的基础,是认识现象的起点,科学的数据收集方法直接关系到数据的分析结果是否科学和正确,在统计研究乃至科学研究中起着非常关键的作用。数据整理包括统计数据的审核、汇总、排序和分类,并用图表的形式加以展示,这一阶段是统计分析的基础性工作,只有进行科学的统计整理,统计分析才能得出科学的结果。数据分析是根据统计研究的目的,用统计特有的方法对统计数据进行研究。这里所讲的特有的方法包括综合指标分析法、时间序列分析法、抽样推断法、相关及回归分析法、方差分析法等。数据分析是一个“去粗取精、去伪存真”的过程,统计数据只有经过分析,才能发现数据背后所隐含的现象的本质,才能为科学的决策提供有力的支持。数据解释就是对分析的结果进行说明,说明结果为什么是这个样子,结果所隐含的事物的特征是什么,从分析中得出了哪些规律性的结论。第二,统计学通过收集、整理、分析数据首先是对现象加以描述,这一点在本节的第二个大问题中将进行详细的说明。第三,统计学通过收集、整理、分析数据,还应该从数据的变化中发现现象的变化特点及数据背后所隐含的规律性,这是统计分析的目的之一。只有发现和掌握现象变化的规律性,决策、管理才有科学的依据。

二、统计学的应用领域

对任何现象的认识都有一个从感性认识到理性认识的过程。统计学是研究如何科学地收集、整理、分析和解释数据的一门学科,通过对数据的分析使我们对现象的认识从感性认识上升到理性认识,使得我们的决策建立在科学的基础之上。在经济实践中,只要有数据分析,就会用到统计方法。特别是在当代,定量研究日益受到重视,统计学已应用到自然科学与社会科学的众多领域,统计学已发展成为由若干分支学科组成的学科体系。可以说,几乎所有研究领都应用到统计学。要特别指出的是对现象的认识,只有经过严密的数理分析,才会更完善、更系统,所以,统计学方法在科学、系统地认识现象的过程中具有十分重要的意义。下面主要介绍统计在工商管理中的应用。

1.市场调研

市场调研是企业制定发展战略的一个重要组成部分,也是企业不断改进产品质量,满足用户需求,从而使得企业永续发展的客观要求。发展战略是一个企业的长远发展方向,制定发展战略一方面需要及时了解和把握整个宏观经济状况及发展变化趋势,了解市场的变化;另一方面,还要对企业进行合理的市场定位,把握企业自身的优势和劣势,所有这些都离不开统计,都需要运用统计方法收集可靠的数据。当企业的发展战略制定以后,在产品的营销过程中也大量地运用着统计学理论和方法,如企业要及时了解产品的市场占有率、消费者对产品的满意度、消费者可接受的合理价位、需求的变化规律、竞争对手的基本信息、最佳的营销方法、消费者群体定位等,这些都要依靠有效的市场调查,以及对市场调查资料的分析来获得,这就必须要运用行之有效的统计调查和统计分析方法。实践证明,有效、科学的市场调研,是企业成功经营的必不可少的环节,企业必须随时倾听来自顾客的声音,并把顾客对产品质量的需求随时转化为质量特性,这样才会及时满足顾客的需求,产品才有广阔的市场前景,企业才会获得持续的发展。

2.产品质量管理

质量是企业的生命,是企业持续发展的基础,质量管理中离不开统计的应用。利用统计方法进行质量管理,是质量管理发展阶段的一个重要环节,其起源较早。1924年,美国贝尔研究所工程师休哈特数理统计方法进行质量管理,并发表著名的“控制图法”,为统计质量管理奠定了理论和方法基础。第二次世界大战开始以后,战争对军需品的生产质量提出了新的严格的要求,迫切需要把统计方法应用于质量管理,于是,不仅在军工部门采用卓有成效的统计质量管理,而且在民用工业如运输、保险部门得到推行,使统计质量管理方法得到长足发展。在统计质量管理出现之前的质量检验是一种单纯的事后把关,虽然防止了不合格产品流向市场,但已经造成了资源浪费,而统计质量管理方法实现了从被动的事后把关到生产过程的积极预防,不但防止了不合格产品流向市场,而且节约了资源,节约了产品成本。在质量管理过程中,抽样理论及方法的应用节省了质量检验的时间,提高了产品质量检验的效率,质量控制统计表用于监控生产过程的产出,直方图用于监控生产过程的平均值,能够帮助企业管理人员调整和控制生产活动过程。标准差是绘制控制图的理论依据……大量统计方法的运用是质量管理方法上的一次飞跃。

3.财务会计分析

利用统计中的抽样方法,会计事务所可以对客户所提供的账目进行稽核。举例来说,一个会计事务所要确定客户提供的账单上显示的收入是否真实地反映了实际收入,一般情况下,每一客户提供的账单会包括很多笔账目,一笔一笔地审核和确认太耗费时间并且代价太高,在这种情况下,可以从很多笔账目中抽出一部分账目作为样本,审核所抽出样本的准确性,然后就可以利用抽样推断理论确定客户账单上的收入账目是否准确。再例如,上市公司的财务数据是股民投资的重要参考之一,一些投资咨询公司主要是根据上市公司提供的财务和统计数据进行分析,为股民提供投资参考;在股票市场上,投资顾问可以综合市盈率和股息等多方面的信息,将个股信息与平均信息比较后就可以做出某一支股票是涨还是跌的判断,等等。统计学中的移动平均线、方差等在投资分析中被广泛地运用着,企业自身的投资也离不开财务数据的分析,这其中要用到大量的统计方法。

4.经济预测

例如,国家统计局会定期公布房地产价格指数、住宅销售量,根据这些统计资料我们可以预测房地产市场未来的变化趋势;根据经济增长速度失业率、价格指数,可以认识宏观经济基本面;根据本年度某些大宗农副产品的价格及产量资料可以预测来年农副产品的价格走势;等等。企业要对产品的市场潜力做出预测,以便及时调整生产计划,这就需要利用市场调查取得数据,并对数据进行统计分析。经济学家在预测通货膨胀时,要利用有关生产价格指数、失业率、生产能力利用等统计数据,通过统计模型进行预测。

5.人力资源管理

利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析并作为企业制定工资计划、奖惩制度的依据。例如,对统计数据的研究表明,情绪压抑的员工其医疗支出要比不压抑的员工高出70%,觉得自己总是处于压力下的员工的医疗支出比没有压力的员工高出46%,这些统计数据就可以帮助决策者找到降低医疗费用的依据。

统计方法除了在工商管理方面的应用外,还在动物学考古学、医学等自然科学领域有着广泛的应用。总而言之,统计学是一门分析数据的科学,只要有数据的地方就会用到统计方法。目前,经济学研究越来越注重定量研究方法,所以,统计学中的方法受到广泛的重视,已被应用到科学研究的诸多领域,与此同时,统计学也已发展成为由若干分支学科组成的学科体系。

三、统计学规律

认识现象的变化规律是决策的依据,搜集资料是把握现象变化规律的基础。哲学向我们提供了认识世界的一般方法,而统计学则是量化的哲学,它为我们提供了认识客观规律的具体方法,这就是从数据的观察、分析中,探索现象发展变化的一般规律,使得决策、管理建立在科学的基础之上。实践充分证明,对规律的准确把握是走向成功的必备要素之一。统计学中大数定律揭示了准确把握规律的基本方法。这一规律指出,只要我们观察的数据足够多,则大量独立的随机现象内在稳定的规律就会呈现出来。以下是根据大数定律对统计数据研究后发现的带有规律性的例子:现代回归和相关技术的创始人F.Galton(1822— 1911)收集了1078对父亲及其儿子的身高资料,研究发现,平均来说,非常矮小的父辈倾向于有较高的子代(比较接近平均身高),而非常高大的父辈则倾向于有较矮的子代(也比较接近平均身高);在第一次考试中成绩最差的那些学生,在第二次考试中倾向于有较好(比较接近所有学生的平均成绩)的成绩,而在第一次考试中成绩最好的那些学生,在第二次考试中则倾向于有较差(比较接近所有学生的平均成绩)的成绩;同样,平均来说,第一年利润最低的公司第二年不会最差,而第一年利润最高的公司第二年则不会是最好的;就单独一个家庭来观察,每个家庭的新生婴儿的性别可能是男性,也可能是女性,如果不对生育人口进行限制,某些家庭的几个孩子可能都是男孩,而另外一些家庭的几个孩子可能都是女孩,从表面上看,新生婴儿的性别比例似乎没有什么规律可循,但如果对大量家庭新生婴儿进行观察,就会发现新生婴儿中男孩略多于女孩,大致为每出生100个女孩,相应地就有107个男孩出生,这个性别比例107∶100就是新生婴儿性别比的数量规律,但由于男性婴儿的死亡率高于女性,到了中年时,男女人数就大体相同了,进入中老年后,男性的死亡率仍然高于女性,导致男性的平均寿命比女性短,老年男性少于女性;等等。流行病学家会搜集某种新型疾病的资料从中发现其流行规律,为科学地预防该种疾病的流行做出科学的决策;刑侦专家会搜集和积累案件资料,从中发现罪犯的作案规律,为快速打击罪犯提供决策支持。

应该说,从大量数据的观察分析中发现现象的变化规律是统计学研究的重要目的之一。

实践中诸多事例说明,通过对大量数据的观察,我们就可以发现事物内在的规律性,因为客观事物本身是必然性与偶然性对立统一,必然性反映了事物的本质特征,偶然性反映了事物表现形式上的差异。如果客观事物只有必然性一个方面的特征,它的表现形式就会比较简单,我们就会很容易地把握它的规律性,正是由于偶然性的存在,才使得事物的表现形式与必然的规律性之间产生偏移,从而形成了形式上的千差万别,使得必然性的数量规律被掩盖在表面的差异之中。统计数据作为客观事物的数量表现,是偶然性与必然性共同作用的结果,偶然性使得对同一事物的多次观察得到的统计数据有差异,而必然性则隐含在统计数据本身之中,这正是我们要利用统计方法去寻找的。

第二节 统计数据的类型与统计学的分科

从统计学的概念我们可以看出,统计学是一门分析数据的科学。但在现实经济生活中,由于不同的数据所代表的意义不同,所以不能对所有的数据都用同一种统计方法进行分析。因此,统计研究只有区分数据的类型,才能够针对不同类型的数据采用不同的分析方法。数据的类型是由数据所代表的现象决定的,要对客观现象准确地认识和把握,就必须首先确定数据的量化尺度,对数据进行科学的量化,根据客观现象的特征不同,量化尺度由低级到高级,由粗略到精确,可分为定类尺度、顺序尺度、定距尺度和定比尺度,从而形成定类数据、定序数据、定距数据以及定比数据。

一、定类数据、定序数据、定距数据、定比数据

定类数据是由定类尺度计量形成的数据,也称分类数据。定类尺度又称为列名尺度,是对认识对象属性的差异所作的计量,这种计量是对统计研究对象按属性分类的。比如,企业按生产资料所有制的不同划分为国有企业和非国有企业,按产权形式分为公司制企业、合伙企业及业主制企业;人口按性别分为男性和女性;商品按品牌分为A商品、B商品和C商品;还有如宗教信仰、民族,等等。定类尺度的特点是:第一,它只能区分事物的类别,一般不比较类别之间的大小。第二,对事物的区分必须符合穷尽和互斥的要求,也就是说某一现象非A即B,而不能既A又B。第三,对定类尺度数据分析的统计量主要是频数和频率以及第三章介绍的异众比率。比如,把手机按品牌分为三星苹果诺基亚和其他品牌4类,进而可以统计使用各种品牌的人数(频数)和比重(频率)。

定序数据是由定序尺度计量形成的数据,也称为顺序数据。定序尺度是对认识客体的顺序差异所作的计量,是对事物之间等级差别或顺序差别的一种测度。比如,将产品分为一等品、二等品、三等品、次品等;考试成绩可以分为优、良、中、及格、不及格等;一个人的受教育水平可以分为小学、初中、高中、大学及以上,等等。人们对某一事物的态度,都是用这种计量尺度来测度的。其计量精度要优于定类尺度。定序尺度的主要特征有:第一,它不仅能够区分事物的类型,而且能够比较各类型间的优劣和顺序,即不仅具有“=”或“≠”的数学特性,而且具有“>”或“<”的数学特性,但由于各类事物的差距是未知数,因而不能对其序号进行代数运算,比如,不能用一等品加二等品等于三等品。第二,用于分析的统计量主要是频数和累计频数。比如,不仅可以统计一个城市拥有大学学历的人数,还可以统计拥有大学以上学历的人数有多少(累计频数)。

定类数据和定序数据说明的是事物的品质特征,通常是用文字来表示的,其结果均表现为类别。

定距数据是由定距尺度计量形成的数据。定距尺度是对事物之间差距所作的测量,它包含了定序数据的所有特征,而且各数据之间的差异是一个恒定的数据。例如,以百分制表示的考试成绩、各种心理测试的得分,不同地区的温度差异等。定距尺度的特点是:第一,它不仅能区分事物的类别、进行排序、比较大小,还可以精确地计量大小的差异。第二,没有绝对的零点,即可以以任意一个0为起点。这里的0不是表示“没有”,而是表示一个数值,即0水平。例如,一个学生统计学的考试成绩为0,并不表示他没有任何统计学知识;同样,温度为0并不表示没有温度。

定比数据是由定比尺度计量的数据。定比尺度又称为比例尺度,是对事物之间比值的测度。它与定距尺度属于同一层次,但其功能要比定距尺度更强一些。定比尺度的主要特征是:第一,它除了能区分事物的类别、进行排序、比较大小差异外,还可测度两个值之间的比值。第二,它具有绝对的零点,即0表示“没有”或“不存在”。比如,收入为0表示没有收入。

由定距尺度和定比尺度计量形成的数据统称为数值型数据,通常是用数值表示的。

在上述4种类型的数字当中,定类数据的级别最低,也就是说,能用于分析该类数据的统计方法较少。定序数据比定类数据高一个级别,它具有定类数据的所有特征。定距数据比定序数据更高一个级别。定比数据是级别最高的数据,它与定距数据具有相同的特征。在统计实践中,有时也把定类数据和定序数据统称为定性数据,把定距数据和定比数据统称为定量数据。在统计分析中,一般要求数据测量的层次越高越好,因为高层次的计量尺度包含更多的数学特性,包含更多的信息,可运用的统计方法就越多,分析时也就越方便。因此,数值型数据是统计研究中使用最多的统计数据。对于不同类型的数据,所使用的方法是不同的。其中用于分析定类数据的方法是最少的,高级别的数据可以使用低级别数据所使用的统计方法进行分析。

二、统计学的分科

根据分析数据所使用的方法不同,可将统计学分为描述统计学和推断统计学。

1.描述统计学

将数据以图形、表格和数字的形式表示,这些统计方法称为描述统计。在实际生活中,我们几乎可以经常接触到描述统计学的例子,例如,某位老师对班级考试成绩进行统计,得出针对该班的结论,如平均成绩、成绩分布或本次考试的其他数据;一个国家或一个地区的人口数、人口的性别比例、人口年龄构成、人口的城乡分布;某个企业产品的销售量、销售收入、成本构成、员工的平均工资、公司员工对管理层的满意程度;等等,都属于描述统计学的范畴。统计描述是科学管理的基础,只有对现象进行科学合理的描述,统计分析才会得出科学而又正确的结果。

2.推断统计学

推断统计学是研究如何根据样本数据去推断总体数量特征的方法。从统计学的概念中我们已经知道,研究如何搜集统计资料是统计学的一个重要内容,现实经济中很多调查对象的范围非常大,要搜集这些现象的资料就必须运用推断法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。这里所讲的总体就是指统计所要研究的对象,这里所讲的样本就是指按照某种原则从总体中抽取的部分单位。在现实经济生活中,总体的数据往往是无法取得的,或者说要耗费巨大的人力、物力、财力才能取得,在这种条件下,就必须用样本的数据来推断总体数据,这就属于推断统计学的范畴。关于总体和样本我们在后面还要详细介绍。

描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。在对现实问题的研究中,由于我们所获得的数据主要是样本数据,因此推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。

描述统计学和推断统计学并不是截然分开的,两者共同构成了统计学的完整体系。在统计数据收集、整理和分析中都具有十分重要的作用。如果没有描述统计搜集可靠的统计数据并提供有效的样本信息,即使再科学的统计推断方法也难以得出准确的结论。从描述统计学发展到推断统计学,既是统计学发展的巨大成就,也是统计学发展成熟的重要标志。

第三节 统计学中的基本概念

统计学中的基本概念较多,这些概念是对经济实践中一些具体现象的概括,其使用是为了更好地介绍统计学的基本理论。本节介绍一些较常用的概念。

一、总体和样本

在前述推断统计学的概念中,提到了总体和样本。所谓总体就是所研究的全部个体(数据)的集合,是统计学研究的对象。总体可以是一群人,也可以是物,可以把总体定义为所要研究的任何现象。明确总体的意义就在于合理界定所收集数据的范围,这是统计研究首要解决的问题之一,如人口普查就是收集人口的有关数据,其对象是“标准时点在中华人民共和国境内的自然人以及在中华人民共和国境外但未定居的中国公民,不包括在中华人民共和国境内短期停留的境外人员”,这就是收集人口数字(人口普查)的总体,这就是总体的确定。因为统计学是一门收集、分析、解释数据的方法论学科,任何数据的收集及分析都有一个范围的界定问题,只有数据收集范围的界定合理,在此基础上得出的结论才是科学的。

统计实践中,总体当中所包含的个体往往很多,要取得反映总体数量特征的数据往往由于时间、经费等的限制会显得很难,这就需要我们从总体当中选取部分单位进行测试,进而推断我们想要了解的总体数量特征,所选取的部分单位就是样本。样本是从总体中抽取的一部分元素的集合,构成样本元素的数目称为样本容量。从总体中抽取一部分元素作为样本,其目的是要根据样本提供的有关信息去推断总体的特征。例如,从市场上销售的某品牌羽绒服中抽取10件进行检验,这10件羽绒服就是样本,市场上销售的该品牌的所有羽绒服就是总体,抽样的目的就是用这10件羽绒服的合格率推断所有该品牌羽绒服的合格率。

二、参数和统计量

参数是用来描述总体特征的概括性数字度量,它反映的是总体的某种特征,如上例中所有羽绒服的合格率就是参数。参数通常用希腊字母表示。统计学中常用的总体参数有总体平均数,用μ表示,总体标准差,用б表示,总体比率,用π表示。统计量是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的,常用英文字母表示。统计学中常用的样本统计量有样本平均数,用珋x表示;样本标准差,用s表示;样本比率,用p表示。以上所讲的参数和统计量这两个概念的重要性主要体现在推断统计学中,无论是经济实践还是经济理论分析,我们常常关心的是参数,然而由于时间、费用等诸多因素的限制对参数直接进行调查是不切合实际的,所以,我们从总体中随机抽取一定的样本,计算样本统计量,然后推断总体参数值。推断统计学的基础就是在不对总体进行普查的条件下估计出总体的参数。例如,洗衣机制造商要测定新洗衣机在需要维修前每次洗衣的平均重量,这里的参数是维修前的洗衣重量以及均值,公司统计员从总体中抽取一定量的样本,计算每台洗衣机在维修前的洗衣重量和样本均值,这里的样本均值就是统计量,从而根据统计量估计出对应的总体参数。

三、变量

变量是说明现象某种特征的概念,是统计学借用数学的一个概念,所讲的变量其实就是研究人员所关心的经济现象,如“商品的销售额”“产品的质量等级”“城镇居民的收入”等。变量的具体数值称为变量值,如商品的销售额可以是20万元、30万元、45万元等,这些数字就是变量值。统计数据就是统计变量的某些取值。统计学中变量有以下一些分类:

第一,分类变量、顺序变量、数值型变量。分类变量是说明事物类别的一个名称,其取值是分类数据,如“性别”就是一个分类变量,其取值为“男”或“女”;“行业”也是一个分类变量,其变量值可以是“零售业”“旅游业”“汽车制造业”等;再比如,产品的品牌、饮料的类别、参加的社团都属于分类变量。有时为了方便数据的处理,会将分类变量的具体表现用数字表示,如将性别变量的具体表现男性标记为1,女性标记为2;在饮料的类别这个分类变量中,将可口可乐记为1,将健力宝记为2,这样标记仅仅是为了计算机处理,并没有任何大小或倍数的关系。顺序变量是说明事物顺序类别的一个名称,其取值是前述的顺序数值,如“产品等级”就是一个顺序变量,其取值可以是“一级品”“二级品”“三级品”“次品”等,“受教育程度”也是一个顺序变量,其取值可以是“小学”“初中”“高中”等,一个人对某种事物的看法也可以是以顺序变量,其变量值可以是“同意”“中立”“反对”等。数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,如“产品产量”“商品销售额”“零件尺寸”“年龄”“时间”等都是数值型变量,这些变量可以取不同的数值。

第二,离散型变量和连续型变量。只能取可数值的变量,称为离散型变量。离散变量只能取有限个值,而且其取值都以整数位断开,可以一一列举,如企业个数、设备台数等就是离散型变量。可以在一个或多个区间中取任何值的变量称为连续型变量。连续型变量的取值是连续不断的,如成绩、收入、长度、距离、温度等均属连续型变量。这类变量在理论上任意两个值之间都可能存在第三个值,比较而言,连续型变量提供的信息量大。

变量这一概念在统计学中经常会用到,多数情况下所说的变量主要是指的数值型变量,大多数统计方法也都是处理数值型变量的方法。变量的类型不同,所使用的统计分析方法也不同,分类变量和数值型变量的统计分析方法不同,连续型变量和离散型变量的统计分析方法也不同,这就是对变量进行分类的意义。

第四节 计算机在统计中的应用

随着现代科学技术的迅猛发展,人类社会已进入信息社会,信息量之大、范围之广、变化之快,使得传统的信息处理手段已无法适应经济高速发展对统计所提出的要求。计算机在统计中的应用解决了统计信息的储存、整理、分析和检索问题。计算机在统计中的应用,不但可以提高统计信息的搜集、整理速度,还可以及时、准确地将有关统计资料的参数如均值、方差、偏态等迅速地提供给使用者供分析之用,特别是对一些数据量较大、手工难以完成的工作,计算机更体现了它的优越性。

在应用统计方法的过程中,最大的困难有两个,一是要处理的数据多,结构复杂,计算量大。二是对于待解决的问题往往要进行探索性分析,也就是通过不同统计方法反复试验比较,寻找有效的综合性的处理手段。统计软件正是为了克服这两个困难而产生、发展的。由于统计软件适应了当代经济对统计的要求,因而备受重视。目前,统计软件的种类已经达到上百种,这里我们只简单地介绍几种应用广泛、比较重要的软件。

SPSS(Statistical Package for the Social Scicence,社会科学统计软件包)是著名的统计分析软件之一。1968年,3位美国斯坦福大学的学生研发了最早的SPSS统计软件系统,并基于这一系统于1975年在芝加哥合伙成立了SPSS公司。20世纪80年代以前,SPSS统计软件主要应用于企事业单位,迄今为止,SPSS软件已有40余年的成长历史,全球用户日益增多,它们分布于通信、医疗、银行、证券、保险、制造、商业、市场研究、教育等多个领域,是世界上应用最广泛的统计专业软件。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。其过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、时间序列分析等,其统计分析功能十分强大。SPSS名为社会科学统计软件包,这是为了强调其社会科学应用的一面,而实际上它在社会科学、自然科学的各个领域都发挥着巨大的作用。

SAS(Statistical Analysis System,统计分析系统)原来是由北卡罗来纳大学于1976年研究开发的软件包,数据处理功能较强。经过多年的完善和发展,SAS系统在国际上已被誉为数据分析的标准软件,在各个领域得到了广泛的应用。SAS统计软件的主要功能有描述统计、回归分析、方差分析、多元分析、聚类分析等。

MINITAB是数据分析软件包,发表于1972年。最初是为学生学习统计课程而设计的,以后逐步扩大到工程技术、社会科学、管理学等领域,凡需要组织数据与处理数据的场合都可以应用MINITAB软件。MINITAB软件的主要功能有数据的一般处理、作图、制表、方差分析、相关与回归分析等。除以上介绍的几种软件外,还有如Eviews、BMDP、Micro TSP等,这些都是专业的统计软件,它们的计算能力强大、提供的统计分析结果非常详尽,但其普及率却比较低,相对而言学习比较困难。其实在实践中,我们也可以用Excel来解决一些统计问题,虽然Excel并非归为统计软件,但对绝大多数学者而言,Excel在统计方面的功能已经足够用了,而且使用方便,也较容易掌握,所以本书介绍了Excel在统计中的应用。在Excel中,有关统计运算功能的使用主要有以下几种方法:

1.工具栏函数f(x)

在Excel工具栏的标题中可以看到“插入”按钮,点击该按钮之后在弹出的下拉式菜单中出现“f(x)函数(F)”,点击“f(x)函数(F)”,出现如图1-1所示的对话框。

在图1-1 f(x)函数(F)对话框中,点击“常用函数”右边的箭头,会出现如图1-2所示的对话框,然后点击“常用函数”下拉菜单中的“统计”功能就会出现如图1-3所示的对话框,该对话框中提供了计算均值、标准差等统计学中常用指标的计算函数。如果点击其中的某一个函数,相应地会在对话框的下方对该函数做出解释,图1-3中所点击的函数是计算平均差的函数,至于每个函数的具体运用方法我们会在以后相关章节中加以介绍。

2.数据分析

在工具下拉菜单中点击“数据分析”,在数据分析功能中有20多个统计函数,选择需要使用的统计运算函数,会有相应的对话框弹出,然后按照要求输入相应的参数就可以了。如果工具下拉菜单中没有“数据分析”,可点击“加载宏”,会弹出如图1-4所示的对话框,然后点击对话框中“分析工具库”再点击“确定”按钮就可以了,此时,打开工具下拉菜单,会出现“数据分析”选项。可将所有统计分析工具中一些较少用的函数安装进来,至于“数据分析”中统计功能的运用我们会在以后的章节中加以介绍。

图1-1 插入函数f(x)函数(F)对话框

图1-2 f(x)函数(F)中函数类别对话框

3.编辑公式进行计算

可在公式编辑栏或在某一单元格中直接编辑公式进行较为复杂的运算,公式编辑栏可以编辑的公式较长一些,而单元格编辑的公式则较短,公式的编辑必须以“=”开头。当在公式编辑栏或者一个空单元格中输入“=”时,Excel就认为在输入一个公式,接下来输入公式的全部内容即可。输入公式时,Excel支持的运算符如下:

图1-3 f(x)函数(F)中函数类别中统计功能对话框

图1-4 加载宏对话框

(www.xing528.com)

4.利用图表制作功能

有些模型的参数可以利用图表制作功能求得。当两个变量之间存在相关时,即可进行相关或者回归分析。在Excel中,可以在绘图结果中用“图表〉添加趋势线(R)…”计算回归方程中的参数及判定系数等。

【思考与练习】

一、判断题

1.离散型变量的取值可以是整数也可以是小数。( )

2.定类数据是级别最低的数据。( )

3.统计分析中的大多数方法可用于分析数值型数据。( )

4.把某一经济现象的数据用图表形式表现出来,这属于推断统计学的范畴。( )

5.定序数据不可以求和。( )

6.推断统计学的目的在于研究总体的数量特征。( )

7.Excel可以进行统计图表的制作、统计指标以及模型参数的计算。( )

二、单项选择题

1.统计所研究现象的全部称为( )。

A.总体 

B.样本 

C.变量 

D.变量值

2.调查人员从市场上销售的某品牌全部羽绒服中抽出10件进行检验,这10件羽绒服是( )。

A.总体 

B.样本 

C.定类数据 

D.定比数据

3.在Excel工具下拉菜单中安装“数据分析”功能的步骤是( )。

A.工具→函数 

B.工具→加载宏→分析工具库→确定

C.添加→数据分析 

D.添加→函数→数据分析

4.在Excel中编辑公式,必须以( )开头。

A.= 

B.+ 

C.- 

D.*

5.( )是用来描述样本数量特征的。

A.变量 

B.变量值 

C.参数 

D.统计量

三、多项选择题

1.下列现象中可以认为是离散型变量的现象是( )。

A.设备台数 

B.身高 

C.企业个数 

D.学生人数 

E.长度

2.统计数据按照计量尺度的不同可以分为( )。

A.定类数据 

B.定序数据 

C.定距数据 

D.定比数据 

E.定性数据

3.根据分析数据所使用的方法不同,可将统计学分为( )。

A.应用统计学 

B.理论统计学 

C.描述统计学 

D.推断统计学 

E.数理统计学

4.Excel中的加、乘、除号分别是( )。

A.+ 

B.× 

C.* 

D.÷ 

E./

5.下列哪两类数据统称为数值型数据( )。

A.定类数据 

B.定序数据 

C.定距数据 

D.定比数据 

E.定性数据

四、简答题

1.简要回答统计学的概念及统计学的分科。

2.按照确定数据的尺度不同,统计数据有哪些分类?这种分类有何意义?

3.什么是总体?确定总体有何意义?

4.请列举出几个从数据分析中得出现象变化规律的例子。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈