第六节 概念外延划分的技术
一、人们需要外延划分的技术
为了得到准确的概念,我们在起名称、下定义、做划分三个方面都不能马虎,现在之所以又单独花一些篇幅进一步谈外延的划分技术,主要基于两个原因。
第一个原因是,我们发现长期以来,起名称、下定义的难度没有明显的变化,而随着人类社会的发展和进步,人们的感知范围在日益扩大,概念的外延也在不断扩大,这就给确定划分对象以及细分划分对象带来了越来越多的困难。我们需要一些确定划分对象以及细分划分对象的专门技术。
第二个原因是,过去那种主要依靠自然法则来自发调节人与人以及人与自然的关系的做法,代价和成本越来越大。人类社会的发展越来越需要人们观察宏观现象和发现宏观规律,并依据所发现的宏观规律积极主动地去调整人与人以及人与自然的关系。通常情况下,宏观现象的外延都超出了人们直接的感知范围,要想用我们有限的感知能力去观察宏观现象,我们也需要一些确定划分对象以及细分划分对象的专门技术。
例如,在早期,商品概念的外延仅仅包括粮、布、铁器等可数的若干类,每一类也只有可数的几个品种,我们可以全部罗列,悉数观察,寻找共同特征。在当代,商品概念的外延已达数十万个品种,不要说悉数观察了,就是罗列也罗列不完。
如果我们尚未真正认识到这种变化,并努力想出科学办法去应对,我们就会在不知不觉中犯一个大错:我们有可能会用感知到的一小部分事物去充当更大一群事物的代表。如果用能感知到的一小部分事物的共同特征作内涵,其外延本应该是那能感知到的一小部分事物,而我们却经常毫不犹豫地把更大一群的事物当作这个内涵的外延。我们毫不犹豫的理由仅仅是我们没有能力罗列那么多,观察那么多!这理由似乎正当,但静下心来想想就不是那么回事了,它顶多只是做不来的理由,而不是做得对的理由。
例如,你是一位泰国航空公司的飞行员,在你的生活和工作环境里交往最多的女人就是空姐。你观察了一个空姐,发现细心温顺是她的特征。你又观察了你接触到的80位空姐,发现她们都有细心温顺的特征。这时你开始在潜意识里给这80位空姐下定义了:除了生理特征,她们的内涵还包括一个共同的社会特征,那就是细心温柔。但遗憾的是,同样是你的那个潜意识,十有八九会把细心温柔的内涵毫不吝惜地给了全世界所有的空姐,甚至所有的女人。如果偶然遇见一位不那么细心温柔的空姐、女人,你反倒诧异!我们很清楚,你当然没有条件和能力去观察全世界所有的女人,甚至所有的空姐,但你不能因此就无条件地将那80位空姐的特征当成全世界所有的空姐甚至所有的女人的特征。
我们举的这个例子是生活中的小问题,即使你和多数人一样完全忽略这个思维错误,你的生活和工作也不会受到显著影响。但不幸的是,在一些重要问题上,类似的错误同样比比皆是。例如,在历史上的宫廷政治斗争中常见的一个词叫“清君侧”,意思是想办法把其他政治派别的官员从皇帝身边清除掉,换成自己政治派别的人。通常情况下,某个政治派别“清君侧”的主要目的不是为了架空皇帝以篡夺帝位,而是为了控制皇帝的信息来源,使皇帝寻找事物共同性的归纳思维都建立在选择性信息的基础上,从而达到间接左右皇帝决策的目的。皇帝久居深宫,能直接感知的现象很有限,二手信息是他发现事物本质的主要依据,但他从少量二手信息出发形成的决策却有广泛影响力。如果皇帝接收的全部二手信息都是经过某个政治派别在众多信息中有意挑选出来的,那么用不着“苦谏”、“死谏”,皇帝的决策就难免以偏概全,以点代面,这样的决策也就总会有利于该政治派别。
在现代海量信息社会,即使不使用控制信息来源的办法,也有三种情形容易引起人们对现象的选择性注意:
一是利用人们的猎奇心理,选择与常态有较大反差的现象。例如,全球首富比尔·盖茨宴请中国国家主席胡锦涛时只有四个简单的小菜,与国人的设想有较大反差,立刻就引起关注。再如,公司员工向管理层提合理化建议的现象,人们已经见多不怪,但是,如果一个清洁工也有理有据地向经理提出改进市场营销的建议案,立刻就会引起管理层的注意。据说就有人利用这个规律进入了他理想中的公司,并逐步谋取了理想中的职位。
二是摸清人们的心理动态,选择与他的当前需要有关的现象。例如,在平时,铺天盖地的房屋广告信息丝毫未能引起我们的关注,但是,当我们产生了购置房屋的强烈欲望并具备了购置房屋的购买力时,我们就会痴迷于到处收集与房屋相关的信息。再如,一些聪明的企业家充分认识到,在互联网时代,将有越来越多的人会习惯于主动收集与当前需要有关的信息,为宣传产品和建立良好企业形象,他们对互联网关键词的搜索工具空前重视,想尽办法让所有相关的关键词的搜索页面出现更多的对企业有利的信息。
三是细分信息受众,对不同的偏好群体提供不同的现象信息,偏好者会对他偏好的信息强烈关注。例如,球迷已经不满足于对球赛的关注,他们还会对每个球员的婚姻、家庭,甚至衣着、发型都充满兴趣。
我们也承认,当我们实际形成概念时没有能力罗列那么多、观察那么多,我们每个人或多或少都有对现象选择性注意的缺陷,可我们必须要问:当我们的确需要用小外延去充当大外延时,当我们的确需要选择性注意时,除了那种强盗式的做法,还有没有更科学一点的办法?非常幸运,数学和统计学让我们在这个问题上向前迈出了一步。
数学、统计学为我们正确划分外延提供了技术工具。为循序渐进,在基础级别的抽象思维方法训练中,对集合和统计学应用的介绍仅仅限于集合对外延的描述方法和统计学的随机抽样方法,至于计算、模型等更深的内容,在高等级别的抽象思维方法训练中会有所涉及。
二、集合技术
我们已经知道明确概念的外延是明确概念本身的一个重要方面,但是困难在于,有些概念的外延数量庞大,怎么表达出你已经明确了的外延?文字语言可以比较清晰地表达概念的内涵,文字语言表达概念的外延却非常困难。幸运的是数学在一定程度上帮我们解决了这个表达外延的难题。
从数学的角度看,我们把外延的全部整体叫做一个集合,组成一个集合的那些具体事物(一个个外延)叫做该集合的元素。显然,有些集合只有有限数量的元素,有些集合则有无穷数量的元素。集合是又一种描述概念外延的方式,前面的一些关于概念外延的规则和规定,同样适用于关于集合及其元素的规定,尽管描述的语言有所区别。例如,一个集合中的元素必须是互不相同的事物,同一个事物不能算做一个集合的不同元素,等等。
我们引入集合和集合元素的概念,首先是因为它能更简洁地描述和比较各个不同概念的外延,而不用啰嗦地说一大堆。当然,以后还会提到,数学还能通过集合运算帮我们准确确定概念与概念之间的关系。
如果一个元素a是一个特定集合A的元素,我们就说a属于A,记作a∈A;如果a不属于A,记作a∈A。对于有限元素的集合来说,我们可以把全部元素在{}里一一列出来,并用空格一一分开。如果这有限数量的元素列出来也较长,你可以在倒数第二个元素的位置用“…”代替你想省略的一些元素,例如集合{a1,a2…an}。如果是无穷数量的元素组成的集合可表示为{a1,a2……}。需要稍加提醒的是,如同一个概念可以是另一个概念的外延一样,一个集合也可以是另一个集合的元素,例如,学生的集合可以是以班为元素来组成的,而一个班又可以以这个班的全体学生为元素来组成。另外,只有一个元素的集合不能简单地认为这个集合就等同于这个元素,例如,某中学的校长这个集合只有李先生一个元素,某中学的校长这个概念不等于李先生这个概念,但某中学的校长这个概念的外延等于李先生,也就是某中学的校长这个集合等于李先生,因为我们把集合定义为概念的全部外延。一个事物可以是多个不同概念的外延。但这个事物不完全等同于任何一个概念。
用集合描述概念的外延,也存在无法全部罗列出来的问题,如无穷集合{a1,a2……}等,但比起用语言描述的外延,它的表达方式更能提醒我们外延数量庞大,归纳内涵时不一定关照了全部外延,要随时准备结合更多外延来修正内涵,或者明确意识到我们归纳的规律只在特定的较小的范围内有效。(www.xing528.com)
三、随机抽样调查技术
现在我们再介绍统计学在确定概念外延方面的应用。
从统计学的角度,我们把对具体事物的感知、观察称作调查,这个概念增加了我们感知时的目的性,减少了感知时的随意性。当我们意识到我们是在做调查时,就会更加郑重其事地去感知事物,而不是走马观花和随心所欲地去感知事物。
我们把需要观察的全部外延称作调查总体,例如中国妇女健康状况调查,作为中国妇女全部外延的每一个成年中国女人共同构成了调查总体。
如果我们有条件对全部外延中的每一个具体外延进行观察和记录,以归纳共同特征和规律,我们就是在进行全面调查,例如人口普查、企业经营状况普查等。
如果调查总体庞大,我们的时间、金钱有限,只能选部分外延事物进行观察和记录,我们就是在进行抽样调查,进行抽样调查时所选中的那一部分外延称作样本。例如,一个企业想知道北京消费者对其新产品的评价,它做不到对一千多万人一一征求意见,它按一定标准挑选了一千人进行问卷调查,这种调查就是抽样调查,选中的那一千人就是样本。
如果我们想把对样本进行观察和记录而总结出的特征和规律用于全部外延,我们就是在进行总体推断,例如企业将那一千个样本对新产品的评价当作全部北京消费者对新产品的评价,就是从样本出发的总体推断。
总体推断的效果有优劣之分,首先可以肯定的是,我们前面提到的随意的、习惯性的“用一小部分事物去充当更大一群的事物的代表”,是代表性最差的总体推断。
更进一步讲,总体推断的优劣首先取决于样本对总体的代表性的强弱,而样本对总体的代表性的强弱又取决于从全部外延中选取样本的抽样技术;抽样技术分为非随机抽样和随机抽样。
非随机抽样包括任意非随机抽样、判断非随机抽样等,它经常导致样本对总体的代表性较弱,进而产生误差很大的总体推断。例如,前面例子中的泰国航空公司的飞行员,无意识中将自己随意接触到的80位空姐作为全部空姐甚至全部女人的样本,就是任意非随机抽样。再如,前面例子中的搞“清君侧”的一帮奸臣,有意地将经过挑选的信息作为全部信息的样本,就是判断非随机抽样。
我们推荐的是更科学一些的随机抽样技术。与非随机抽样相比,随机抽样使样本对总体的代表性大大增强,是我们进行抽样调查时的首选。随机抽样技术包括简单随机抽样、等距随机抽样、分层随机抽样、分群随机抽样等。
标准的简单随机抽样的做法是:先将全部外延事物编号,然后在数学手册中找到随机数表,从随机数表中的任意一个数码出发,按照行或列选出与拟选样本数量一样多的数码,与被选中的数码编号相同的那些外延事物就是选中的样本。这种最原始、最简单的随机抽样的一大好处是,每一个外延被选中的机会完全均等,主观意识影响选择过程的可能性完全被排除。前面例子中提到的泰国航空公司飞行员和“清君侧”的情形就能避免了。
后来人们发现,简单随机抽样虽然具有机会完全均等和排除主观影响的优点,但有时并不意味着所选样本的代表性最强。例如,你想调查一个学校全体5000名学生的平均身高,你准备抽取50个样本,如果你使用简单随机抽样的方法,一定能排除该学校营养师人为提高身高数据以显示工作成绩的企图,也一定能排除长期接触高个头学生的篮球队教练凭感觉对全校平均身高的误判,但是,简单随机抽样仍不能保证50个样本的代表性。如果抽取的50个样本中45个都是女生怎么办?如果抽取的50个样本中46个都是男生怎么办?几乎全部用男生的平均身高代表全体学生的平均身高,或者几乎全部用女生的平均身高代表全体学生的平均身高,误差真的不见得比非随机抽样小多少。的确存在这样的可能。所以我们说,简单随机抽样虽然完全放弃了主观性,但取而代之的是完全由老天爷掌控的运气,运气不好同样不能保证样本达到理想的代表性。
经过探索,人们稍稍放松了一些对客观均等性的要求,稍稍加入了一些主观性,发明了分层随机抽样、分群随机抽样、等距随机抽样。
分层随机抽样是,当总体中的各个事物从某一个典型特征看存在明显差异,就先按这个特征对总体进行分层或分组,将准备选取的样本数量按比例分给各层或各组,再在各层或各组按分到的样本数进行简单随机抽样。例如,上面那所学校的5000名学生从性别特征看身高有明显差异,假设有3000名男生,2000名女生,即性别比为3∶2,我们决定按照3∶2的比例分配样本,在男生中抽取30个样本,在女生中抽取20个样本,总样本数仍为50。算出这50个样本的平均身高,用来代表5000名学生的平均身高,样本对总体的代表性就强,误差就小。
再如,税务部门为了提高企业所得税征收的科学性,需要对各个企业的可计入成本的招待费占总销售额的比率进行摸底调查,这样才能科学制定企业可计入成本的招待费的最高限额,既照顾到企业经营的需要和避免加重企业负担,又防止企业滥摊成本致使国家正常税收流失。问题是企业因规模不同,招待费占总销售额的比率差异明显,如果随机抽取的样本中小企业过多,调查结果就不能真实反映大企业的情况,反之,就不能真实反映小企业的情况。这时税务部门往往先在大、中、小企业之间分配样本数,再分别进行简单随机抽样。分配样本数的比例,有时是按照全部大、中、小企业的数量比例来确定,有时是按照大、中、小企业以往交纳税收的比例来确定,具有一定的主观目的性。
分群随机抽样是,当总体中的各个事物在地域上非常分散而调查经费和时间有限,或者对总体列出全部抽样编码信息非常困难,就先将总体按地域等标准分成若干个群体,然后用简单随机抽样办法抽取群体样本,最后在选中的群体中进行普查或进一步的抽样调查。例如,想在全国100个中等城市中选取10万人进行消费行为调查。如果直接做简单随机抽样,样本可能分布在全国各地,费用和时间耗费巨大,并且为了抽样需要对100个中等城市的全部消费者按姓名编码,信息采集工作繁重。如果我们采用分群随机抽样,情况就不同了。我们把一个城市看作一个群体样本,先在全国100个中等城市中用简单随机抽样办法抽取10个群体样本,再在这10个城市中随机抽样选取10万人作为调查样本,这样费用、时间、信息量都会大大减少。
等距随机抽样是分层随机抽样的一种特例,就是先将总体的每个事物进行序列编号,再把编号按相同距离分成若干号码段,在第一号码段按简单随机抽样办法选取一个样本,记下这个样本在第一号码段的排序号,最后在其他号码段都分别选取一个与第一个样本具有同样排序号的样本。例如,我们想在100个学生中抽取10个样本,先把100个学生分成10个学习小组,每组10人,然后在第一组中用简单随机抽样办法抽取一人作为样本,比如抽到了编号为5的同学,最后我们就把编号为5、15、25、35、45、55、65、75、85、95的10位同学作为选取的样本。等距随机抽样的好处,一是使抽样操作简化了,只需在第一个号码段进行抽样操作即可;二是保证每个号码段都有一个样本代表,避免了样本集中于某一个号码段的可能。
【注释】
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。