8.1.2 常用信息分析方法
我们获取的信息,不管是用于增长知识的自学,还是用于解决具体的问题或撰写各种类型的文章,一般要利用一些研究方法进行分析,然后加以利用。要从搜集整理好的信息中分析研究出更全面、更综合、更适用的高层次的全新信息,掌握科学的信息分析方法至关重要。随着科学技术的发展,人们采用的信息分析方法越来越多,越来越成熟。以下将简单介绍一些主要的信息分析方法。
8.1.2.1 比较法
俗语说,“不怕不识货,就怕货比货”,“货比三家不吃亏”,这说明了比较是一种很有用的方法。比较是对比较对象异同、优劣的判断。比较法根据参照对象的不同,可以有纵向比较,横向比较和纵横向比较几种形式。
纵向比较,又称历史比较,是对不同历史时期的同一对象进行比较,具有历史性、时间顺序性的特点。横向比较是把同类的不同对象在同一时期、同一标准下进行比较。纵横向比较是纵向比较与横向比较相结合的比较方法。
在信息利用中,有多种情况我们要利用比较法。当获得的同类信息多时,往往要利用比较法挑选出更可靠、更权威和更准确的信息;所获信息中同一主题的不同观点是否接受也需要比较;方案、方法等的优劣判断需要比较;纵向比较还可以获得事物的发展趋势结论,是信息升华和创新的方法之一。
运用比较法要注意的问题是比较对象要具有可比性。同类事物一般具有可比性,种类不同的事物在一定条件限定下,有时也具有可比性。比如,食物跟衣物通常是不可比的,它们的外在和内涵都完全不同,但在特定条件下,还是可以比较的。假如你处于一个特殊环境(食物和衣物放在不同的地方,时间只允许你拿到一样东西),这时你又饥又冻,你该拿什么呢?这个时候比的是什么?比哪个好吃,比哪个好看、耐穿都不可能,能比的是作用,即哪个物品更有利于你生存。技术、方法、产品和方案的选择可以使用比较方法。在比较中可以发现问题,也可以提出问题。在比较时,要抓住事物的主要方面,这样才不会失之偏颇;同时也要注意多项指标的比较,这样才能避免认识的局限性。指标和权重的选择是由目的决定的,同时还会受到信息不对称的影响。比如说选择投稿刊物,若想早点发表,则期刊出版频率和发稿周期是选刊重点。企业招聘人员,由于受到信息不对称影响,文凭自然成为主要的比较指标。企业人员的提拔,由于领导和候选人之间信息基本对称,文凭就不一定是最重要的指标,实干能力将成为主要指标。
对各有千秋的同类事物进行比较时,可以对比较的指标进行量化,也可设置指标权重,分别打分、求和,然后对总和进行排序,分出优劣,高等学校的排名用的就是这种方法。
比较法的一个致命缺点是容易造成思维定式。思维定式的优点是可以提高解决同类问题的能力和速度,缺点是妨碍创造性思维,有时还会造成错误。经常做技术改造的人,脑子里想的是如何提高现有产品的性能和质量,即使产品性能已经很难有提升空间了,也可能不会去设计全新的产品。因此,我们在使用比较法时,如果比来比去都没有满意的方案(产品),就要突破思维定式的束缚,选用全新的替代方案(产品)。
8.1.2.2 分析综合法
分析是把整体对象分解为组成部分,把复杂的事物分解为简单要素分别进行认识和研究的思维方法。综合是把对象的各个部分、各个方面和各种因素在整体环境中进行考察,研究各部分之间的关系和协同作用,获得整体认识的方法。二者是辩证统一的。文献的加工与检索实际上就是分析和综合的过程。分析过程是揭示文献的内容特征(主题词、关键词、分类号等)和形式特征(题名、责任者、版本、出版年、物理形态等),综合是用若干检索词进行检索直至获取文献的过程。在企业中,综合法是把企业有关的各个要素(原料资源、人力资源、销售渠道、企业产品开发等)结合起来考虑,从错综复杂的现象中探索它们之间的相互关系,从整体的角度把握行业的本质和规律以及企业未来发展情况,通观行业发展的全貌和全过程,以便更好的制定企业发展方向、竞争战略和具体计划的一种逻辑方法。
复杂任务的分解和整合,如合著图书的章节划分与分工以及统稿,可以运用分析综合法。受多因素影响的事物的研究,从信息范围确定到信息分析都要使用分析综合法,如边境地区文化研究,析出的因素可以包括古代传统文化的传承、邻国文化的影响、外来人口(婚嫁、游客、外来劳工)的影响、现代媒体的影响等。
8.1.2.3 分类法
分类是按属性异同将事物区别为具有一定从属关系的部分,形成各种概念系统,从而反映客观世界中事物的区别和联系。
分类是各门学科研究的一种基本方法,因为科学总是要把无数的事实经过整理加工提升为理论,整理的过程就要借助分类方法。在信息分析过程中,研究内容的划分、问题的思考、考察结果的表述以及信息分析的许多方法,如分析综合法等的运用都是以分类作为基础的。再比如,层次分析法的核心就是把问题层次化,再根据问题的性质和要达到的目标,把同一层次的问题分解为不同的要素,这都是与分类密切相关的。
分类与统计相结合可以获取隐含的信息和揭示存在的问题。例如图书馆对咨询问题进行不同的分类统计可以掌握咨询高峰期的时段分布,并了解读者最关心的问题。而咨询量最多的某些问题,则很可能就是图书馆工作的薄弱环节。又如对学生考试情况进行分类统计,也可以获得哪些内容学生掌握得好,哪些内容掌握得还不够的信息。
8.1.2.4 头脑风暴法
头脑风暴法是一种典型的创造性思维方法,指无拘无束、自由奔放地思考问题的方法。在一个偶然的场合,某人由于受到外界事物的启发而突然萌发出一个富有创见的想法,或是找到了解决某个问题的办法,这是个人头脑风暴。很多专家学者集中在一起,就某个问题展开讨论,多提方案建议,少争论,相互启发,相互补充,往往可以产生出许多有创见的思想火花和大胆的设想,这是集体头脑风暴。显然,无论哪种方法都只能是用来诱导和捕捉思维的灵光,要想得到最终的决策,还需运用逻辑的和数学的方法进行严密论证。
集体头脑风暴法以8~12人为佳,一般由主持人、献策人、记录员、纪检员和喝彩员组成,至少需要前面三类人。人数太少,激发思维的程度不够;人数太多,说话不切题的情况会增加。时间20—60分钟为佳,时间过短,头脑不够兴奋;时间过长,容易疲惫。需要营造轻松的开会气氛。主持人要宣布规则,如不批评、不考虑可行性、鼓励借鉴与发展等。纪检员发现有人忘记规则,立即给予提醒与制止。喝彩员负责活跃气氛——为每个献策者发言后叫好,并带领其他人一起鼓掌。
个人头脑风暴法要学会寻找获得灵感的方法。我们知道鲁班发明锯子用的是仿生法,他是被野草叶子划伤后获得的灵感。作家、画家是从体验生活中获得创作灵感,科学家可能在苦思冥想后从睡梦中获得灵感。那么,灵感的获得究竟有没有规律呢?获得过灵感的人曾经说过:“得之于顷刻,积之于平日。”“灵感是对艰苦劳动的奖赏。”要想获得灵感,就要长期探索,积极思考;劳逸结合,有张有弛;不怕犯错,乐于交流;随时想到,随手记下。
现举一个利用个人头脑风暴法由外来信息与大脑中已知知识相结合获得撰写科技文章主题的例子。原始信息是:
a.测量工业钣金件上规则排列圆孔中心位置的误差数据。
b.在影像中钣金件的圆孔变成了椭圆(肉眼可以看出)。信息分析结果是:
a.正、负误差的数量严重失衡(一眼就可以看出)。
b.由于摄影时主光轴不垂直于钣金件,因此圆孔变成了椭圆,测量圆孔中心的坐标变成了测椭圆中心的坐标。已有知识是:测量误差符合正态分布规律,即正、负误差的数量大致相等。
就在有关信息进入大脑的时候,研究者脑中就闪现出一个念头:是不是椭圆的中心不跟圆的中心对应?经过研究证实了这个想法,并找出了两圆心偏差在各处的分布规律。通过推导化简获得了计算各处偏差的简单公式。最后形成了“圆形标志及其椭圆构像间中心偏差的确定”的文章。
8.1.2.5 相关法
相关法是利用事物之间存在的内在的和现象上的联系,从一种或几种已知事物推断未知事物的方法。(www.xing528.com)
事物的内在联系有多种表现形式,如因果关系、共生关系和依存关系。动物对天气变化和自然灾害来临之前都有感应和表现,因此人类可以利用动物的异常表现提前预知天气变化和地震等灾害的发生。大雪意味着丰收,即所谓的“瑞雪兆丰年”。有因就有果,有果必有因。毒蛇出没的地方,必有治疗蛇毒的神奇草药,有所谓“毒蛇出没之地,七步之内必有解药”之说。这是共生关系的相关分析。“一荣俱荣、一损俱损”说明了事物之间含有共同利益,互相之间存在依存关系,因此依存关系也可用于相关分析。
相关法中最有研究价值的是找出事物之间隐藏的关系。用于此目的的热点技术是数据挖掘技术(Data Mining)。尿布和啤酒的联系就是用数据挖掘技术发现的。此发现已用于美国沃尔玛连锁店尿布和啤酒的销售,即把尿布和啤酒摆在一起销售。结果两者的销量大增。沃尔玛利用NCR数据挖掘工具对公司原始交易数据进行挖掘,发现跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在“尿布与啤酒”背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。
风俗习惯和一些比较稳定的现象也能用于相关分析。我国最著名的“照片泄密案”,是1964年《中国画报》封面刊出的一张照片。大庆油田的“铁人”王进喜头戴大狗皮帽,身穿厚棉袄,顶着鹅毛大雪,握着钻机手柄眺望远方,在他身后散布着星星点点的高大井架。日本情报专家据此解开了大庆油田的秘密,他们根据照片上王进喜的衣着判断,只有在北纬46度至48度的区域内,冬季才有可能穿这样的衣服,因此推断大庆油田位于齐齐哈尔与哈尔滨之间;并通过照片中王进喜所握手柄的架势,推断出油井的直径;从王进喜所站的钻井与背后油田间的距离和井架密度,推断出油田的大致储量和产量。有了如此多的准确情报,日本人迅速设计出适合大庆油田开采用的石油设备。当我国政府向世界各国征求开采大庆油田的设计方案时,日本人一举中标。
8.1.2.6 预测法
预测法是根据现有信息资料推知未来情况的方法。能用严密的数学公式表达的由已知求未知的过程只能算求解,不能算预测,如给你一个有序数列,空1位数要你填空。由于很容易就可以判断它是等差数列、等比数列或别的规律,要填的数是唯一的和肯定的,因此不能算预测。
将某种统计指标的数值,按时间先后顺序排列成数列,根据它反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平,这种预测称为时间序列预测法。时间序列预测法可用于短期、中期和长期预测。根据对资料分析方法的不同,时间序列预测法可分为:简单序时平均数法、加权序时平均数法、移动平均法、加权移动平均法、趋势预测法、指数平滑法、季节性趋势预测法、市场寿命周期预测法等。下面选择几个简单的进行介绍。
简单序时平均数法也称算术平均法。即把若干历史时期的统计数值作为观察值,求出算术平均数作为下期预测值。这种方法基于下列假设:“过去这样,今后也将这样。”把近期和远期数据等同化和平均化,因此只能适用于事物变化不大的趋势预测。如果事物呈现某种上升或下降的趋势,就不宜采用此法。
加权序时平均数法就是把各个时期的历史数据按近期和远期影响程度进行加权,求出平均值,作为下期预测值。
简单移动平均法就是相继移动计算若干时期的算术平均数作为下期预测值。现在许多股票交易软件都使用这种方法。时间通常设为5日、10日、20日、30日、60日、120日等,用户也可以自我设置。用户可根据当日的动态价位处于这些平均线的相对位置,判断买点和卖点。
加权移动平均法是将简单移动平均数进行加权计算。在确定权数时,近期观察值的权数应该大些,远期观察值的权数应该小些。
季节趋势预测法是根据经济事物每年重复出现的周期性季节变动指数,预测其季节性变动趋势。
对于预测法我们还要注意一个问题,即如果可以通过技术手段改变未来的可能预期结果,则可以不一定用预测法来预测未来的结果和选定相应的方案。
8.1.2.7 假设检验法
假设检验法在数学中是对未知参数的数值提出假设,然后利用样本提供的信息来检验所提出的假设是否合理。假设检验法通常要经过理论—假设—观察—验证过程。假设被证伪,就要修正或推翻原有理论,发展新的理论,并重新假设。假设被证实,就可以用假设去解释有关的现象。在信息分析中,假设的是造成某一结果的可能原因。遇到这种情况,需要把造成这一结果或形成这一现象的原因找出来。利用这种方法首先要排除完全不可能的原因,缩小排查范围,减少工作量。
某博士生在《武汉大学学报·信息科学版》上发表的一篇文章没有被EI(工程索引)数据库收录,现要查明没有被收录的原因。现在运用假设检验法来确定原因。
一般来说,文章不被收录的可能原因有如下三种:
(1)文摘太短,不能充分揭示文章的内容,向读者传递的信息量不足。
(2)文章的主题不在数据库的收录范围之内。
(3)文章的学术价值不足于收录到数据库中。
很显然,第二个原因很容易就可以排除掉。第一个和第三个原因有待查证。2006年该刊有8期全部收录,在其余4期中,每期只有1~2篇没有收录。现将该刊2006年全年未收录的文章为样本,重点关注文摘字数和文章主题。有关数据见表8.1。
先分析第三个原因,即学术价值不高。一般而言,数据库的数据加工人员专业水平不会高到可以评价一篇文章的学术价值,而且也没有这个时间。他们能做的只是粗略的判断,即某专业学术刊物上刊登的本专业文章,可以认为是有价值的,相反,如果刊登的是其他专业的文章,学术价值就值得怀疑了,尽管不排除也有学术价值高的。从表8.1的篇名可以看出,这些未被收录的文章都属于测绘科学的内容,因此可以排除第三个原因。现在来看第一个原因。从表2知,未被收录的文章的英文摘要都非常短,最少的26个单词,最多的才32个。文摘短是它们的共性,无一例外,因此可以确定文摘太短,不能传达足够的信息,是文章没有被数据库收录的原因。当然,这个时候可以提出这个原命题(文摘太短不收录)的逆否命题:收录的文摘都不会太短。快速浏览EI纸本刊就会发现,被收录文章的文摘都在3行以上。这也从反面证明了文摘短是上文没有被EI收录的原因。
表8.1 未被EI数据库收录的文章情况
8.1.2.8 专家调查法
专家调查法也称特尔斐法,是兰德公司首先采用的方法。该法的要点是在调查题目确定之后选定要调查的专家名单,然后将调查提纲以及背景材料等分别寄给选定的专家,让专家作答。在收齐专家意见后,将结果作为参考资料再寄给专家,让专家修改、补充自己的意见,做第二次书面回答。这种方法的好处在于能给专家比较充裕的时间查资料,也有参考别的专家(匿名)观点,重新修改意见的机会,因此,所提的意见比现场一次性调查所得更可靠、更有价值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。