我有幸在1978年10月考入华东师范大学,攻读数理统计方向的硕士学位研究生,导师是魏宗舒教授与茆诗松教授。看到我们这几个学数学的学生对统计的理解是那么肤浅,魏宗舒教授当机立断给我们上小课。他和我们围着一个办公桌而坐,带领我们漫游统计。魏宗舒教授与茆诗松教授都一再对我们说,学好统计最重要的是要有统计思想。他们讲解统计思想的含义,我们好像听懂了,但要讲那是讲不清楚的。正如著名教育家和现代作家叶圣陶先生所说的,“然而学生还是似懂非懂,教他们回讲往往讲不出来。”两位老师也知道我们对统计思想的理解顶多一知半解,但并不着急。魏宗舒教授告诫我们,“如果能亲临实际做一两次数据分析,那对数理统计的领会就会更深了。”他们都要求我们通过实践领会统计思想,看来统计思想是要慢慢悟出来的。茆诗松教授动情地告诫统计系的毕业生,你们要爱数据,要像爱你们的恋人那样爱数据。
王静龙
说到统计,大家不约而同地都会说统计是归纳推理.由此大家可能会联想到"盲人摸象",统计使用归纳推理是否以偏概全.事实上,归纳推理有其不确定性,是或然性推理,但统计使用归纳推理可以做到很可靠,并不是以偏概全.
我国大型权威工具书《辞海》指出,“科学:运用范畴、定理、定律等思维形式反映现实世界各种现象的本质和规律的知识体系.”显然,统计是科学,而这正如《中国大百科全书·数学卷》所说的,“统计学是一门科学,它研究怎样以有效的方式收集、整理、分析带随机性的数据,并在此基础上,对所研究的问题作出统计性的推断,直至对可能作出的决策提供依据或建议因为统计是科学,所以它需要逻辑思维、演绎推理和实证研究.它的实证研究包括观察、调查与实验等.此外统计还需要形象思维.
正因为如此,英国的《不列颠百科全书》给了统计一个简单明了并且形象生动的定义:
统计是收集和分析数据的科学与艺术
初看到这句话,感到很高兴,统计与音乐、美术一样,也可以欣赏,有魅力;同时感到很新奇,统计为什么说也是艺术.
我国已故著名统计学家、中国科学院院士陈希孺教授(1934~2005)在其著作《统计学概貌》中说,“称统计学是艺术,尽管有其不够严谨之处,却也有独到的地方:它提醒人们,统计学并不是一堆在应用时可以机械地照搬的公式,而是在应用上要发挥灵活性以至灵感,需要积累充分的经验.”陈希孺院士在他的另一本著作《数理统计学简史》中说,“这里强调它的艺术性,是为着重说明统计方法需要灵活使用,很依赖于人的判断以至灵感.强调这一点很有好处,它提醒人们不能以教条式的态度来看待数理统计方法,以为只要记住一些公式与方法,碰到什么问题套上去就行.”
总之,按陈希孺院士所说的,这里的“艺术”着重强调统计方法的使用与创新很依赖于人的判断、灵活性以至灵感,不能机械地照搬公式.看下面轰炸机的什么部位应加固防护的例子.这个例子摘自《统计数据的真相》.
灵感,创造性思维
瓦尔德(1902~1950),罗马尼亚裔美国统计学家.他出生于罗马尼亚,1931年在维也纳大学获得博士学位,1938年到美国.众所周知,军工产品的成本比较高,且其检验通常是破坏性的,检验过后的军工产品就没有用了.在军工产品的生产质量得到保证的前提下,尽可能减少抽检的军工产品个数,这是第二次世界大战期间统计学家所面临的一项迫切需要解决的问题.瓦尔德首次提出了著名的序贯检验法,用于军工产品的检验,既保证了军工产品的质量,又减少了抽检的军工产品的样本数.序贯检验法在第二次世界大战期间是军事机密.大战过后序贯分析方法得到很大的发展,是统计学的一个重要分支.
图1.1 飞机轮廓及弹孔位置
大战期间美国军方为使得他们的轰炸机能避开德国的防空炮火,研究了以下两个问题:轰炸机的哪一部分最经常被击中?轰炸机的什么部位应该加强钢板增加装甲防护?瓦尔德研究了返航轰炸机上的弹孔位置.他画了飞机的轮廓,并标示出弹孔位置(图1.1).图1.1的正方形黑点表示返航的轰炸机机身上所受到的德军防空炮火的袭击标记.根据这张图,可以看到炮火袭击几乎均匀地分布在轰炸机的各个部位,就是机身的中间有一个长方形的区域没有弹着点.这是为什么?难道这块地方不会被击中?瓦尔德指出,恰恰是这个地方需要加固补强.因为这个位置既处于德国高射炮的正面攻击,而且又是轰炸机的油箱所在,一旦被击中飞机就回不来了.
看来,统计学家解决问题也需要逆向思维.
有些统计问题,不妨反过来思维,或许就是另一片天空.瓦尔德看着这个图所引起的想象力和创造力,打破常规,向相反方向去思考,完美地解决了问题.统计实践需要很多技巧,需要经验的积累与领悟,因此统计是一门富有想象力的学科.
图1.2 菲克错觉图
错 觉
错觉是指不符合客观实际的错误感觉.图1.2为菲克(Fick)错觉图,垂直线看上去比水平线长,事实上它们是一样长的.其原因就在于眼睛做上下运动比做水平运动困难一些,看垂直线比看水平线费力,所以垂直线看起来就长一些.统计分析也能利用图使人产生错觉,见《统计数据的真相》以及《怎能利用统计撒谎》.它们都用很多事例说明,数字通过图的美化弯曲,使人们受到迷惑,因此很容易形成错觉.这类错觉往往是为了达到某种目的、人为操作而形成的.此外,统计中还有很多的错觉,是在数据分析的过程中不知不觉地形成的.
没有最好,只有更好
艺术基本上是形象思维.一般来说,人的音乐、绘画、语言表达、情感、知觉、想象等功能属形象思维.形象思维离不开直感、联想与创造性.同一个事物的形象可表达为不同的艺术形式.
例如,某位摄影师说,他们去遥远的山寨采风,有人将所拍的一组摄影照名曰《苦难岁月》,有人将随后举办的摄影展唤作《世外桃源》.看来,人生的许多苦乐,似乎不在于你的处境,而在于你的心境.心境决定了一个人看待境遇的角度.又好比说画画,同一个景色在不同的画家的笔下会呈现不同的意境.唱歌也是如此.同一首乐曲,可以用钢琴演奏,也可以用小提琴、二胡演奏,还可以用口哨演奏;同一首歌可以民族唱法,也可以美声唱法,还可以通俗唱法.事实上,歌曲体现的意境与歌手以及观众的心境有关,不同环境下听同一首歌曲的感受很可能是不一样的.统计学也有这样的情况,同样的信息可以用不同的方式来描述;同一个问题可以有众多不一样的解法.不同的人处理分析同样一组数据,很可能使用不同的方法,得到不尽相同的结论.
本文摘编自王建龙著《统计思想欣赏》( 责编:陈玉琢)前言及第一章,内容有删减。
统计思想欣赏
王静龙 著
北京:科学出版社,2017.03
ISBN 978-7-03-051947-4
统计思想是统计理论与方法的想法. 《统计思想欣赏》试图讲述这些想法的统计所固有的本质属性. 统计思想主要体现在科学与艺术、归纳与演绎、精准与趋势,证明与推断、定量与定性、相关与因果、集合与总体、描述与建模、回顾、前瞻与随机分组双盲以及统计学意义的判断9个方面.《统计思想欣赏》共有9章,分别讲述上述这9个方面的问题. 至于各个学科共有的例如对立与统一、主观与客观等属性,贯穿于上述9个方面,书中不再另立章节讨论. 书中各章相互独立,自成体系. 书中有大量的现实生活中的案例,力图用浅显的语言讲述统计思想,即使刚入门学习统计的新人也可阅读. 书中每一章都有一组思考题. 求解这些题目,套用公式是无助的,“思考”是求解它们的一个好办法. 求解这些题目,读者还能补充些新的知识.
(本期编辑:安 静)
一起阅读科学!
科学出版社│微信ID:sciencepress-cspm
专业品质 学术价值
原创好读 科学品味
我来说两句排行榜