蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 2396|回复: 11
收起左侧

[蒲园轶事] 喝”沁人绿茶“,感悟统计非礼-第四节

[复制链接]
药士
发表于 2013-8-16 13:36:55 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本节核心提示:风险管理核心就是如何避免犹豫不决,所以,不懂数学、不懂统计学、立体几何不好的萌班小盆友们,直接抄指南即可,不要自寻烦恼。

温故而知新


1919年春天,费歇尔29岁,他带着妻子、三个孩子和小姨子(羡慕啊,还有小姨子捏),搬到了伦敦北部的一间旧农舍里,那儿靠近罗森斯特农业实验站(the Rothamsted Agricultural Experimental Station)。
从许多方面来看,费歇尔的人生在别人眼里是失败的(其实很成功,前面说了,还有小姨子呢)。
先说说他小时候的事情吧:他在孤单和多病的童年中长大,并有严重的视力损伤。为了保护他的近视眼,医生禁止他在人工灯光下阅读。但他很小就接触了数学和天文学,在6岁时他迷上了天文学,七八岁时,他就跑去听由著名天文学家罗伯特?鲍尔(Robert Ball)爵士主讲的通俗讲座。
费歇尔被著名的哈罗公学(Harrow Public School )录取,在那里他的数学是出众的。由于不允许他使用电灯,他的数学导师在晚上教他时,不用铅笔、纸和任何其它视觉辅助品(基本就是口口相授,过耳不忘)。
久而久之,费歇尔发展了一种很强的几何直觉能力。在后来的岁月中,他那非凡的几何洞察力,使他得以解决许多数理统计中的难题。这种洞察力对他而言是那么明显,从而导致他经常不能被别人所理解。在他看来是显而易见的事情,别的数学家往往要花几个月甚至几年的时间去证明。
他于1909年进入了剑桥,在1912年获得了数学学位甲等及格者的头衔,对剑桥学生来说,这是一个很高的荣誉,要得到它必须通过一系列极为困难的口头和笔头数学考试,一般一年只会有一两个学生成功,有的年份甚至没有人能得到这种头衔。
当费歇尔还是本科生时,他就发表了他的第一篇科学论文,其中复杂的迭代公式(iterative formulas)被转换成多维的几何空间形式(立体几何不好的,估计以后做风险管理不会有啥出路)。
在这篇论文中,那些在人们眼里一直特别复杂的数学计算公式被转换成简单的几何形式。毕业后他花了一年时间,研究统计力学(statistical mechanics)和量子理论(quantum theory(请大家一定要注意,量子物理的产生和发展,其实就是风险管理发展的全部历史节奏。在量子物理大放光芒前,风险和风险评估就是一只苍蝇。),到1913年,统计革命已经进入了物理学,而新观念已经较为系统地进入这两个领域,并成为正式的大学课程。
费歇尔的第一份工作是在投资公司的统计室,其后他突然离开那里,到加拿大去从事农场工作(城市的PM2.5爆表啊,而且他视力不好,被人嘲笑)。
后来又在第一次世界大战开始时突然离开农场,回到了英格兰。虽然他被批准入伍,但他那很差的视力使他免于军事服务。
战争年代,他在许多公共学校教授过数学,但每一次的经历都比上一次更糟,他对学生们没耐心,因为他们都是不能理解在他看来很明显的事情(湖南卫士童鞋可以不用着急了)。
费歇尔与K?皮尔逊
前面提到,当费歇尔还是本科生时,就在《生物统计》发表了一篇短文。这使得费歇尔有机会见到K?皮尔逊,K?皮尔逊将一个困难的问题介绍给费歇尔:确定高尔顿相关系数的统计分布。
费歇尔对此作了思考,用几何公式来处理它,不到一个星期就得出了完整的答案。他把结果交给K?皮尔逊,想在《生物统计》上发表。
K?皮尔逊不能理解其中的数学(这家伙只认识公式,一旦变成图形,就迷惑了),把它转给了戈塞特,而戈塞特在理解上也有困难。
K?皮尔逊知道只好自己去搞,好让自己明白费歇尔是如何思考的(这就像回车键体诗人,不了解李白诗仙是如何出口成脏的)。
如何就特定的案例得到问题的部分结论,他的方法涉及到大量的计算工作,于是便对生物统计实验室的工人做出安排,让他们去计算出这些明确的答案。在每一个案例中,所得到的答案都更加支持费歇尔的一般性结论。
K?皮尔逊仍然不发表费歇尔的论文,他要费歇尔做出修改,并降低费歇尔工作的一般性。
K?皮尔逊将费歇尔的东西扣了一年多(多阴险啊),同时让他的助手(计算员)计算一个庞大的扩展的表,以表明参数值的分布。最后,他发表了费歇尔的成果(实在是没办法,因为人家基本是火星人的思路,拦不住了)。但相对于K?皮尔逊及其助手展示分布表的大块文章来说,费氏的论文只是作为一个脚注(其实,历史上,数学里面最聪明的还是哥德巴赫)。
对不经意的读者来说,这样一个结果意味着:K?皮尔逊和他的合作者所做的工作更为重要,那里有大量的数据计算,而费歇尔的数学处理只是一个附属物(风险分析和风险评估就是辅助验证管理和质量管理体系的概念,而不是一个具体工具盒)。
费歇尔再也没有在《生物统计》上发表过文章,尽管它是这一领域的顶尖级期刊(因为他太厉害了,别人无法理解他的思想)。
在接下来的年份里,费歇尔的论文出现在《农业科学期刊》(the Journal of Agricultural Science)、《皇家气象学会季刊》(the Quarterly Journal of the Royal Meteorological)、《爱丁堡皇家学会会刊》(the Proceedings of the Royal Society of Edinburgh)、《心理研究学会会刊》(the Proceedings of the Society of Psychical Research)上,而所有这些期刊与数学研究通常都不怎么搭界。
据知情者说,费歇尔作出这样的选择是因为K?皮尔逊和他的朋友们成功地将费歇尔逐出数学和统计研究的主流(就像郭德纲被驱逐出相声界)。
根据其它人的说法,K?皮尔逊吹毛求疵的态度让费歇尔感到自身受到漠视,同时,他也没能够让类似的论文在《皇家统计学会期刊》(the Journal of the Royal Statistical Society,该领域另一份顶尖的期刊)上发表,于是他转而利用其它期刊,有时甚至付钱请他们发表自己的论文。
费歇尔是个“法西斯”?????
费歇尔早期论文有一些是高度数学化的。他论述相关系数的文章,也就是K?皮尔逊最后同意发表的那篇,就充满了数学符号,一个标准页里有一半甚至更多篇幅都是数学公式。
但也有一些论文里面压根就没有数学。其中的一篇,他讨论了用达尔文的随机适应理论(Darwins theory of random adaptation)来说明最复杂的解剖学结构的方法。
在另一篇论文中,他探讨了性别选择进化的问题。费歇尔在1917年加入了优生学运动(the eugenics movement),在《优生学评论》(the Eugenics Review)上发表了一篇社论,呼吁转变国民政策“以增加职业界人士和高技能工匠的生育率”,并抵制下层社会的生育率。
他在这篇文章中质疑政府为贫民提供福利的政策,认为这会鼓励他们多生育,并将基因传给下一代(其实,完全是翻译的错误,他的意思是,父母的不良生活习惯和低级的思考模式,影响了下一代的成长。对于国家整体的资金来说,这个投资回报远远低于相对非贫民的群体投入。但是这个就是擦边球了,可以被认为是种族主义观点),而中产阶级对经济安全的关注会导致他们推迟结婚,并节制生育。
费歇尔担心,对整个国家来说最终的结果是:为后代选择了“最差的”而不是选择“较好的”基因。
优生学问题是通过有选择的系列来改进人类基因库,这成为费歇尔的主要政治观念(遗传和交叉遗传有什么错呢?)。在第二次世界大战期间,他被错误地指责为法西斯主义者,并被逐出了与战事有关的工作。
费歇尔的政治见解与K?皮尔逊不同,后者钟情于社会主义和马克思主义(所以,皮尔逊很有名,所有的统计教科书都有他的大名),他同情被压迫者,并喜欢挑战保守的优等阶层。
K?皮尔逊的政治观念对他的科学研究没有什么影响。费歇尔关注优生学,这导致他将相当大的精力投入到遗传学的数学研究中。当时有一种新观念,认为某种植物或动物的特性可能来自一个单个基因,这以两种形式中的一个就可表现出来(后来分子生物医学发展,证明他的想法是对的)。从这种观念出发,费歇尔将格雷戈尔?门德尔 的工作大大地推进了,他指出如何估计两个相信基因的彼此影响。
存在着控制生命性质的基因,这一观念是科学中广义统计革命的一个部分。我们观察植物和动物的我,专业上称之为“表型”(phenotypes)。但我们假设这些表形是基因之间交互作用的结果,而这些基因的交互作用又具有不同的概率。
寻求以这些主要的和不可见的基因方式,来描述“表型”的分布。在20世纪后期,生物学家识别出这些基因,以确定它们让细胞制造什么样的蛋白质,我们说起这类事就像真的一样,
但所观察到的还只是概率的分布,我们所说的基因,即DNA链,正是来自于这些分布。
统计革命,费歇尔在这场革命中起了很重要的作用。他对自己作为遗传学家所取得的成就感到自豪,他的一半以上的成果是与遗传学有关的。
现在,我们不再把费歇尔当作一个遗传学家,而主要看他在一般统计技术和观念方面取得的进展。这些观念的萌芽在他的早期作品中就可以发现,但这些观念的全面发展,却是他在工作期间的事,那发生在20世纪20年代到30年代。
《研究工作者的统计方法》
虽然费歇尔在这段时间被数学界忽视了,但他所发表的论文和著作极大地影响了农学和生物学界科学家的工作。在1925年,《研究工作者的统计方法》(Statistical Methods for Research Workers)第一版面世。之后,这本书仅英文版就出了14个,此外,还有法文、德文、意大利文、西班牙文和俄文的译本。
《研究工作者的统计方法》与这之前的数学著作不同,通常数学著作都有许多定理及其证明,并展开抽象的概念将之一般化,与其它抽象概念联系。如果说这类书中有什么应用的话,也只是放在完整的数学描述和证明之后。
《研究工作者的统计方法》从如何利用数据制图及如何读图开始(控制图的鼻祖)
第一个实例,展示一个婴儿生命头13周每一周的重量,这个婴儿就是费歇尔自己的头生子——乔治(George)。
接下来的各章描述如何分析数据:费歇尔给出一些公式,列举一些实例,解读这些例子的结果,然后再转到其它公式。书中没有对公式的数学推导和证明,却带有详细的技术说明,并交待如何在机械计算器上应用它们。
尽管,或者说正是因为缺少理论数学,这本书迅速地被科学界采用。它顺应了现实需求,可以把这本书直接交给只受过有限的数学教育的实验室的技工,让他们自己应用。使用这本书的科学家认为费歇尔的主张是正确的,而评论这本书的数学家则对书中未加证明的大胆论述持怀疑态度,许多人弄不明白他是怎么得出这些结论的。
第二次世界大战期间,瑞典的数学家哈拉尔德?克拉美(Harald Cramér)被战争隔绝于国际科学界外,他花了相当多的时间来费歇尔的这本书和所发表的论文,补充了原来缺失的证明步骤,并推导出原来没有的证明。(战争总是毁掉了很多聪明之极的科学家)
1945年,克拉美出版了一本书,书名叫作《统计的数学方法》(Mathematical Methods of Statistics),对费歇尔的许多著述给出了正式的证明。不过,克拉美只能对这位多产天才的论述进行选择性的证明,费歇尔的很多著述在克拉美的书中都没有包括进去。
克拉美的书被用来教授新一代数学家和统计学家,他把费歇尔著述的“修注”编写成一个标准范式。在20世纪70年代,耶鲁大学(Yale University)的L?J?萨维奇(Savage)阅读了费歇尔最初的论文,发现里面有很多东西都被克拉美遗漏了。他还惊讶地看到,费歇尔对后人的工作早有预见,并且已经解决了在20世纪70年代被认为还没有解决的问题。
但所有这些对1919年的费歇尔来说都是未来的事情,当时他正打算放弃不成功的学校老师职业。实际上他刚刚完成一项里程碑意义的工作:将高尔顿的相关系数与门德尔遗传学的基因理论结合在一起。
但皇家统计学会和K?皮尔逊的《生物统计》都拒绝刊登这篇论文(因为他们的论文审核砖家根本看不懂这篇论文)。
费歇尔听说爱丁堡皇家学会正在寻找适于他们的《交流》(Transaction)上发表的论文,但期望由作者本人支付印刷成本,就这样,费歇尔自费将自己第二项伟大的成果交给这样一个当时并不起眼的期刊发表。
在当时,K?皮尔逊仍对年轻的费歇尔印象很深,他想聘请费歇尔到高尔顿生物统计实验室担任首席统计师,两个人之间的通讯来往是诚恳的,但对费歇尔来说,K?皮尔逊显然是一个主观意志很强并有支配欲的人,所谓首席统计师,充其量不过是在K?皮尔逊的指令下,从事细节的计算工作(主要是因为,这个费歇尔是天山派的;皮尔逊是少林派的)。
罗森斯特实验站与农业实验
罗森斯特农业实验站(Rothamsted Agricultural Experimental Station)的所长约翰?罗素(John Russell)爵士也与费歇尔取得了联系。这个实验站是由一个英国的肥料制造商在一个旧农场里建立的。
这个旧农场曾属于该肥料公司原来的主人。农场的粘土并不特别适于种植什么作物,但主人发现了如何将石头磨碎与酸混合,生产一种被称作“过磷酸石灰”(Super-Phosphate)的肥料的方法。
从过磷酸石灰生产得到的利润用来建立一个实验站,以开发新的人工肥料。90年下来,这个站进行了许多实验,测试无机盐肥料与不同品第的小麦、黑麦、大麦和马铃薯的不同组合。
这积累了一大仓库的数据,有雨量和温度准确的日记录、施肥追肥和土壤测量的周记录、收成的年度记录。所有这些都保存在皮面笔记本中。大多数这样的实验没有产生一致的结果,但这些笔记本被小心地存放在实验站的档案室中。
罗素先生看着积累下来这么多资料,想到也许应该雇个人来看看里边有什么东西,对这些资料进行一次统计整理。他四处询问,有的人推荐了费歇尔。罗素跟费歇尔签了一年的合同,给出了1000英磅的酬劳,他只能出这么多了,而且不能保证第二年续聘。
前面提到的,费歇尔接受了罗素的聘任,带着妻子、小姨子和三个孩子来到了伦敦北部的农区。他们租下了实验站旁边的一间农舍,妻子和小姨子打算在那里种种菜园,操持家务,而费歇尔则空上靴子,穿行在农业实验站的田间和90年的数据中,做起他后来称之为“温故而知新”的工作。


回复

使用道具 举报

药徒
发表于 2013-8-16 13:42:15 | 显示全部楼层
这和统计联系的太少了。
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-16 13:43:09 | 显示全部楼层
清风无嗔 发表于 2013-8-16 13:42
这和统计联系的太少了。

是啊?你举个例子?
回复

使用道具 举报

药徒
发表于 2013-8-16 13:44:17 | 显示全部楼层
yuansoul 发表于 2013-8-16 13:43
是啊?你举个例子?

罗森斯特实验站与农业实验
罗森斯特农业实验站(Rothamsted Agricultural Experimental Station)的所长约翰?罗素(John Russell)爵士也与费歇尔取得了联系。这个实验站是由一个英国的肥料制造商在一个旧农场里建立的。
这个旧农场曾属于该肥料公司原来的主人。农场的粘土并不特别适于种植什么作物,但主人发现了如何将石头磨碎与酸混合,生产一种被称作“过磷酸石灰”(Super-Phosphate)的肥料的方法。
从过磷酸石灰生产得到的利润用来建立一个实验站,以开发新的人工肥料。90年下来,这个站进行了许多实验,测试无机盐肥料与不同品第的小麦、黑麦、大麦和马铃薯的不同组合。
这积累了一大仓库的数据,有雨量和温度准确的日记录、施肥追肥和土壤测量的周记录、收成的年度记录。所有这些都保存在皮面笔记本中。大多数这样的实验没有产生一致的结果,但这些笔记本被小心地存放在实验站的档案室中。
罗素先生看着积累下来这么多资料,想到也许应该雇个人来看看里边有什么东西,对这些资料进行一次统计整理。他四处询问,有的人推荐了费歇尔。罗素跟费歇尔签了一年的合同,给出了1000英磅的酬劳,他只能出这么多了,而且不能保证第二年续聘。
前面提到的,费歇尔接受了罗素的聘任,带着妻子、小姨子和三个孩子来到了伦敦北部的农区。他们租下了实验站旁边的一间农舍,妻子和小姨子打算在那里种种菜园,操持家务,而费歇尔则空上靴子,穿行在农业实验站的田间和90年的数据中,做起他后来称之为“温故而知新”的工作。
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-16 13:46:25 | 显示全部楼层
清风无嗔 发表于 2013-8-16 13:44
罗森斯特实验站与农业实验
罗森斯特农业实验站(Rothamsted Agricultural Experimental Station)的所长 ...

"90年下来,这个站进行了许多实验,测试无机盐肥料与不同品第的小麦、黑麦、大麦和马铃薯的不同组合。
这积累了一大仓库的数据,有雨量和温度准确的日记录、施肥追肥和土壤测量的周记录、收成的年度记录。所有这些都保存在皮面笔记本中。大多数这样的实验没有产生一致的结果,"...."而费歇尔则空上靴子,穿行在农业实验站的田间和90年的数据中,做起他后来称之为“温故而知新”的工作。"

分析结论在下一节,现在是广告时间。
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-16 13:47:43 | 显示全部楼层
根据坛友的反馈。。。。这个节目终止。。。看来只有发《厦门大学统计学教材》才是真正的统计学培训。
回复

使用道具 举报

药徒
发表于 2013-8-16 13:48:30 | 显示全部楼层
这么快就第四节改编完成了啊~收藏收藏~
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-16 13:51:32 | 显示全部楼层
blue8eyes 发表于 2013-8-16 13:48
这么快就第四节改编完成了啊~收藏收藏~

结束了。。。。。投资方撤走资金。
回复

使用道具 举报

药徒
发表于 2013-8-16 14:03:25 | 显示全部楼层
yuansoul 发表于 2013-8-16 13:51
结束了。。。。。投资方撤走资金。

这下惨了,速度完成答应我的事~那本书上的东西??
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-16 14:06:03 | 显示全部楼层
blue8eyes 发表于 2013-8-16 14:03
这下惨了,速度完成答应我的事~那本书上的东西??

因为木有改变完,所以没有完成誓言,所以不能告诉你。深表遗憾。
回复

使用道具 举报

药生
发表于 2013-8-16 14:17:55 | 显示全部楼层
你这是第四壶了吧,灌了个水饱了吧?
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-16 16:01:43 | 显示全部楼层
温壶,烫杯,装茶,高冲,盖沫,淋顶,洗茶,洗杯,分杯,低斟,奉茶、闻香、品茗
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-6-14 03:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表