蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 2754|回复: 7
收起左侧

[统计基础] 假设检验(说人话的解读)

[复制链接]
药生
发表于 2020-8-11 11:23:24 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
作者:朱雀
链接:https://zhuanlan.zhihu.com/p/31322539
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

假设检验是以前学习统计学时候比较讨厌的一块知识点,总感觉这里面说的不是人话。最近学到了CFA Level 2,突然觉得对这个概念有了更简单的理解。于是记录与此,并与大家分享。本文适合学了但不是很理解的人,不适合零基础阅读。
其实,假设检验就一句话:
假设检验是统计学中的等于符号
我们以一个例子来说明上面这句话什么意思。
小明在做一道数学题,题目是 12 + 35 = ?。小明通过数学的加法法则,计算出答案是47。那如何判断小明是否做对了呢?看习题答案。答案上面说,这题的结果是47。于是:
47 = 47
等式左边的47是小明算出来的答案,右边的47是习题答案。这两者相等的时候,证明小明做对了。
那如果没有习题答案呢?很简单,小明做个试验就可以了。假设小明的真名叫王小聪,那他可以先买12台iPhoneX,然后再买35台iPhoneX。然后数一数,他一共买了47台iPhoneX。于是:
47 = 47
等式左边的47是小明算出来的答案,右边的47是靠做实验得到的答案。这两者相等的时候,证明小明做对了。
好,例子结束,上面的例子是属于普通的数学的。我们现在把上面的例子改造成统计学中的例子。
小萌在做一道统计学数学题,题目是一个6面骰子,扔很多次,问平均值是多少。(为了描述人话一点,说法不是很严谨)。
小萌通过统计学原理,计算出来答案是3.5。好,假设现在没有习题答案,小萌要通过做实验的方式来验证自己的答案是不是正确,于是小萌蛋疼地扔了一下午的骰子。最后,他实验做出来的平均值是3.47。
小萌看看他的答案:3.5,再看看实验结果:3.47,再看看他的答案:3.5,突然就好像觉得实验结果给他唱了一首歌

讲完这个例子,大家应该就理解了。小萌明明是做对了,但是在数学上,你不能认为3.5就等于3.47。所以,在统计学中,我们要有一个概念来定义说,3.5就是等于3.47。那问题又来了,你说3.5等于3.47,那3.5是否等于3.46?3.3呢?这就要靠significant level(显著水平)这个概念来解决以上问题。显著水平就是用来设定这个等于的范围的。
总结一下。在有随机性参与的数学计算中,理论值和你实验室取样后算出来的计算值是会有一定程度的偏差的。所以,假设检验的用处就是告诉你,你算没算错。(这句话还是不严谨,下文会有更严谨的形式)
重复一下,
假设检验是统计学中的等于符号
具体假设检验的流程和方式,各种书上都有,这里就不重复啦。  


就到这里完了吗?哪有那么简单就放过你,给你看看假设检验对于某一个假设的结论:
We can not reject the null hypothesis.
这么非人类的描述是怎么回事?cannot一个否定,reject又一个否定,到底是要还是不要?


事情是这样的,这牵涉到一个数学上非常基本的原理。这个原理大家在初中就学过,那就是:
在不能穷举的情况下,你不能靠举例子来证明一个命题是正确的,但是你可以靠举出一个反例来证明一个命题是错误的。
拿刚才的掷骰子例子来说明,每一次小萌采集完数据得到结果,就相当于举了一次栗子,你就算做了一万次实验,实验结果都在3.5左右,你还是不能证明答案就是3.5,因为你不能靠举例子来证明一个命题
但是如果你做了一次实验,实验结果是52,这个值远超过理论计算出来的3.5。那你就有相当大的理由来认为这是一个反例。你只需要一个反例就可以否定掉整个命题。
所以假设检验只能告诉你有没有足够理由认为你错了。但是没有办法告诉你对了。那你可能要问,都不能告诉我对不对,这有啥用?在科学上面,我们可以认为,只要暂时没有证据显示我错了,我就可以暂时认为我是对的。同时,我们要保持一种谦逊和开放的态度,一旦遇到反例,就要承认自己是错的。嗯,这很科学。


关于significant level(显著水平)最后说说显著水平。这个词也是挺反人类的,听着特别别扭,还不好记。刚才说了,显著水平就是用来确定等于的范围的。那5%的显著水平自然和1%的显著水平不一样。那究竟是5%的范围宽还是1%的范围宽呢?
我们把这个显著水平,用1减一下,得到的值叫做容错比例,也许能好理解一些。比如,5%的显著水平,变成95%的容错比例。1%的显著水平,变成99%的容错比例。 那就很好理解了。1%的显著水平,因为其容错更高,自然是更容易接受原假设。
那具体如何理解显著这个词呢?其实就是有足够强的证据的意思。例如:这个结果显著,翻译成人话,就是我们有足够强的证据表明这个结果超过了容错范围,所以我们要reject掉原假设。
关于假设检验的人话版解释就说这些,希望可以帮助你更好的理解这个概念。当你更加熟悉了之后,希望你能够随口说出显著、We can not reject the null hypothesis这种非人类的话了?。



回复

使用道具 举报

药徒
发表于 2020-8-11 11:28:35 | 显示全部楼层
回复

使用道具 举报

药徒
发表于 2020-8-11 13:03:33 | 显示全部楼层
这种教人知识的风格老夫甚是喜欢呐
回复

使用道具 举报

药徒
发表于 2021-9-7 18:34:04 | 显示全部楼层
终于看懂了哈哈哈
回复

使用道具 举报

药徒
发表于 2021-9-22 16:46:48 | 显示全部楼层
回复

使用道具 举报

发表于 2022-4-13 09:47:01 | 显示全部楼层
通俗易懂,谢谢分享心得,超棒
回复

使用道具 举报

药徒
发表于 2022-11-29 13:22:14 | 显示全部楼层
超级赞!!!把高深抽象讲得通俗易懂,真高手!!
回复

使用道具 举报

发表于 2022-11-30 10:03:38 | 显示全部楼层
演绎推论应用,有其必要的基础。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-6-5 08:15

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表