如何看待 Nature 上刊文宣称很多科学家缺乏统计学知识?

发布时间:2017/01/09 18:02:07 投稿: 网友投稿

手机阅读投诉本文

导读: 【TreyPou的回答(137票)】: 我想认真的回答一下这个问题: 一、很大一部分生命科学领域科研工作者确实缺乏必要的统计学意识 生命科学是由一个定性的研究领域发展过来的,所以在很长的一段时间内,统计学在其中的应用既不广泛也不深入。而现在的相关专业课程...

【TreyPou的回答(137票)】:

我想认真的回答一下这个问题:

一、很大一部分生命科学领域科研工作者确实缺乏必要的统计学意识

生命科学是由一个定性的研究领域发展过来的,所以在很长的一段时间内,统计学在其中的应用既不广泛也不深入。而现在的相关专业课程设置中,统计学的重要性也并没有被突出,所以在真正接触到有较深统计学需求的实际研究前,一个科研人员往往很难具有充分的统计学训练。

生命科学领域科研工作者欠缺的不仅仅是统计学常识,更重要的是缺乏统计学意识。比如u检验、t检验、秩和检验大家都学过,正态分布也学过,但一个简简单单的两组差异比较,很多人不会想到需要先看样本分布,再决定用参数检验还是非参数检验,而是简单粗暴的用上自己最熟悉的 t 检验(经几位专业人士提醒,这里额外提醒一下避免误导,t 检验要求来自两个独立同分布总体的数据,正态只是其中的特殊情况,具体见匿名用户答案及 @朱可昊 在本答案下的讨论),这就是意识问题。

二、这种缺乏在特定问题上容易造成假阳性结果

在一些问题的解读上,很多人由于缺乏统计学意识,往往想不到需要去做某些处理,恶果就是假阳性结果。上文中有同学提到的多重比较(multiple comparison)问题就是最经典的案例。这也是目前流毒最广的一个问题,比如很多人外包给公司做芯片数据,而公司很不负责任的给一个p0.05的表,很多人就拿着这些显著的基因去做后续实验去了(比如从中挑选自己觉得有兴趣的做功能验证),他们根本想不到,两组数据 50000对 t 检验,就算两组数据来自同一样本,也会有2500个p0.05的假阳性,自然也就想不到在做后续验证前,还需要先在公司给的3000多个p0.05的探针中筛一遍。

三、统计学对绝大多数的生命科学数据并没有特别重要的意义

正如 @若目田修远说的,大多数情况下,只需要定性实验结果就足够了,对于目前生命科学领域的很多分支学科确实如此。确实没有必要为统计而统计,举个例子,曾经有好几个人问我有没有计算Western Blot条带强度的软件,有倒是有啊,且不说功能齐全的Image J,光用个PS就能解决问题,可是完全没有意义啊。两个条带看起来就一深一浅,你统计亮度有显著性差异不是多此一举吗,两个条带看起来差不多,稍微有点差异,你统计完说p0.05,我觉得只能呵呵了。生命科学研究论文本质上都是在讲故事,故事本身逻辑严谨很重要,但不是每个环节都需要用统计学去证明它的严谨,很多实验就是简简单单有或无的问题,例如 con-focal,例如共沉淀。

四、生命科学领域数据可重复性低的主因不在于统计学上的不严谨,而在于选择性汇报实验结果

我接触到的大多数生命科学的论文,都是用一个个小的结论,通过严谨的逻辑连成一个有一定科学价值的故事。然而我们也知道,这些发表的实验结果背后,还有着大量的未发表的实验结果。由于杂志审稿的偏好性,很多情况下,一篇论文是不能够出现看起来自相矛盾的数据的,但是实际工作中这种情况却并不罕见,很多刚正的学者的选择往往是深入挖掘(运气好能挖到大成果甚至诺奖,但大多数情况却没有什么价值)或者放弃整块结果,而另外很多研究者则会保留和整个故事一致的结果,放弃不一致的结果,虽然损害了一点点的逻辑严谨性,但毕竟守住了不造假的底线,也无法苛责太多。

五、随着生命科学的学科发展,统计学已经越来越重要

小作坊写故事片段,再拼接大论文的做法已经越来越行不通了,看看现在5-10分档的传统生物学论文数据量,简直一年比一年恐怖,如果把实验数据量当这个世界的货币看的话,贬值速度都赶上津巴布韦元了,完全一副夕阳产业的景象。

不会解读高通量结果,现在学术界积累的数以ZB量级的数据对你来说等于零。要么趁这几年生命科学领域投资热潮,尽早转出去做商业化,要么赶紧学好统计,拥抱时代和技术的馈赠。

【杨笑的回答(9票)】:

作为一个统计学专业的孩子,我们曾经有一个作业就是找别的领域的论文中出现的统计学错误。大多数涉及到统计应用的论文中都会有misuse of statistics。

而且一个原因在我看来就是统计学目前还是偏向于理论的,涉及到应用的统计学书籍还是比较少的,其他非统计学领域的研究者可以参考的资料很有限。毕竟现在每个学科都有那么多东西要学,出现一个百科全书式的科学家太难,其他领域的科学家不会有太多的精力投放在统计学上,这是不能避免的问题。

【XiYang的回答(63票)】:

反对 @孟祥溪 的答案,Nature这篇文章批评的不是“统计工作”做得细不细,而是批评学界普遍缺乏正确的统计学概念。(比如如何理解P=0.01。)

你可以统计工作细致得感天动地,但仍然在犯概念错误。没有专门学过统计学的人,犯这些错误应该是非常常见的。

客观上缺乏统计学知识造成的misunderstanding和主观上的轻忽草率甚至misconduct,是完完全全的两个概念, @孟祥溪 提到的中文期刊和学位论文里的这些问题多数是态度问题,有些甚至已经偏到ethics范畴里去了。这个答案我觉得有点情绪化,尽管我很理解看中文期刊/学位论文常会让人有吐槽的冲动。

下面回答题主。

我个人认为,科研工作者需要补统计学的课确实是普遍存在的。我自己在研究中感觉到,一定程度的统计学知识(至少正儿八经厘清一些统计学概念)应该是学术工作者普遍需要的基础工具,和逻辑,英语一样基础。但大部分人(包括我)没有正式上过统计学课程。这些人的统计学知识要么仅限于概率学里提到的那些,要么来自于研究过程中的自学,甚至看别人论文时候的揣摩模仿。

我的领域是工科,因为研究课题和私交的关系,和实验物理,生物物理也接触一点。我的统计学完全是业余水平。尽管我实验做得很认真周全,有时还是会被老板拎去:你不能如此这般描述实验结果,统计学上它不是这个意思。

但是我没有感觉到我悲催的统计学知识对学业和研究造成了沉重打击,(当然也可能造成了我不知道……)我猜想可能是工科都在应用末端,问题相对具体化,我们理解错了一个问题只伤害这个问题本身,而基础学科(比如物理)理解错了可能对很多问题都有影响。

【WuHua的回答(4票)】:

没有说错。在我加入这个lab之前,很多人都只会错误的多重t检验……在跟老板发完一封严肃脸的邮件后,靠着研究生阶段学的统计学给写了几十页教程发给实验室每个人,配例子配图说明为什么这样的数据类型要用这种方法,然后要去点软件的什么地方。

然后实验室的人是来自世界各国的哦~虽然样本量很小,但是可见一斑。

其实在国内学习统计学有不少优势,因为有破解版SPSS、SigmaPlot之类的软件可以随便用……

【金超的回答(4票)】:

就我所知,学经济学的学生里,高级计量学明白的凤毛麟角。

搞学术的最好去听听数学系的课。

【组诗耶的回答(2票)】:

这个……果壳上有篇文章大家应该看一下,也是说这个问题的

一个与直觉相悖的概率问题引发的严肃思考

【弓长的回答(15票)】:

谢邀。这么久才来答主要是因为不好意思把我的想法说出来。

Nature杂志作为一种magazine,会有新闻,社论和各种来论,这个占去了几乎一半的篇幅。作为一个媒体,当然很注重话题性。一件事要想成为一个话题,形成关注度,做新闻的有各种手法。关于这个统计学概念问题,当然不是到这次Nature发表这篇评论之后才引起注意的问题,而是长期以来学术界内就已经反复批评的老生常谈。要想再次成为话题,当然必有点“爆点”。

类似这样的问题也远不止一个统计学概念误用了。一个专业圈子或者一个行业存在一些误区、泡沫、浮躁等各种问题,再正常不过。作为一个长期从事某一行业的人士,必须要比较清楚你所在行业当前的误区泡沫浮躁的具体所在,除了做好自己这一亩三分地之外保持一定的清醒。而这也是需要一定的时间的见闻和经历积累的,学生难免听风就是雨。

但是看到这个问题下面有这么多热情高涨的学生在讨论,我就不好意思说以上的话了。只能说,很好,同学们,你们看懂了这篇文章。

【王momo的回答(4票)】:

绝对是真的。不用说理科,我自己做社会科学的统计数据,也是要去恶补统计学,不然根本不敢把东西往paper上写。

【组诗耶的回答(5票)】:

很多科学家统计学概念不清,这的确是事实。注意我说的是概念不清,不是数据不准确,统计不细致等等。我认为这主要是因为统计学的许多概念很难掌握,稍不留神就会掉入陷阱。举几个例子:

1. 统计铝厂的工人的记忆力,数据表明工作年限越长,记忆力越差,表明铝有毒,可降低记忆力。(其实,这是在统计老年人与年轻人哪个记忆力更强的问题,不能说明铝有问题)。

2. 统计显示:大地震前都发现有“地震云”,所以“地震云”是地震前兆。如按照相同的统计方法统计交通事故,可得几乎所有的恶性机动车交通事故都是由健全人驾车造成的,所以为安全起见应乘坐残疾人驾驶的车辆。

3. 统计显示:常吃由反式脂肪酸所制甜食的人比不吃由反式脂肪酸所制甜食的人心血管疾病发病率较高,所以反式脂肪酸可导致心血管病。实际上这个统计结果可能有另一种解释,就是常吃甜食心血管疾病发病率会升高。

4.大地震发生的概率很低,所以大地震发生后这个地区就安全了。

【夏析因的回答(4票)】:

任何统计模型和方法都有假设和条件,而实际工作者用软件分析只关注input和output,认为统计就是为了得到一个p-value。

举个例子曾经审稿过一篇paper,得出结论是a是positive,但其实无论数据是什么,按这个模型a只能是正的。

更不要说很多研究都不test正态性就去做ttest;不管残茶怎样做个回归就了事;还有拿几个变量做一堆regression,挑一个显著的,然后得出结论说这两个显著相关。

【deparsoul的回答(2票)】:

尼玛这些人只把统计学当画图工具用啊!我老板在果壳开生物统计学课,跟着当助教,大家都很鄙视概率论基础知识,只想学可以直接套用的统计算法,画出漂亮的图。连检验的势都不知道就想学神经网络随机森林了,boosting都瞧不上啊!

【纯纯的回答(5票)】:

@谢苇 在他的答案中对我的观点进行了错误的引述和评论。请以我的原文为准,避免刻板印象。

首先表示在Nature级别刊物上的文章统计学的问题都比较小,而且统计的工作往往做的超级细致令人动容。真正令人疯掉的是中文期刊和学位论文。

对于一般的学术文章的印象如下:

我做的领域比较杂,我感觉在材料性能测试,特别是材料的生物特性测试领域,不符合统计规律的事情发生的尤其频繁。因为作者大可以说:“我们的研究只是反映了大致规律,并且也表现出这种规律是可重复的,还想让我怎样?”材料化学家往往随便做三个或者五个数据点就拿出来说明问题(趋势),虽然号称是半定量研究但是刚入门的时候还是觉得不爽。

临床医学的文章,多数都有统计或者所谓循证背景,在统计方面做得普遍比较严谨。

算法方面的文章,由于不涉及不确定性(Monte Carlo之类的除外?不过他们也都是统计专家),故不存在这个问题。

回应 @谢苇 和题主:

正如我在本答案的回复中所说,第一段对于中文期刊文章和学位论文的恰如其分的指责属于对部分作者和评审者misconduct和incompetance的批评,和后文没有直接关系。后文的内容并不针对特定层次的学术出版物而是对学科范式的一般看法。仅代表个人观点可以商榷。

阅读完本文还推荐您阅读: 希拉里评价如何?60%美国人反对

转载请保留本文链接:http://www.vbgudu.com/html/20170109/117884.html

免责声明:文章由网友投稿投稿,不代表本站的观点和立场!如有问题,请与本站联系。
本周看点
  • 进击的巨人第二季在哪看(b站)?进击的巨人2 进击的巨人第二季在哪看(b站)?进击的巨人2

     《进击的巨人》第二季的播出不出意料引来了很多人的关注,有不少喜欢这部动漫的人对于进击的巨人2很是期待,但是却不知道进击的巨人第二季在哪看?下面十万个为什么网小编将为你解答进击的巨人第二季在哪看(b站)?进击的巨人2有哪些疑点? ...

  • 朴槿惠崔顺实什么关系,崔顺实是谁,崔顺实 朴槿惠崔顺实什么关系,崔顺实是谁,崔顺实

     朴槿惠崔顺实什么关系 朴槿惠和崔顺实是多年的闺蜜。 60岁的崔顺实被韩国媒体称为与64岁的朴槿惠亲如姐妹。朴槿惠在20岁出头失去母亲之后认识比自己小四岁的崔顺实,迄今已逾40年。 对于父母早逝、与亲兄妹关系疏远且始终没有结婚的朴槿...

  • 泰国王储资料简介 泰国王储丑闻有哪些? 泰国王储资料简介 泰国王储丑闻有哪些?

     综合外媒报道,泰国国王普密蓬10月13日因病逝世,王储玛哈哇集拉隆功将继位为国王。这位王储实在是差强人意。因为他的行事作风无法代表一个国家。下面为什么网带你看看泰国王储资料简介 泰国王储丑闻有哪些? 泰国王储资料简介 玛哈哇集拉...

  • 神奇百货CEO王凯歆破产了吗?投资人为什么 神奇百货CEO王凯歆破产了吗?投资人为什么

     年纪轻轻,坐拥千万,管理一个巨大的公司。这是每一个人的梦想。但是17岁神奇百货总裁王凯歆做到了。但是很显然,这名95后的创业并不是太好走,最近17岁少女总裁王凯歆最近的日子不好过。神奇百货被外界传越来越不靠谱。下面为什么网带你...

  • 韩国总统是如何推选的?任期多久?朴槿惠会 韩国总统是如何推选的?任期多久?朴槿惠会

     韩国总统任期多久? 以前,韩国的总统是可以无限连任的,但是一个人长时间执政,会出现很多错误的决策,所以1960年修宪:李承晚下台后,过渡政府对宪法进行广泛修改,无条件规定公民权利;由总统制改为责任内阁制,总统由国会议员选举,任...