在心理学实验中,当最终实验结果数据不显著时,研究者们通常会怎么做?

发布时间:2017/01/09 20:01:40 投稿: 网友投稿

手机阅读投诉本文

导读: 【李誉非的回答(32票)】: 我也遇到过预期该显著的实验结果结果做完却不显著的情况,也为此头疼过。 但是如果不显著就是事实呢?那顺着这个线索往下找原因会不会就有新发现了呢? 我现在在做的毕业论文就属于这种情况。 在看文献时,发现某篇论文A得出的结论...

【李誉非的回答(32票)】:

我也遇到过预期该显著的实验结果结果做完却不显著的情况,也为此头疼过。

但是如果不显著就是事实呢?那顺着这个线索往下找原因会不会就有新发现了呢?

我现在在做的毕业论文就属于这种情况。

在看文献时,发现某篇论文A得出的结论与我们自己的文章B结论不符:A的实验结果是正确的(与我们的结果相符),但是由于没有考虑到H因素,所以在讨论时提出的解释并不恰当(这是我的观点)。由于A与B采用的实验范式不太一样,于是我又做了一个实验C,即把H因素添加到A的实验范式中去,验证下是否能得出与B相同的结论。

然后数据分析完着实让我头疼了一阵,因为与预期的结果有些不一样:用材料F的话,能得出与B相同的结果,但用材料W则不行,有的地方不显著,还有的地方大小方向与预期相反。在检查过各种可能出错的地方后,发现确实是此结果没错。

于是我又查了些文献,发现了另一个影响因素T,虽然有文献D提出过这个因素的影响,但没有系统研究过,而这个因素恰恰也是A与B范式中有差别的地方。于是我的毕业论文就是研究在改变T因素的情况下,材料F与W在各种条件中(与A和B中的各种实验条件相对应)变化趋势。因为文献D里已经大致可以确定T因素的影响是怎样的,而我之前的实验C又体现出这个影响对材料F和W是不太一样的,于是我根据之前的种种迹象设计了毕业论文的实验。

虽然现在结果还没有出来,我也不知道这回会不会又是点背得不符合预期,但是我很相信,根据事实的引导,最后总会找到真相的~~

什么?你担心我能否顺利毕业?拜托~~多少垃圾毕业论文我都见过了(从还没入学开始,连听了3年的毕业答辩,也看过其它学校送审过来的毕业论文),就算这次结果又不理想,也不至于衰到不能毕业吧~~(此处庆幸下,我还是小硕。。。。)

什么?导师同意么?很幸运,在这方面,我的导师与我态度相同!而且,记得导师曾经说过:“我们虽然发的文章不多,但是每一篇文章的结果都是不止一次得到的结果!” 也就是说,我们自己会先验证下,自己这个结果能不能被重复——会找不同的主试,重新做的实验程序,重新做实验,重新分析数据。

个人认为,如果以后还是打算在这行长期混下去,那就应该像我的导师那样踏踏实实做,如果只是为了几篇文章而不顾结果的可重复性,那始终只能停留在靠着几篇文章混饭吃的阶段了。

当然,我这有可能是站着说话不腰疼,可能再往上混混就会发现艰难之处,也有可能到了其它地方就会遇到被迫丢节操的压力了。。。。。。不得不承认,在学术界我还没见过什么市面。但我的导师都能坚持到这个时候(他出身贫苦农村,家庭境遇非常坎坷),我真的希望这样的自己可以坚持得久一点!

【AnnYGuo的回答(20票)】:

别说心理学,我们搞基础科学也往往会得出实验/计算结果不显著,除了改变实验设定,删除部分数据,玩各种数字游戏之外,还有一种终极大法:显著是一种结论,不显著也是一种结论,关键看你文章怎么写

比如说,别人的研究数据起伏很大,而你的类似研究跟他的结果不一致,这个就有的可说了。

【王里邪的回答(225票)】:

=。=

前几天刚看到某师兄的一篇掉节操的文章,征得同意后转载过来。不敢沾师兄光骗赞,匿了。

在掉节操之前还是应该声明:正确做法是遵守学术规范,尊重实验结果。

原作者特别提醒:以下做法是对研究极不负责任的态度,仅供学习参考,尽量避免使用。

要显著,不要节操

——如何写一篇节操丧尽的心理学论文

郑健

北京师范大学,北京

五十六个星座五十六只花

五十六族兄弟姐妹是一家

五十六种语言汇成一句话

没有“*”你说个J8说个J8!

心理学研究,理想状态下是一个用数据验证假设的过程,如上图所示。然天不遂人愿,你会发现,你的数据从来没有听话过。怎么调教你的数据呢?我来分享一下自己败节操的经验。(初始状态,您有10点节操。)

  1. 被试/数据

首先我们可以从数据本身下手。处理被试/数据的方法基本有以下两种:删被试与造假。

1.1 剔除数据

即删除不符合假设的数据。比如假设两个变量之间有正相关,结果做出来没有相关,怎么办?先画个散点图看看,YAHOO!双变量正态分布。这时你默默地把散点图左上角和右下角的数据删掉。删几个,试试相关显著了没,没显著继续删,一直删到显著为止。在报告的结果部分这样写“剔除了部分作答不认真的被试”就行了。(您损失了1点节操,还有9点节操。)

Johnson, Smeesters, and Wheeler (2012)就因为这个被retract了。

1.2 编造数据/造假

相对于删被试来说,编造数据似乎更恶劣一些,所以我很少这么干。具体怎么编呢,有两种方法,一种是直接在excel里输入你想要的数据,另一种相对间接一些,自己当被试,想着自己的实验假设,多做几次,大概就显著了。(您又损失了1点节操,还有8点节操。)

例如Stapel and van der Linde (2011)就是这么干的。

2 变量转换

原始数据不显著?你可以试试对它进行对数、指数、倒数、三角函数等转换,还可以把几种转换结合起来使用。同样的,你需要在结果部分说明你使用了哪些转化,最重要的是要这句话后面引上这篇神文献(Winer, 1962),它被引了26967次。(您又损失了1点节操,还有7点节操。)

3 显著性

放开了数据,接下来我们对显著性本身下手。

3.1 边缘显著

一般的,p 0.06你说这是边缘显著完全没问题。也有很多人p 0.1就说边缘显著了,还节操满满的。最狡猾的做法是:对于假设里应该显著的,p 0.1就是边缘显著;假设里不该显著的,p = 0.5 就说不显著。(此处需要引一篇JPSP的研究,但我想不起来是哪一篇了……)(您又损失了1点节操,还有6点节操。)有人说“Marginally significant?So you didn't find anything?”你就跟他生气。

3.2 “但不显著”

即使P 0.1,也没有关系,你可以说“有趋势但不显著”,“不显著但有趋势”更好。“不显著但多重比较/事后检验发现……”与此相似。(您又损失了1点节操,还有5点节操。)

3.3 创新

发挥创造力,改变传统的统计标准也是一个好办法。比如简单斜率检验中,一般取正负一个标准差处的数据进行比较。你可以创新啊,你取正负两个标准差处的数据进行比较,显著的可能性就大大提升了。(您又损失了1点节操,还有4点节操。)

3.4 多种统计方法

社心课上大三的一个小孩说“某先哲说过没有不显著的数据,只有不显著的统计方法”。这话说得太好了。回归不显著,把自变量划成分类变量做方差分析试试,或者把因变量划成分类变量做判别分析,再或者两边都分类咱来个卡方检验试试。你可以尝试一万种统计方法,但最后只报告显著的那一种(或几种)。(您又损失了1点节操,还有3点节操。)

4 设计

我们还可以从实验设计上增加“*”出现的概率。为什么听上去这么高级?

4.1 多个因变量

多个因变量可以有效地保证结果的显著。本人所在的实验室喜欢用“行为主体判断”这个任务,即给被试一堆行为,其中有积极、消极和中性行为三种,让被试判断这行为是城市居民做的呀还是农民工做的,是黑人做的呀还是白人做的,是男人做的呀还是女人做的,等等。这任务好处在哪呢?你可以单独以积极行为的结果为因变量,也可以用消极行为的,还可以用积极减中性、消极减中性、积极减消极等等做为因变量,只要有一个显著,就OK了,其他的就当你没做过。(您损失了1点节操,还有2点节操。)

4.2中介变量

中介变量是问卷研究的好朋友,用包含多个变量的问卷研究很容易做出中介作用来。学位论文如果只有一个自变量和一个因变量,答辩老师肯定嫌你做的少,这是研究生群众对于中介变量如此喜闻乐见的原因之一。提到中介变量,我们应该感谢两个人(两篇文献),一是Sobel (1982),他提出的检验方法非常容易显著,二是温忠麟, .张雷, 侯杰泰, and 刘红云 (2004),他为广大心理学研究生提供了简单易行的中介变量检验程序(其中的“部分中介作用”尤其给力),毕竟Sobel君那篇以统计为主题英文文章大家都不太愿意读。你要做的呢,就是在问卷塞尽一堆量表,然后算相关矩阵,看看哪三个变量两两相关比较高,然后按温老师的流程做下来就OK了。讨论部分就随便解释呗。万一中介作用不显著,别忘了还有“边缘显著”、“不显著但有趋势”可以用。(您损失了1点节操,还有最后1点节操。)

要说的基本都说完了,还有1 点节操没有丢掉,怎么办?那我就接着问卷研究说说共同方法偏差好了,这货特别适合败节操。要再次请出温忠麟, 侯杰泰, and 马什赫伯特 (2004),他们提出可以根据被试量改变显著性指标,这个提议不知挽救了多少文章。我曾经较为深入地研究过这个问题,很高兴地发现,中文文献中所有做了共同方法偏差检验的,都有各种极具创造性的解释来说明自己的研究中不存在共同方法偏差。较为有代表性的是这样一段话,由于某些原因,我就不给出参考文献了“原模型加入共同方法因子后,卡方改变呢,也不是不显著。但由于卡方啊,它受被试量影响,所以显著也一定不说明存在那啥。你看NFI呀,IFI呀,RMSEA呀,改变都不是很大嘛!所以本研究没有共同方法偏差。”为防止引起不愉快,我对这段文字做了口语化处理。

你为什么不去试试呢?(您损失了1点节操,您的节操败光了。)

目标达成,回寝室了。

参考文献

Johnson, C. S., Smeesters, D., Wheeler, S. C. (2012). Visual perspective influences the use of metacognitive information in temporal comparisons. Journal of Personality and Social Psychology; Journal of Personality and Social Psychology, 102(1), 32.

Sobel, M. E. (1982). Asymptotic confidence intervals for indirect effects in structural equation models. Sociological methodology, 13, 290-312.

Stapel, D. A., van der Linde, L. A. J. G. (2011). What drives self-affirmation effects? On the importance of differentiating value affirmation and attribute affirmation. Journal of personality and social psychology, 101(1), 34.

Winer, B. J. (1962). Statistical principles in experimental design. New York: McGraw-Hill.

温忠麟, .张雷, 侯杰泰, 刘红云. (2004). 中介效应检验程序及其应用. 心理学报(05), 614-620.

温忠麟, 侯杰泰, 马什赫伯特. (2004). 结构方程模型检验: 拟合指数与卡方准则. 心理学报, 36(2), 186-194.

【vikilu的回答(19票)】:

关于这个问题,个人觉得北师大郑健的文章可谓我所读到的最实诚且全面的回答了。作为一个(根据郑健的标准)节操少于5分的同道者,我在这里大言不惭地补充几句,顺便也试图以更加中立的态度来回答这个问题。郑健的文章告诉大家如何掉节操,我补充说一下如何把节操捡回来,免得不明真相的群众以后见到心理学家就当做人贩子群而殴之。

1.被试/数据

很多心理学研究者(尤其是许多不亲自在第一线做实验,或者只关心实验的“科学标准”,忽略了实验中也是在与打交道这重要的一点,或者不做预实验、不根据反馈调整实验方案的所谓“心理学家”们)习惯于把被试当成是一堆孤立的刺激接受器和数据输出器,忽略了(实际上有可能决定实验成败的)场景因素、主试因素、被试群体因素乃至时间因素,这也是许多研究出不了“显著”结果的原因之一。

删除被试/数据只发生在几种情况下:

(1)实验中只测量了少数几个重要因变量,而manipulation check的分析结果表明实验操纵对该被试没起到作用,因此果断删除(但注意不能因这个原因排除太多被试,尽量少于总被试数量的5%);

(2)通常问卷调查中会设置一些“陷阱”或“测谎题”,比如在自尊测量中混入以下问题:“我从小到大每次数学考试都得满分”;如果被试的回答是“非常赞同”,那多半是在说谎,一旦说谎或自相矛盾的情况过多,这名被试就需要被剔除,因为我们有理由对其别的回答的真实性也表示质疑;

(3)除了删除整个被试的全部数据外,有时我们会删除一个被试的少部分数据,尤其是在一些有比较明确的参照标准的反应时研究中,当被试的反应时过短或过长时,该试次(trial)的数据会被剔除(具体剔除标准要看这个试次中假定含有多少心理过程,一个简单反应通常不会超过2秒,但也几乎不可能短于50毫秒),但同样要注意,这一过程剔除的试次总数也不应占所有试次总数的很大比例,不然就说明你自己的研究有问题了;

(4)除非我们的目的就是希望了解大千世界中的无奇不有,想要探究行为的极限,不然心理学研究通常会排除异常值(outlier),而这包括了将样本中的极端被试剔除(根据我们所关心的维度,剔除平均值以上或以下2个或3个标准差以外的被试),或者将单个被试所有试次中的极端值剔除。包括SPSS等喜闻乐见的统计软件都拥有自动帮你找出极端值的选项。当然,从散点图上找也是一种很直观(但不够精确)的方法。

最后的最后需要说明的是,只有当你剔除了被试或数据点而故意没有在文章里说明时,这才是作弊行为;即使你的剔除做法是不恰当的,只要你一五一十地报告了,还是有坦白从宽的机会的。

关于伪造数据——这已经不是掉节操了。这是自欺欺人的最低境界。毫无疑问,在心理学领域,即使有最严格的同行评审,由于缺乏数据分享机制(部分源于对被试信息的必要保护),少量伪造数据是很难被觉察的。但是一旦伪造数据过多,露马脚是迟早的事情。第一,伪造的东西,别人是无法复制出来的,这势必阻碍你的学术影响力的传播,且不说等你真的名气大了,人们自会开始质疑你的研究的不可复制性;第二,很多伪造的数据不符合大数据的规律,在meta-analysis当中会表现欠佳,甚至会被明眼人看穿;第三,即使你自信做假做得天衣无缝,而且一点不问心有愧,那也请考虑一下一旦你事情曝光对于整个学界会造成什么样的影响——如果心理学研究都是不可信的,那么政府和私人机构也就没有动力投钱来资助这些研究,为了一个假货,所有的同行都得跟着遭殃。

2 变量转换/非参数检验

变量转换的主要目的并不是获得显著的结果——实际上,如果你的假设是错的而数据恰恰反映真实情况,那么你怎么转换也不能得到想要的显著结果。转换后的数据有了显著结果,只是说明你对数据形态的判断很可能是正确的;不过,有时即使不做转换,你还是可以通过别的检验方法获得“等价”的结果,比如不依赖于数据形态的非参数检验(non-parametric test)。

如果将依赖于数据形态(通常是正态分布)的参数检验用于实际上不符合假定的数据形态(正偏、负偏),研究结论犯第二类错误(明明有效应时却误以为没效应)的概率会大大增加,统计检验力(power)被削弱得所剩无几,此时得到不显著的结果明显是冤枉的。此时,变量转换有助于使数据形态回归正态。具体而言,Tabachnick和Fidell(2007)以及Howell(2007)分别建议,当数据偏离正态不太远时,用平方根或立方根转换,当数据偏离正态很远时,用对数转换;当数据正偏时,根据如下公式:x' = sqrt(x)或x' = lgx;当数据负偏时,先用C - x(C=max[x]+1)对数据进行反转再进行平方根或对数转换。 毫无疑问,变量转换在学界不是没有争议,但以我之见,如果聪明正确地使用变量转换,不仅不属于作弊掉节操,而且反倒是应当鼓励的,因为说不定经过转换后的数据恰恰揭示了以前不为人知的重大发现呢。

在郑健的文中指出了一条好思路——在分析结果时,为什么要拘泥于一种统计方法呢?的确,很多时候“结果不显著”只是“按照某种统计方法没有得到显著结果”。这常常也是由于许多统计方法本身依赖于正态分布的假定。因此,当你一没有很大的样本量,二没有足够“正”态的数据时,不妨试试非参数检验。典型的非参数检验包括卡方检验、Mann-Whitney检验、符号检验(代替独立样本t检验)、Kruskal-Wallis检验(代替ANOVA)等。但仍要注意,不同的检验仍然对数据类型有特定要求,毕竟,把性别当连续变量是不可能得到有意义的结果的,这时讨论显著不显著本身就没有意义。

非参数检验常常可以提高统计检验力,有效减少不显著焦虑症。这里不妨举个高端点的栗子。在做中介效应(或者叫间接效应)的检验时,传统的Sobel检验(作为一个基于正态分布的参数检验)常常得不到显著的结果,原因是Sobel检验的数值是由两个回归系数ab相乘得到的(见Sobel, 1987),而在数学上乘积的分布常常是正偏态的。所以Sobel检验通常只有在面对超大样本时才不需要担心第二类错误。这个错误的正态假设限制了Sobel检验的统计检验力,导致很多本可以发表的文章因数据无法满足一个不讲理的假定而黯然被拒(而这客观上为造假提供了动机)。然而,如今Sobel检验已经逐渐被新一代的bootstrap检验所代替(关于bootstrap在中介效应检验中的应用详见Preacher Hayes, 2004, 2008;关于温忠麟等文章中所提到的中介效应检验方法为什么已经落伍了,也可参见Preacher Hayes, 2004; Zhao, Lynch, Chen, 2009)。Bootstrap是一个非参数方法。所谓bootstrap中介效应检验,简而言之,就是从你所收集的样本中,随机抽取(放回抽样)K个子样本,用这K个子样本分别计算ab的大小,并获得其95%置信区间,如果该置信区间不包括0,则说明中介效应存在。这个方法目前已可通过Hayes所开发的macro在SPSS或SAS上实现,AMOS、Mplus等结构方程软件也已容纳了bootstrap功能。

3 从显著性本身下手?

关于郑健所提到的“对显著性本身下手”,说实话我不是完全理解,也就更谈不上赞同了。毫无疑问,统计学界对于是否要坚守p .05这个纯粹人为的标准始终存在争论,但大多数严肃的杂志都对marginal significance这种说法是嗤之以鼻的,因为使用这种说法本身就是一种非科学、不专业的态度(退一步说,你可以选择一个标准,管它是.05还是.01还是.08,但你至少要在一篇文章当中坚持到底,而不能树立好几个标准然后专挑合乎你的利益的标准说),所以绝对不能接受的做法是,当你需要它显著时,就接受p.08,当你希望它不显著时,则又拒绝.05p.08。一个比较好的习惯是按照APA标准,在文章(非图表)中报告显著性p值时,报告p的实际大小,除非其小于.001或大于.10。至于到底这算是“显著”还是“边缘显著”还是“不显著”,聪明的读者自己会有所判断的。

对于不显著的交互作用或多组比较,一般是不会去看事后检验的(通常这种情况下事后检验也不会显著,但极少数情况下,可能会有交互作用接近显著,而事后检验显著的,此时你需要考虑的是,是不是因为你样本量太小导致统计检验力不足,导致本该显著的结果变成了不显著,倘若是这样,不嫌麻烦的话多收些数据就会顺利达到显著了)。

使用多种统计方法检验同一数据是可行的,而且未必是作弊。但正如前面提到的,不同统计方法对于数据类型有要求。而且,当你把连续变量拆分成分类变量时,通常会损失很多信息(和被试),此时你的统计检验力本身就会下降,除非你所取的两端数据(比如只取低于或高于均值一个标准差以上的数据)差别足够大,不然这样做不仅要冒着被批判的风险,还不一定能得到想要的显著结果。

多个因变量是否能提高获得显著结果的概率呢?还真的能。但是,这是因为对同一组数据同时检验很多假设时很容易提高第一类错误(实际上没有效应而误以为产生了效应)的可能性,即所谓的familywise error rate(FWER)。假如你对一组数据提出100个假设,即使每个假设都极其不靠谱,至少有1个显著的概率仍是高得吓人的。为了抵消这种第一类错误的来源,一种标准的处理方法(Bonferroni correction,参见wikipedia上的Bonferroni correction)是将α值除以假设检验的数量(比如,在郑健的例子中,如果使用积极、消极、积极减消极三种因变量,应该使用α=.05/3=.017的标准,而不是α=.05)。当然,如果你不打算报告“积极”、“消极”,而只打算报告“积极减消极”作为因变量的结果,那也不妨假设你只做了一个检验,而恰巧就显著了(这已经够掉节操的了),但如果你需要对你的第一个实验做概念重复,那你每次都得报告同一个因变量。如果后续实验中“积极减消极”这个因变量不显著了而别的因变量显著了,你就陷入了深深的矛盾当中——如果你用实验一的结果,实验二就不得用;如果用实验二的结果,实验一就不得用。所以,如果你想让一堆不靠谱的假设变得显著,请不要高兴得太早了。

根据郑健的说法,似乎得到显著的中介效应是件颇容易的事情。的确,如果不在意理论的严谨性,而且问卷中的变量够多,找出潜在的中介效应并不难。但这并不意味着这些中介效应就值得做成一篇好文章。毕竟,将一个变量界定成中介变量,需要有一个能站得住脚的理由。另外,有许多不明真相的同学误以为三个变量两两相关显著就一定能做出显著的中介效应了。可是,当自变量x与中介变量m的相关,m与因变量y的相关,以及x与y的相关都是正的时候,中介效应甚至有可能是负值(与假设完全相反),这是因为x与m的高相关性导致x与y的关系对中介效应造成了“net suppression"(见Zhao, Lynch, Chen, 2009)。此外,按照温忠麟等(2004)的程序,实际上也就是按照最经典的中介效应分析程序,存在很多已经被后来的研究者指正的漏洞(比如,在没有m作为中介变量时y对x的回归系数显著但并不很大,而在加入m时变得不显著但也并不很小,此时不一定有中介效应;而即使y对x的回归系数在没有m时也不显著,也不说明中介效应不可能存在

,比如,有可能存在一正一负两个中介效应互相抵消,导致y对x的回归系数不显著)。正如我前面说的,经典的中介效应检验(Baron Kenny, 1986)甚至Sobel检验的时代都已经过去了,如果你真的很想得到显著的结果,不妨尝试用bootstrap,毕竟这个方法能够有效提高统计检验力,从而让确实有效应的结果变得显著。有兴趣的读者请详阅Preacher and Hayes (2004)。

4 有什么情况下我们一定希望不显著?

期望p越大越好?这种情况不仅存在,而且还挺多,下面只举两个最普遍的例子。在察看结构方程模型(SEM)的拟合度指标时,我们希望卡方值不显著,因为这表明我们构建的模型符合我们的数据(否则我们就得对模型做修正)。但是,卡方值受到样本量的影响——实际上代表拟合指标的卡方值的计算公式中本身就含有N或者N-1,如此一来,当样本量足够大时,由模型计算得到的再生矩阵与从观察数据获得的协方差矩阵之间任何细小的差异都足以导致一个显著的卡方值,让人误以为模型不符合数据。为此,显然很有必要参照其它不受样本量影响的拟合指标,比如NNFI(最好大于.95),CFI(最好大于.95),RMSEA(最好.05)等等。

在实验领域常用的分离范式(不仅仅用于心理学),常常会希望某一组的结果不显著而另一组显著。比如,假设是某药物能提高一个人的短时记忆(而不是普遍认知能力),那么以药物条件(使用该药物,或安慰剂)作为自变量,同时以一个短时记忆任务和一个不涉及短时记忆的认知推理任务作为因变量,对于前一个因变量我们期望得到显著结果,而后一个我们期望得到不显著的结果,不然我们就无法知晓这种药物的实际作用了。如果采用更严格的双分离范式,则需要检验A treatment对X有用而对Y没有用,而B treatment对Y有用而对X没有用。

5 在心理学研究中跌打滚爬多年的几点忠告

(1)Don't get too cute. 对于不规范的剔数据方式、偶尔报告些”边缘显著“、卖弄偶然发现的中介效应,这些卖卖萌可以,但是想杀入顶尖期刊,靠这些小伎俩就差之远矣。

(2)Be honest, at least with yourself. 不显著的结果,不值得你赌上整个学术生涯去造假。更何况大多数人的造假水准实在有限,如果你觉得自己不够聪明只好靠作弊来获得显著结果,请趁早远离心理学这个坑。

(3)Don't be greedy. 显著不显著乃统计家之常事,虽然发表的结果中95%都是显著的,但至少有一半的文章中因含有不显著的结果而静悄悄地躺在教授的抽屉里,更多的实验结果甚至都没写成文章,就被抛弃了。如果你尝试了除了数据造假以外的一切手段仍然没有得到显著结果,那么你至少可以这样想:你还年轻,前路尚远,何愁以后得不到一个p.05呢?说实在的,今天的世界一切皆有可能。把你的不显著结果用描述统计刻画一下,去掉那些p value,然后勇敢地投给Basic and Applied Social Psychology吧。

参考文献

Baron, R. M., Kenny, D. A. (1986). The moderator–mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of personality and social psychology,51(6), 1173-1182.

Preacher, K. J., Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior research methods, instruments, computers, 36(4), 717-731.

Preacher, K. J., Hayes, A. F. (2008). Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models. Behavior research methods, 40(3), 879-891.

Sobel, M. E. (1987). Direct and indirect effects in linear structural equation models. Sociological Methods Research, 16(1), 155-176.

Zhao, X., Lynch, J. G., Chen, Q. (2010). Reconsidering Baron and Kenny: Myths and truths about mediation analysis. Journal of consumer research,37(2), 197-206.

【YiqiYu的回答(3票)】:

按照我的观点。

首先反思下实验设计是不是做到了true experiment。第二就考虑下有没有confounding什么的,反思下IV的控制。第三,看下被试的数据,看看是不是有明显问题,比如psychometric curve是平的之类的,有问题拉回来重做下判断是什么原因。

要是都没问题,我就接受null hypothesis,然后写好manuscript给老板,等着被老板骂一顿,然后看她施展统(mo)计(fa)技巧强行显著。

【snowfive的回答(3票)】:

当年研究基础科学做实验,导师说有的数据与其他差别太大的可以删除,有时每个变量做5组重复,可能只删得剩下一组…总之宏观来看,如果你能找到一个什么趋势,就把数据往那趋势上靠就行了,有时候甚至一整个变量的数据都不能用…最后把标准差什么的标在图上…就完事了…这样就说能得出结果,只不过可能证据不够多不够具有说服力,但还是有结果的

话说当年我巨吃惊,但导师说只要数据不是造假的就没问题,搞研究的都是这么做的…

从此不太相信做研究的了…导师曾在加拿大top 5带博士生…

【gjm的回答(3票)】:

相信数据

【Salz的回答(4票)】:

除了data massage外。。

假如我的老板是都教授,他一定会。。

一 (发) 针 (现) 见 (问) 血 (题)

审 (看) 时 (出) 度 (pat-) 势 (tern)

运 (修) 筹 (改) 帷 (实) 幄 (验)

力 (终) 挽 (于) 狂 (显) 澜 (著)

救我于水生火热之中。。

阅读完本文还推荐您阅读: 没有实证研究基础的「心理学理

转载请保留本文链接:http://www.vbgudu.com/html/20170109/117910.html

免责声明:文章由网友投稿投稿,不代表本站的观点和立场!如有问题,请与本站联系。
本周看点
  • 进击的巨人第二季在哪看(b站)?进击的巨人2 进击的巨人第二季在哪看(b站)?进击的巨人2

     《进击的巨人》第二季的播出不出意料引来了很多人的关注,有不少喜欢这部动漫的人对于进击的巨人2很是期待,但是却不知道进击的巨人第二季在哪看?下面十万个为什么网小编将为你解答进击的巨人第二季在哪看(b站)?进击的巨人2有哪些疑点? ...

  • 朴槿惠崔顺实什么关系,崔顺实是谁,崔顺实 朴槿惠崔顺实什么关系,崔顺实是谁,崔顺实

     朴槿惠崔顺实什么关系 朴槿惠和崔顺实是多年的闺蜜。 60岁的崔顺实被韩国媒体称为与64岁的朴槿惠亲如姐妹。朴槿惠在20岁出头失去母亲之后认识比自己小四岁的崔顺实,迄今已逾40年。 对于父母早逝、与亲兄妹关系疏远且始终没有结婚的朴槿...

  • 泰国王储资料简介 泰国王储丑闻有哪些? 泰国王储资料简介 泰国王储丑闻有哪些?

     综合外媒报道,泰国国王普密蓬10月13日因病逝世,王储玛哈哇集拉隆功将继位为国王。这位王储实在是差强人意。因为他的行事作风无法代表一个国家。下面为什么网带你看看泰国王储资料简介 泰国王储丑闻有哪些? 泰国王储资料简介 玛哈哇集拉...

  • 神奇百货CEO王凯歆破产了吗?投资人为什么 神奇百货CEO王凯歆破产了吗?投资人为什么

     年纪轻轻,坐拥千万,管理一个巨大的公司。这是每一个人的梦想。但是17岁神奇百货总裁王凯歆做到了。但是很显然,这名95后的创业并不是太好走,最近17岁少女总裁王凯歆最近的日子不好过。神奇百货被外界传越来越不靠谱。下面为什么网带你...

  • 韩国总统是如何推选的?任期多久?朴槿惠会 韩国总统是如何推选的?任期多久?朴槿惠会

     韩国总统任期多久? 以前,韩国的总统是可以无限连任的,但是一个人长时间执政,会出现很多错误的决策,所以1960年修宪:李承晚下台后,过渡政府对宪法进行广泛修改,无条件规定公民权利;由总统制改为责任内阁制,总统由国会议员选举,任...