科学研究中的P值:误解、操纵及改进

作者:程开明; 李泗娥
来源:数量经济技术经济研究, 2019, 36(07): 117-136.
DOI:10.13653/j.cnki.jqte.2019.07.007

摘要

研究目标:厘清P值的演进脉络及内涵,分析其局限性与误解,探析P值操纵表现及原因,提出相应的改进策略。研究方法:围绕P值开展系统解析与综合,归纳概括得到若干观点与结论;以"中国综合社会调查"(CGSS2015)数据为例开展P值改进策略效果的实证检验。研究发现:费雪显著性检验与奈曼-皮尔逊假设检验思想的结合形成当今广泛使用的零假设检验模式,P值本身固有的一些局限性造成人们的滥用、误用以及P值操纵。构建置信区间、检验统计功效、估计效应量、计算错误发现率、计算贝叶斯因子、重复性实验等可作为P值的有益补充或替代策略;实例解析显示,P值显著性结论与统计功效都受到样本量大小的影响,而效应量不受样本量的影响,依贝叶斯因子做出的假设检验判断可靠性更强。研究创新:针对P值的现实困境,明晰P值的五大认识误区、P值操纵的表现及原因,提出相应的改进策略并通过实例开展效果的实证检验。研究价值:根据P值做出判断时遵循美国统计协会提出的6项基本准则,结合补充与替代指标,构建假设检验的新模式,防范P值操纵,增强结论的可靠性。

全文