歧路花园 [Garden of forking paths]

Also available in: Arabic | English | German | Turkish
 

定义: 在科研操作化和统计分析过程中,研究者通常需要经历一个隐形的“决策树”,这源于“科学假设与统计假设之间存在的一对多的映射关系”(Gelman & Loken, 2013, p.6)。换言之,即使不存在p值操纵或“数据捕捞”行为,且研究假设已预先确立,基于现有数据仍可能产生大量看似得到理论支持的统计结果。“问题在于,当数据分析的细节高度依赖于数据本身时,即使研究者未有意识地进行任何数据探索或多个p值的检验,也可能存在大量潜在的比较”(Gelman & Loken, 2013, p.1)。这一术语旨在强调从理论到统计检验的映射过程中,由特定分析和统计选择所引发的不确定性;并且,它区分了两类研究行为——一类是蓄意的(且不道德的)不当研究行为(例如,p值操纵与“数据捕捞”),另一类则是无意的研究行为(虽无主观造假意图,却可能产生同等效果)。“歧路花园”指的是科研过程中,由于可能采取的潜在路径而导致假阳性率膨胀的决策。

相关术语: False-positive, Familywise error, Multiverse Analysis, Preregistration, Researcher degrees of freedom, Specification Curve Analysis

参考文献:

  • Gelman, A., & Loken, E. (n.d.). The garden of forking paths: Why multiple comparisons can be a problem, even when there is no “fishing expedition” or “p-hacking” and the research hypothesis was posited ahead of time. Retrieved from http://www.stat.columbia.edu/

原稿作者: Flávio Azevedo; Mahmoud Elsherif

审阅者: Gisela H. Govaart, Matt Jaquiery, Tamara Kalandadze, Charlotte R. Pennington

翻译者: AI-driven translation tool "TransFlow" (developed by Jinbiao Yang and COSN OpenTransfer team)

译稿审阅者: Xinyu Wang, Liangjie Chen, Ruoting Liu, Shuxian Jin