要发表高影响力的研究论文,良好的研究设计和执行、准确的数据和统计分析必不可少。(主要)研究者通常会宏观指导研究设计和执行,但并不直接负责数据采集和交换、统计分析等工作。而研究数据作为整个研究结果和结论的核心,准确和清晰可读是最重要的保障。良好的数据管理,可以为数据的保存、交换,统计分析乃至进一步在不同研究者间互通有无、同享数据奠定良好的基础。
1、投稿医学期刊时,数据共享是大势所趋
2017年6月,《Lancet》发布一项国际医学期刊编辑委员会(ICMJE)的声明:临床试验在伦理上有义务共享研究数据。并指出临床试验数据规范化共享是趋势,对今后的临床研究具有指导作用。
该声明中, ICMJE对发表在下属杂志中(包括NEJM、JAMA、Lancet、BMJ等)的临床研究的数据共享做出两项规定:1)2018年7月1日之后,凡是向ICMJE所属杂志投稿的临床试验文章,都需要加入关于数据共享的声明;2)2019年1月1日之后开始招募受试者的临床试验,必须在临床试验注册时提交数据共享计划。尽管这些要求尚未强制执行,但期刊编辑部将参考数据共享声明来做出最终是否刊出的决定。
以NEJM为例,在已发表临床试验文章的附件中,可以看到作者投稿时提交的数据共享声明。
尽管数据共享常态化还需要解决很多问题,但可以预见的是,未来会有更多的期刊,更多的研究类型(如前瞻性队列研究等)加入数据共享计划。因此,可以共享准确、清晰可读的数据,是发表顶级医学期刊一个重要特征。
2、要提交的共享数据应该是什么样的?
是不是一定要高大上的数据库格式(如Access的mdb、MySQL的myd、Oracle的dbf)才可以共享呢?并不是。从数据保存格式上来讲,共享数据时,提供Excel的xlsx、SPSS的sav和SAS的sas7bdat格式,并没有区别。但如果你的Excel数据不准确,例如串行、有异常值、逻辑错误,那共享的数据以及研究结论可能会受到多方的质疑。
研究数据采集过程中,有良好的数据管理理念和意识,才能采集到准确和清晰可读的数据。监管机构或行业协会对数据管理有很多要求和规范,此处不展开讨论。但一个优秀的研究数据,最基本要求的应该是研究数据集格式统一,有清晰的数据词典。数据集用于记录观测值和统计分析,数据词典帮助统计师或其他研究者理解数据。
看到上面的数据格式,您是否就有了共享数据的信心了呢?但临床医生最熟悉和常用的纸质CRF收集数据、Excel录入数据,肯定得不到上述的数据。
3、什么样的工具才能采集到准确和清晰可读的数据?
随着计算机和互联网技术的迅速发展,新一代数据采集和管理工具——EDC(电子数据采集)系统越来越凸显了它在数据采集和管理过程中的优势。能发表高影响力的研究结果,几乎全部都会使用EDC系统,而极少采用Excel这类工具采集数据的。
在任何一个可以上网的电脑/Pad/手机上,都可以使用EDC录入和管理数据,甚至可以先离线录入,等有网络时再上传。首先,EDC有清晰明了、简洁高效的录入页面,也可以自动计算衍生变量,减少数据计算和录入负担。
其次,EDC可以提供丰富多样的系统核查功能(比如必填校验、数据格式输入约束、数值范围校验、日期范围校验、变量间的逻辑校验、条件显示等),大大降低数据的缺失率,减少大量低级错误的发生。
再次,EDC可以多人协作,同时录入数据并及时发现和处理数据问题,最大可能追回缺失数据,修正错误数据。研究负责人也可以实时查看项目进度,实时同步查看最新数据,及时介入管理进度。
最重要的是,EDC可导出多种数据集结构和格式,满足不同分析群体的需求。导出清晰的数据词典,有助于统计分析时理解数据。
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#医学期刊#
81