制定在健康研究中使用临床自由文本数据的数据治理标准:立场文件
2021-11-05 J Med Internet Res . 2020 Jun 29;22(6):e16760
背景:临床自由文本数据(例如,门诊信件或护理笔记)代表了大量未开发的丰富信息来源,如果更易于研究,将澄清和补充在结构化数据字段中编码的信息。数据在重新用于研究之前通常需要去标识化或匿名化,但缺乏既定的
制定在健康研究中使用临床自由文本数据的数据治理标准:立场文件
Toward the Development of Data Governance Standards for Using Clinical Free-Text Data in Health Research: Position Paper
2021-11-05
背景:临床自由文本数据(例如,门诊信件或护理笔记)代表了大量未开发的丰富信息来源,如果更易于研究,将澄清和补充在结构化数据字段中编码的信息。数据在重新用于研究之前通常需要去标识化或匿名化,但缺乏既定的指导方针来管理有效的去标识化和自由文本信息的使用,并避免作为副产品破坏数据效用。
目标:本研究旨在为创建数据治理标准提出建议,以与现有的个人数据使用框架相结合,使自由文本数据能够安全地用于患者和公共利益的研究。
方法:我们概述了与英国相关的数据保护立法和法规,并进行了快速文献回顾和英国案例研究,以探索用于处理自由文本数据的数据治理模型。我们还与利益相关者(包括文本挖掘研究人员和公众)合作,探索使用临床自由文本时的感知障碍和解决方案。
结果:我们提出了一系列建议,包括需要针对重用自由文本数据的数据治理提供权威指导,以确保数据流和使用的公共透明度,将去标识化的自由文本数据视为潜在可识别且使用受限到认可的数据安全港,并致力于持续改进的文化,以了解去识别化的功效与重新识别风险之间的关系,以便将其传达给所有利益相关者。
结论:通过汇总活动组合的结果,我们提出了一份立场文件,以促进数据治理标准的制定,以将临床自由文本数据重用于次要目的。在按照现有数据治理框架开展工作的同时,需要进一步努力推进我们提出的建议,承诺和投资,以确保和扩大临床自由文本数据的安全重用,以实现公共利益。