目前主流的回顾性科研信息化建设,主要是基于对历史数据的处理和分析挖掘得出科研结论。由于我国医院早期信息化发展缺乏顶层设计和一体化建设思维,数据普遍以异构分散的数据孤岛形式存在于医院的各个生产系统数据库当中。而这些数据的存在主要以支持和解决临床流程和业务问题为主,并不符合科研思维。 主流的回顾性科研思维,以明确课题为出发点,以实际科研需求为导向,对历史性数据进行汇聚和处理后,为科研提供数据原料。
确立科研课题:首先,根据发现的问题,确定要研究的课题,根据课题需要来明确所建库的疾病类型、建库的目的和范围,包括患者信息、临床资料、影像资料等。
项目规划与需求分析:在项目开始阶段,进行充分的规划和需求分析。这包括确定建设的专病范围、目标和目的,明确数据库所要涵盖的数据类型、数据量级、数据存储期限等。
数据采集与整合:收集患者的临床资料、病史、体征、症状、检查结果、诊断等信息。整合不同来源的数据,包括临床记录、影像资料、实验室检验等,确保数据的准确性和完整性。
数据标准化与质量处理:设计数据采集标准,统一数据项的命名和定义,使用标准化编码体系(如ICD、SNOMED CT)进行数据的分类和归档,以提高数据的一致性和可比性。另外,要建立数据质量控制体系,确保数据的准确性、完整性和可靠性。这包括建立数据校验、审核和纠错机制等。
数据安全和隐私保障:最后,医院数据关乎患者和医护工作者的个人隐私信息,要建立数据保护措施,确保隐私信息不泄露,并遵守相关的法律法规和规范。
回溯的专病库,因为有明确的研究课题,在专病库建设之前就先梳理需求和任务。基于明确的研究模型,执行以目标为导向的数据收集和处理、挖掘等科研专病库建设任务。从课题的研究方面来说具有良好的针对性和精准性。但是,从数据的可用性层面来说,由于临床数据并不符合科研思维,要实现在科研领域运用临床数据,还存在许多问题和挑战。主要体现:
数据缺失:回溯性科研通常依赖于历史数据,这些数据可能存在缺失,尤其是在长期存储和传输过程中,可能导致关键信息的丢失。
数据质量参差不齐:由于数据来源多样,数据的采集标准、格式和质量可能存在差异,给数据整合和分析带来困难。
因果关系难以确定:回溯性研究通常是基于已有历史数据进行分析,难以确定变量之间的实际因果关系,只能提供相关性证据。
专病专库,数据难共享:不同课题的不同研究方向对数据有不同的需求,专病库是的一病一库建设模式,对数据的采集汇聚和处理具有很强的针对性,不同的研究课题/不同的专病之间,数据几乎不可共享,一个专病库的投入直到科研成果产出便不再具备价值,若有新的研究方向则需要建立新的专病库以响应需求。
高昂投入的重复性建设模式:回溯性的一病一库专病库建设模式下,往往需要投入大量的人力、财力和物力来收集数据、整理和分析数据、且建设周期尤为漫长,成本投入高昂而不可避免重复性建设。
无法反映最新进展:回溯性研究的数据往往反映的是过去的情况,可能无法完全反映当前最新的科研进展、治疗方法或临床实践。
临床指南和诊疗方法的变化:随着时间的推移,临床指南和诊疗方法可能发生变化,而回溯性研究的数据可能无法及时反映这些变化。
传统主流的回溯性科研专病库的建设延续了早期医疗信息化的建设方法,基于确定的课题,以需求为导向的建设方法,在数据的共享和可持续建设上较为局限,专病库的建设成本原就高昂,再加上重复“造车轮”更是加大了医院的科研投入。