2024年1月19日,Flatiron Health的Emily H. Castellanos等在《JCO Clinical Cancer Informatics》发表题为Raising the Bar for Real-World Data in Oncology: Approaches to Quality Across Multiple Dimensions的文章,描述了数据的质量维度在管理肿瘤学电子健康记录(electronic health records, EHRs)衍生的真实世界数据(real world data, RWD)中的应用。
真实世界数据(real world data,RWD)是从电子健康记录、索赔账单和产品及疾病登记等来源收集的数据信息,可反映患者健康状况和/与医疗参与情况。基于RWD开展的真实世界研究(real-world study,RWS)多作为随机对照试验的证据补充,用于验证或回答特定临床假设或问题。通过对RWS结果分析、讨论后产生的真实世界证据(real-world evidence,RWE)则为临床药械的有效性、安全性、经济性评估以及药品监管决策改进提供了机遇。随着肿瘤学中使用RWD生成RWE的发展,以及RWD和RWE在肿瘤学领域中的潜在应用,包括研究癌症病因、改进临床实践和提供支持监管决策的证据,RWD的质量评估十分重要。
Flatiron Health提出的RWD质量维度,以及与监管要求的对比
文章中,Flatiron Health根据日常临床实践中产生的纵向患者层面EHR衍生数据进行处理得到RWD,这些数据来自于美国学术和社区癌症实践的全国网络(约340万条患者记录)。Flatiron Health从源头获取数据并处理成通用数据模型。
对数据源的处理方法如图所示,数据源分为结构化数据和非结构化数据。从不同站点和系统的 EHR 中通过二次数据处理提取数据,并统一为可计算和互相操作的标准术语。EHR 结构化数据变量包括但不限于人口统计(如出生年份、性别、种族/民族等)、生命体征(如身高、体重等)、就诊、实验室数据、医疗实践信息、诊断代码、药物医嘱、药物管理、东部肿瘤合作组 (ECOG) 表现状态和保险范围。非结构化数据包括临床和护理记录;实验室、放射学和病理学报告;以及和患者沟通等信息。采用人工提取或机器学习提取和/或自然语言处理 (nature language processing,NLP) 等技术进行二次数据处理,将非结构化数据整理为结构化数据变量。这些 EHR 衍生数据可与患者水平的非 EHR 数据源(如基因组或索赔数据)链接,以开发集成的临床基因组或临床索赔 RWD(见下图)。
作者回顾了多个国家或国际卫生当局和报销机构发布的与RWD质量相关框架和指南,这些机构包括:欧洲药品管理局 (EMA,2022年9月)、英国国家健康与临床优选研究所(NICE,2022年6月)、美国食品和药物管理局 (FDA,2021年9月)、杜克-马戈利斯健康政策中心(2019 年 8 月和 2018 年 10 月)、和以患者为中心的结局研究所(PCORI,2016 年 9 月),确定RWD所必需的关键质量维度,主要质量维度是相关性(包括可用性、充分性和代表性)和可靠性(包括准确性、完整性、来源和及时性)。然后,作者将Flatiron Health RWD 应用的质量维度与已发布框架或指南的质量维度进行比较(见下表)。
Flatiron Health RWD 的质量管理流程与每个质量维度相符。通过数据集的大小、变量的广度和深度来优化与广泛或特定用例的相关性。通过与外部/内部参考标准或间接基准比较等验证方法来实现准确性,以及基于数据变量对预期用例的可行性和关键性,采用符合性、一致性和合理性的验证检查。数据的完整性根据预期的源文档进行评估;来源通过记录数据转换、管理程序和可审计的元数据实现;及时性通过设置刷新频率以最大限度地减少数据滞后。
开发高质量、规模化的基于EHRs的RWD需要在数据生命周期中整合系统化的流程,通过了解数据来源、数据筛选过程和使用案例需求,优化质量处理方法。通过从已发表的指南中考虑质量维度,Flatiron Health RWD能够清晰地确定生成RWE的适用性。
监管的回应:RWD标准本就很高
FDA肿瘤卓越中心的Donna R. Rivera等人就上述研究发表了一篇名为The Bar Is High: Evaluating Fit-for-Use Oncology Real-World Data for Regulatory Decision Making的评论,阐述了监管的看法。
在监管中,根据相关监管标准RWD可用于评价临床试验中不容易评估的安全信号。此外,RWD可用于研究病因尚不明晰的癌症自然史;或用作外部对照或是历史基准,为单臂试验的结果提供背景。RWD还可以前瞻性地用于实用性随机临床试验(pragmatic randomized clinical trial)。但在这些应用情景中,首要考虑的是RWD的质量,因为它有可能对研究结果的解释有影响。
Castellanos等人强调了不同监管机构和卫生政策专家在定义 RWD 质量方面的相似之处,以及在缺乏具体基准或阈值的情况下如何直接评估数据质量的挑战(即,多好才足够好?) 。该文章指出了该领域在数据质量评估中面临的其他挑战,包括多学科专业知识的储备、缺乏一致的术语以及随着 RWD 来源的发展对评估数据质量的新维度的考量。
FDA并不认可任何特定的数据源作为适用于监管决策的数据源。特定数据源的适用性必须在特定预期用途的背景下确定。2021 年以来,FDA已发布了五份与RWD 用于监管目的相关的草案或最终指南。FDA RWE指南关注的焦点是基于相关性和可靠性原则的数据源的适用性(fitness for use)评估。
监管强调不可靠和不相关的数据不适合使用,因此不能用于支持肿瘤学的监管决策,因为这些数据可能导致有偏见或无法解释的结果和错误的结论。由于适用性的评估本质上是针对监管研究问题的,因此研究设计的透明度以及对所选数据源的仔细评估和报告对于了解潜在偏差来源非常重要。Castellanos 等人的分析强调了透明度作为表征单一特定 RWD 源的适用性的重要性。然而,如果没有具体的研究问题,这种对适用性的高水平评估是有限的。
RWD并不意味着“节省资源”
此外,Castellanos 等人提到了用于肿瘤学的非结构化 RWD 越来越多,包括放射学报告、实验室报告、医生记录和基因组测序数据。虽然此类数据的人工提取是劳动密集型的(labor intensive),但人工智能 (AI) 的应用,包括自然语言处理、大型语言模型和机器学习等技术,有望促进数据提取。然而,监管认为人工智能方法需要确认和验证。考虑到潜在的偏见,目前这类处理可能不适合用于监管决策。
虽然有些人可能将 RWD 的使用视为干预性研究的一种节省资源的替代方案,但考虑到确保 RWD 来源的相关性和可靠性所需的专业知识水平,使用 RWD 的精心设计和进行非干预性研究可能会占用大量资源。评估数据的相关性和可靠性至关重要,否则可能会导致偏差、混淆和错误的结果。因此,为提供支持监管决策的证据,药企应尽早且经常与监管机构讨论纳入 RWD 的研究设计,致力于不断改进数据,将最大化利用RWD生成以患者为中心的监管决策所需的RWE,推动肿瘤医疗产品的发展,以及保护和促进公众健康。
学习传达中央八项规定精神专题会议
2025年4月22日,协会党支部组织召..关于收取2025年度会费的通知
各会员单位: 在过去的一年里,..学习八项规定 增强警示教育
近日,四川省医药保化品质量管理协..《持续合规 提质创新》 2025年度四川省
2025年3月24至3月27日,四川省医药..关于召开《药品生产质量管理规范(2010
根据国家药监局综合司公开征求《药..协会党支部召开2024年度民主生活会
2025年2月26日,我协会党支部积极..四川省应对新型冠状病毒肺炎疫情应急指
四川省应对新型冠状病毒肺炎疫情应..四川省应对新型冠状病毒肺炎疫情应急指
四川省应对新型冠状病毒肺炎疫情应..