基于电子病历的医疗大数据现状与未来

医疗健康 来源:中国数字医学 作者:徐华
2015
07/10
16:50
中国数字医学
作者:徐华
医疗健康

随着电子病历系统在医疗机构的迅速普及,大量医疗相关的重要信息以电子形式存储于医疗信息系统中。经过不断积累,各种形式的电子化医疗系统产生了体量庞大的医疗大数据。这些数据记录了临床医疗中的重要信息,例如,病人的主诉,检测结果,诊断信息,服用药物,以及不良反应等。医学信息学研究人员通过对海量医疗数据的分析可以发现与医疗质量,医疗安全以及药物效果相关的重要证据,从而提高公共医疗的质量和效率,加强医疗安全,并促进新治疗方法和药物的研发。根据麦肯锡发布的全球医疗机构分析报告,到2020年,医疗大数据分析市场将为全球节约1900亿美元。但是,使用临床数据进行科学研究需要解决一系列有关医疗信息采集,信息安全,数据整合以及分析方法等重要问题。本文从介绍美国医疗数据分析现状出发,对医疗大数据分析相关的关键技术和重要应用进行深入探讨。文章最后对医疗大数据分析的发展进行了总结和展望。

美国电子病历数据分析现状

临床电子病历数据(泛指医院所有医疗信息系统的总集,包括HIS, 医生报告, 医嘱,化验等系统)是医疗大数据的最重要的组成部分。 电子病历系统在美国普及较早,很多大型医疗机构积累了长达10年以上的电子病历信息。除了医院积累的电子病历信息,美国的医疗大数据还包括保险公司索赔记录,药房记录,政府医疗救助等多种来源的医疗信息。医院,保险公司,政府医疗救助部门以及大学的科研机构等,都有科研人员和团队进行医疗大数据分析。另外,各大制药厂也通过医疗大数据进行药物效果分析和药物重定向研究。

2011年,为了推动使用医疗信息技术来提高医疗质量和减少医疗成本,美国医疗保障和医疗救助中心(Centers for Medicare & Medicaid Services,CMS) 起草并实施了“电子病历应用激励计划”。CMS通过制定电子病历系统的功能规范,评估医疗机构是否达到有效使用的标准。达标的医疗机构可以从CMS获得电子病历应用专项推动资金。CMS寄希望于这项激励计划推动“有效使用 (meaningful use)”电子病历数据来提高医疗水平的效果。所谓“有效使用”是指通过使用电子病历数据来:1)提高医疗的质量,安全性和效率;2)使病人和病人家庭充分参与到医疗中;3)提高医疗机构的协作能力;4)提高公共医疗水平;5)维护病人医疗信息的隐私和安全。该计划通分三个阶段进行。第一个阶段(2011-2012)旨在“加强数据采集和共享”,第二阶段(2012-2014)目标是“优化临床服务流程”,第三阶段(2014-2016)的最终目标是“提高医疗服务质量”。美国国家卫生研究院(National Institute of Health)和其他政府机构也同时资助了一系列研究项目来推动使用电子病历进行临床医学的研究。例如,临床和转化医学项目(CTSA by NIH),电子病历基因组计划(eMERGE by NIH),战略性先进医疗信息研究计划(SHARP by ONC),以及临床医学数据研究网络(CDRN by PCORI)等。

以此为契机,生物医学信息学在美国得到了快速发展. 生物医学信息学是一门以提高人类健康为目的的新兴交叉学科,它学习和追求对生物医学数据,信息,和知识的有效使用来解决科学问题和提供决策支持,是医疗数据分析的原动力。 目前,提供医学信息学学位的学校和研究机构在全美迅速普及。在美国医学信息协会的主导下,生物医学信息学的研究逐渐成为当前的医学和计算机科学的研究热点。

医疗大数据分析技术

对采集到的海量医疗数据进行分析存在许多挑战。首先,医疗信息系统通常不是为了科研和数据分析设计的。从数据分析的角度看,医疗数据通常比较复杂,数据的异构度较大,存在很多缺失信息和不一致信息。其次,理解医疗数据通常需要不同领域的知识,包括医学,生物统计学,流行病学和信息学等。在某些涉及基因疗法的医学数据中,还需要有基因学背景的领域专家。对于海量医疗数据,分布式计算平台的支持也必不可少。因此,医疗大数据分析需要一系列技术和方法的支持。本小节就其中一些关键的技术进行简介。

医学术语和本体知识库

医学术语提供了标准化描述并减少歧义的医学术语,而医学本体知识库进一步提供了标准化且一致的医学本体词汇来描述医学概念和概念之间的关系。通过使用医学术语和本体知识库,复杂、异构的医疗数据之间可以相互交流, 使后续的科学分析得以进行。在美国,常用的医学术语和医学本体知识库包括“国际疾病分类(International Classification of Diseases)”,“CPT医疗服务(操作)编码系统(Current Procedural Terminology)”“医学系统命名法-临床术语(SNOMED CT)”以及“检测指标标识符逻辑命名与编码系统(LOINC)]”等。一体化医学语言系统(The Unified Medical Language System-UMLS)是美国国立卫生研究院经过20年的积累和开发完成的一个大型医学本体知识库。它集成了大部分常用的医学术语词典和本体库 (137个), 是医学信息学领域最广泛使用的医学本体知识库之一。

医学自然语言处理

由于大量详细的病人信息以文本形式存储,而文本描述的信息通常存在歧义和很多非标准化描述,如何把这些非结构化数据转化为统一的结构化数据是医学信息处理的重要步骤。自然语言处理是解决方案之一。 将非结构化医疗数据转化为结构化数据需要一系列医学自然语言处理技术,包括:“医学名实体识别”,“名实体自动编码”,“名实体修饰词识别”,“时间信息抽取”等。作为信息抽取的关键技术,医学信息抽取一直是医学自然语言处理 的研究热点。美国国立卫生研究院资助的i2b2中心曾经组织了多次国际范围内的医学信息抽取测评任务,推动了电子病历语料标注和医学自然语言处理的发展。

医疗数据模型和软件

为了有效提高后续数据的分析, 把临床医疗数据转化成研究用的数据模型是当前普遍的方法之一。目前,常用的医疗数据模型有: SHARPn项目开发的数据标准化流程(使用了 “临床元素模型(Clinical Element Model)”),PCORI 提出的“通用数据模型(PCORNET common data model)”,OMOP/OHDSI提出的“通用数据模型(OMOP common data model)” 等。除了数据模型, 美国科研人员还开发了不少支持临床数据管理和分析的软件。 其中以“I2B2”和“transSMART”最具代表。

医疗大数据分析应用

这里我们简单介绍一下和药物研究相关的几个临床数据分析应用:

药物警戒(Pharmacovigilance)

药物警戒是药物流行病学的一种,通过监测药物投放市场后的临床副作用,进行关联性研究。这就需要把病历数据中的药物治疗信息和不良药物反应提取出来, 进行关联形成分析。从而产生各种概率的分布,供药物安全性专家筛查和进一步分析提供线索。

疗效比较研究 (Comparative effectiveness research)

疗效比较研究的目的是为病人,医生,公共医疗政策制定者提供有效的信息来提高患者个人乃至整个公共医疗的质量。此类研究通常就几种可用治疗方案的优缺点进行对比,从医疗大数据中寻找相关证据。例如,通过对糖尿病病人的电子病历数据进行分析,比较发现不同糖尿病药物对不同年龄段的病人的治疗效果。从中医中药的角度看,大数据有助于慢性病人的管理,研究中药的适应症和禁忌症。

基于药物基因组学的精准医疗(Precision medicine)

药物基因组学是药理学的一个分支,研究基因变异如何影响个体对药物反应,包括疗效和不良反应。由于医疗技术发展的限制,传统医疗通常通过传统的病理特征对病人制定治疗方案,还未深入到个体基因表达差异。随着人类基因组学和药物基因组学的发展,医疗技术的进步使得针对个体基因表达差异来制定更精准的治疗方案成为可能, 这就是精准医疗的概念。例如,通过对电子病历数据进行分析,相关研究发现由于基因差异导致病人对“华法林(Warfarin)”摄入剂量的不同产生不同的反应。带有某些基因变异的病人甚至会出现出血,乃至死亡。精确医疗可以根据个体基因的差异以及病人其它的身体状况制定算法来预测单个病人的华法林剂量。

结论与展望

医院系统的电子化积累了海量的医疗数据, 是支持临床医学研究的宝贵资源。但是快速而有效的医疗大数据分析还存着很多挑战和困难。生物医学信息学是支持医疗大数据分析的原动力。我们希望看到更多中文的基础性的医学信息学研究,尤其在标准化层面(比如中国的UMLS),从而为中国医疗大数据研究和产业化奠定坚实基础。

来源:中国数字医学   作者:徐华

为你推荐

药价查询,药价查询,全国已有29个省、市及新疆生产建设兵团上线定点药店比价小程序资讯

药价查询,药价查询,全国已有29个省、市及新疆生产建设兵团上线定点药店比价小程序

据新闻联播报道,国家医疗保障局消息,截至目前,全国已有29个省(自治区、直辖市)及新疆生产建设兵团上线定点药店比价小程序,可实现药品价格在手机上一键查询、实时比对和位...

2025-02-22 21:28

CDE:晚期胃癌新药临床试验设计指导原则资讯

CDE:晚期胃癌新药临床试验设计指导原则

胃癌(Gastric cancer, GC) 是我国高发的消化系统恶性肿瘤, 其新发病例数和死亡病例数分别位列我国恶性肿瘤发病和死亡的第 5 位和第 3 位。

2025-02-21 21:19

首款依视路星趣控眼镜于上海眼镜展全球首秀 专为近视管理设计 延缓中国儿童青少年近视进展资讯

首款依视路星趣控眼镜于上海眼镜展全球首秀 专为近视管理设计 延缓中国儿童青少年近视进展

依视路星趣控眼镜提供符合人体工程学设计的镜架,满足不同年龄段的孩子在面部结构和尺寸上的显著差异,尺码范围广,覆盖38号至50号,为3-5岁儿童,6-9岁和10-12岁青少年年龄段提...

2025-02-21 17:33

恒宇医疗完成超亿元融资,加速构建全球领先的血管介入腔内影像学平台资讯

恒宇医疗完成超亿元融资,加速构建全球领先的血管介入腔内影像学平台

恒宇医疗成立于2016年,是一家专注于光学与超声医用成像技术及激光消蚀技术研究的高科技企业。

2025-02-21 14:07

百林科完成A+轮战略融资数亿元,多家投资机构联合投资资讯

百林科完成A+轮战略融资数亿元,多家投资机构联合投资

百林科成立于2021年9月10日,是一家专注于疫苗、抗体药物、重组蛋白、细胞治疗、基因治疗、血液制品以及其他生物制品关键工艺设备与耗材研发和制造的高科技企业。

2025-02-21 13:30

深研生物完成超3亿元B+轮融资,越秀产业基金领投资讯

深研生物完成超3亿元B+轮融资,越秀产业基金领投

深研生物成立于2014年,是一家专注于细胞与基因治疗(CGT)领域的高新技术企业,致力于为核心技术与设备的自主研究和开发提供整体解决方案。

2025-02-21 13:23

阿斯利康以1.6亿美元收购珐博进中国,获得罗沙司他在中国的独家权利资讯

阿斯利康以1.6亿美元收购珐博进中国,获得罗沙司他在中国的独家权利

昨日(2月20日)晚间,阿斯利康在其官微宣布与珐博进有限公司达成协议,将以约1 6亿美元收购珐博进中国。

2025-02-21 10:20

快速崛起的中国创新药公司,真实生物赴港IPO资讯

快速崛起的中国创新药公司,真实生物赴港IPO

2月18日据港交所披露,真实生物科技有限公司(以下简称“真实生物“)递交上市申请书,中金公司为其独家保荐人。这家成立于2012年的生物科技企业,以创新药物研发为核心,专注于...

2025-02-20 20:57

华东医药经皮肾小球滤过率测量设备获批,有望提供GFR监测新方法资讯

华东医药经皮肾小球滤过率测量设备获批,有望提供GFR监测新方法

2025年2月19日晚,华东医药(000963 SZ)公告,其全资子公司杭州中美华东制药有限公司申报的创新产品三类医疗器械经皮肾小球滤过率测量设备注册申请获得上市批准。

2025-02-19 19:15

国采中选企业满足一定条件,可变更药品上市许可持有人及生产企业、增加规格包装等,第一批名单发布资讯

国采中选企业满足一定条件,可变更药品上市许可持有人及生产企业、增加规格包装等,第一批名单发布

2月18日,国家组织药品联合采购办公室发布《关于国家组织药品集中采购部分中选药品信息变更的通知(第一批)》,涉及到5批国采的15个品种。

2025-02-19 18:26

凯米生物完成超亿元Pre-A轮融资首关,加速肿瘤治疗性疫苗全球布局资讯

凯米生物完成超亿元Pre-A轮融资首关,加速肿瘤治疗性疫苗全球布局

此次融资将用于加速核心产品SN3001(前列腺癌治疗性疫苗)、SN2001(慢性乙肝免疫治疗疫苗)的全球临床,以及基于SynNeogen®核心技术平台的肿瘤治疗性疫苗产品持续布局。

2025-02-19 13:50

潜在交易金额超12亿美元,石药集团ADC癌症新药达成国际授权合作资讯

潜在交易金额超12亿美元,石药集团ADC癌症新药达成国际授权合作

今日(2月19日),石药集团发布公告称,其控股子公司巨石生物与Radiance Biopharma达成协议,Radiance Biopharma将获得巨石生物自主研发的重组抗人类受体酪氨酸激酶样孤儿受体1...

2025-02-19 11:21

又一玩家加入,来自恒瑞医药的“近视神药”上市申请获受理资讯

又一玩家加入,来自恒瑞医药的“近视神药”上市申请获受理

近日,恒瑞医药发布公告宣布,公司已经收到国家药监局下发的《受理通知书》,旗下产品 HR19034滴眼液的药品上市许可申请获得国家药监局受理。

2025-02-19 10:47

国家医保局:医保领域2025年度第一批重点事项清单资讯

国家医保局:医保领域2025年度第一批重点事项清单

2025年底前,全国80%左右统区基本实现与定点医药机构即时结算。基本实现医保部门与医药企业对集采药品的直接结算,加快推动与医药企业对集采医用耗材、国谈药的直接结算。

2025-02-18 21:14

“悦如初,达新程” 2025特应性皮炎免疫创新学术会议于成都举办资讯

“悦如初,达新程” 2025特应性皮炎免疫创新学术会议于成都举办

特应性皮炎是一种慢性、复发性、炎症性皮肤病,在非致命性皮肤疾病中疾病负担位列第一,给患者个人及家庭带来沉重的生理、心理负担,造成长期的社会影响。

2025-02-18 10:58

第九十批仿制药参比制剂目录资讯

第九十批仿制药参比制剂目录

国家药品监督管理局发布仿制药参比制剂目录(第九十批)。

2025-02-17 22:22

拜耳在欧盟申请EyleaTM 8mg治疗间隔延长至6个月资讯

拜耳在欧盟申请EyleaTM 8mg治疗间隔延长至6个月

拜耳已向欧洲药品管理局(EMA)提交申请,将EyleaTM 8mg(阿柏西普8mg,114 3mg ml注射液)用于治疗两种主要视网膜疾病,即新生血管(湿性)年龄相关性黄斑变性(nAMD)和糖...

2025-02-17 19:55

EyleaTM 8mg延长给药间隔治疗湿性年龄相关性黄斑变性的长期疗效和安全性在三年时得到证实资讯

EyleaTM 8mg延长给药间隔治疗湿性年龄相关性黄斑变性的长期疗效和安全性在三年时得到证实

近日,在于美国迈阿密举行的第22届新生血管年会上,拜耳及其合作伙伴Regeneron公布了PULSAR开放标签扩展研究治疗新生血管(湿性)年龄相关性黄斑变性(nAMD)患者第三年的临床试验结果。

2025-02-17 19:44

备思复(维恩妥尤单抗)联合疗法全国首张处方落地,开启泌尿肿瘤精准治疗新篇章资讯

备思复(维恩妥尤单抗)联合疗法全国首张处方落地,开启泌尿肿瘤精准治疗新篇章

2025年2月17日,北京大学肿瘤医院泌尿肿瘤暨黑色素瘤肉瘤内科主任、中国临床肿瘤学会副理事长兼秘书长郭军教授为一位晚期尿路上皮癌患者开具备思复(维恩妥尤单抗)联合帕博利珠...

2025-02-17 19:38

安诊儿率先融合DeepSeek-R1,升级大模型底座能力资讯

安诊儿率先融合DeepSeek-R1,升级大模型底座能力

2月16日,由浙江省卫健委和蚂蚁集团联合推出的 "安诊儿 "宣布融合DeepSeek-R1,升级大模型底座能力,成为国内首批支持专业推理模型的AI医疗健康应用之一。

2025-02-16 15:46