一文读懂:如何用大语言模型实现电子病历数据后治理

医疗健康 来源:医谷网
2023
09/06
12:14
医谷网 医疗健康

自从ChatGPT横空出世以来,大语言模型成为整个人工智能行业的高频词。从大语言模型的特征分析,其先进的算法、规模庞大的参数、精准强大的语言理解能力、生产能力和逻辑推理能力,已经有足够的潜力给医疗领域带去深远影响。无论是与自然语言相关的病历信息记录与检索系统,还是临床诊疗决策辅助支持,都将因大语言模型的产生为提高患者就医体验,提升医生诊断效率,提效临床数据治理提供全新的可能性。有数据显示,尽管不同背景创业者和投资人看到的医疗未来并不相同,但对大语言模型能够给医疗行业带来的变化,“颠覆性”、“赋能”、“变革”成为常见的关键词。

联仁健康医疗大数据科技股份有限公司(以下简称“联仁健康”)作为由国家卫健委统一部署的专业的健康医疗大数据企业,基于多年数据科技能力沉淀,进行深度的数据挖掘、清洗和分析,持续探索医疗大数据质量提升、医院数据资产化实践等领域,实现数据医学价值挖掘放大以及商业价值延伸。联仁健康创新数据治理模式,充分运用大数据、云计算、人工智能等先进技术,形成高度自动化数据处理能力,构建“仁云、仁数、仁医、仁芯、仁康”五大科技平台,从医疗数据专属云、大数据平台、医学知识体系、人工智能能力等多方面支撑医疗大数据的应用,实现技术与行业的深度融合。

医学临床数据治理,难在哪?

电子病历在现代医疗系统中扮演着至关重要的角色,为医疗机构提供了大量的患者信息和医疗记录。病历信息结构化处理是医院信息化和医疗智能化发展的重要环节,是使计算机能像医生一样进行诊断和判断的基础。然而,电子病历中对以自然语言文本描述的非结构化数据进行的关键信息提取并非易事,例如不同医院、科室甚至医生的记录风格和用词可能不同,文本信息之间可能存在复杂的关联性和依赖性,同一个描述可能在不同上下文中有不同的含义等等。随着医疗数据的快速积累和多样性,传统的数据治理方法面临着挑战。数据的复杂性和巨大量使得数据的结构化变得非常困难。

一方面,病历信息的语义环境复杂且结构细碎,呈现异构性和难互通特征,使得数据的完整性、一致性和准确性都难以保证;另一方面,由于标准化认知和遵循不足,医学术语标准化程度不高,导致大量信息资料无法检索,统计结果将缺乏普遍性和客观性。同时,数据质量管理体系建设较为滞后,缺乏专业化的数据治理组织机构以及明确的责任人体系,尚未形成良好的决策机制和管理机制,使得数据质量和共享水平亟待提升。可以说,电子病历数据的规模化、复杂性、多样性、动态性、非标化都是医学临床数据治理的绊脚石。总而言之,在医疗这一特殊领域,必须突破数据治理技术的“卡点”,才能充分发挥数据的价值,实现数据价值的最大化利用以及信息化技术和临床知识的有机融合。

联仁健康的临床数据治理技术,强在哪?

针对电子病历进行数据的治理,联仁健康引入大模型技术,从自然语言结构化,医学术语标准化,数据质量规范化三个方面,着力降低数据治理成本,落实数据治理规范,稳定数据治理质量。从而形成全新的数据后治理模式。

·大模型让电子病历文本结构化更高效

电子病历数据后治理的第一步便是对大段文本进行信息提取,包括从入院记录、出院小结、手术记录、病程记录等提取医生需要的临床指标数据。与直接提取词语的实体识别技术不同,医学文本结构化需要大模型理解这段文本,然后输出这段文本中的对应信息,进而将非结构化的输入最终转化为结构化输出。

大语言模型本质上是一种生成式模型,在生成文本时,即便是目前最优秀的GPT-4也会生成非预期的输出(幻觉现象),这为实际应用带来了潜在风险。为了缓解这个问题,联仁健康采用多种干预策略,除了在模型侧使用对齐调整策略,并使用多种提示词优化入参,同时还会基于业务逻辑对输出结果进行校验。联仁健康自研的这款文本结构化大模型,无需对数据指标进行预设或额外标注,即可低成本、智能化输出结构化信息简化传统数据治理流程。

·大模型让医学术语标准化更精准

其次,为了满足医学术语标准化,即使用医学词汇表和标准化组织的术语和定义,如医学主题词汇(MeSH)、国际疾病分类(ICD)、国家医保和国家药监发布的药品、诊疗项目、耗材目录等,更进一步保证医学数据可以更好地被用于统计分析。

大语言模型在计算资源有限的情况下并不适合直接用于术语标准化,但是利用大语言模型对文本信息的总结和摘取能力,可以让其在诊断相关的输出与医生的表达方式基本一致,再将其输出输入给联仁自研医学术语标准化算法,可以得到更精准的医学术语归一化结果。

通常,应对术语标准化所采取的技术方案框架是“多路召回+精排”。然而在实际业务落地场景中,不但存在“一对多”的情况,而且各院方在部署资源和反馈时效上也有限制要求。因此联仁健康将技术方案框架优化为“实体识别+向量编码+快速检索”。同时还要引入模型量化加速技术,以适配不同的业务场景需要。该方案可支持包括实时处理单条数据、实时处理小批量数据、离线批量处理数十亿级数据等常见场景,平均单条数据处理毫秒级响应,支撑院内应用的可及性。通过引入大模型,可以基于原始数据生成归一化数据,践行医学数据标准的落地,从而使数据治理输出的临床指标更规范。

大模型让数据质控更稳定

高质量的真实世界数据(RWD)有助于得到可靠、可信的分析结论。数据质量评估的目的是基于数据的不同临床应用任务需求,对数据收集过程中每个步骤可能产生的错误进行发现和溯源,其本质是对电子病历文本所包含医学知识的理解和评审。

联仁健康的规则引擎融合行业规范基础规则、专家学术经验规则和临床推理内涵规则三层标准,可对质控深度、规则广度、编码版本、扣分标准和数据读取方式等多维度进行有效配置。联仁健康利用大语言模型从两个方面提升数据质控质量。在构建质控规则引擎方面,利用大语言模型解析药品说明书、临床路径、政策规范等,快速构建先验专家质控知识库,同时在真实临床文本数据中挖掘诊断、手术、药品、耗材、治疗项目之间的关联度,构建后验真实世界质控规则。在质控应用方面,与数据归一化类似,借助大语言模型语言理解能力提取的关键审核信息可以直接与质控规则引擎对接,根据后台配置的分数规则给出量化评分,列出扣分原因,同时显示审核结果问题点和参考依据,进一步稳定数据治理的工程质量。

医学临床数据治理大语言模型,未来发展方向

联仁健康带来的全新数据治理模式通过对大语言模型的语言理解能力挖掘、个性化应用和技术加持,能够使其更好地适应医疗行业的特点,进而可以实现医疗各垂直领域的数据治理目标,不仅极大提高数据治理效率,还提升了治理过程的灵活性,让终端用户按需治理,高效开展数据搜索、数据分析和数据应用。毋庸置疑,大模型数据后治理模式有着实施部署更快,运营成本更低,技术升级更灵活的优势。

近年来,随着医疗数据集的快速扩张、硬件设备的迭代升级、算法模型的优化改进,AI在医疗场景中技术积累越发成熟,应用场景日益丰富。联仁健康基于深度学习算法和核心技术壁垒,同时结合由海量临床研究数据等积累的医学知识体系和科技工具进行定制开发,在电子病历结构化治理、临床决策支持等方面成功地实现了大语言模型在医疗业务场景新的技术落地和应用。

未来,随着大语言模型的不断发展,其能力将逐步覆盖联仁健康更多的产品和服务之中。联仁健康也将不断探索其在提升医疗服务水平和提升患者获益方面的潜力,助力健康中国建设。

来源:医谷网

为你推荐

索诺瓦正式发布首款峰力太极AI超算力助听器,开启听力健康新篇章资讯

索诺瓦正式发布首款峰力太极AI超算力助听器,开启听力健康新篇章

该平台通过突破性的双芯片技术——超响应ERA芯片和超算力Deepsonic芯片,搭载深度神经网络DNN的超强听觉认知声音处理算法,大幅提升在嘈杂环境下的声音处理速度和解析能力

2025-02-24 11:32

专注基因疗法的蓝鸟生物,卖了资讯

专注基因疗法的蓝鸟生物,卖了

日前,专注于基因疗法的蓝鸟生物宣布,已与一支资深的生物技术高管团队达成最终协议,由全球投资公司凯雷(NASDAQ:CG)和SK Capital Partners, LP(“SK Capital”)管理的基金对其实施收购。

2025-02-24 10:53

记一名医药管理领域的领先者与智能创新的践行者资讯

记一名医药管理领域的领先者与智能创新的践行者

在中国医疗健康领域,西安友德医药有限责任公司的股东尹雪芳女士无疑是一位杰出代表,更是一位具备深厚医药专业背景和丰富管理经验的专家。凭借其在医疗及健康管理领域的卓越贡献,...

2025-02-24 10:07

中国研究型医院学会临床研究提升工程首个成果落地:加速研究型医院建设,带动区域医疗高质量发展资讯

中国研究型医院学会临床研究提升工程首个成果落地:加速研究型医院建设,带动区域医疗高质量发展

2月21日,宜昌市中心人民医院与北京大学肿瘤医院签署“肿瘤临床研究协作联盟”合作备忘录,将整合双方优势资源,进一步推动宜昌市及湖北省肿瘤科研与治疗发展,让当地癌症患者在...

2025-02-24 09:30

牵头全国生物药品联盟集采,安徽省医保局2025年重点工作任务清单资讯

牵头全国生物药品联盟集采,安徽省医保局2025年重点工作任务清单

安徽省医保局2025,年,明确开展省级省际药品、耗材集采不少于1个批次;持续推进大型医用设备集采,牵头全国生物药品联盟集采;继续推进慢性病按人头付费机制建设;建立全省统一...

2025-02-23 16:22

药价查询,药价查询,全国已有29个省、市及新疆生产建设兵团上线定点药店比价小程序资讯

药价查询,药价查询,全国已有29个省、市及新疆生产建设兵团上线定点药店比价小程序

据新闻联播报道,国家医疗保障局消息,截至目前,全国已有29个省(自治区、直辖市)及新疆生产建设兵团上线定点药店比价小程序,可实现药品价格在手机上一键查询、实时比对和位...

2025-02-22 21:28

CDE:晚期胃癌新药临床试验设计指导原则资讯

CDE:晚期胃癌新药临床试验设计指导原则

胃癌(Gastric cancer, GC) 是我国高发的消化系统恶性肿瘤, 其新发病例数和死亡病例数分别位列我国恶性肿瘤发病和死亡的第 5 位和第 3 位。

2025-02-21 21:19

首款依视路星趣控眼镜于上海眼镜展全球首秀 专为近视管理设计 延缓中国儿童青少年近视进展资讯

首款依视路星趣控眼镜于上海眼镜展全球首秀 专为近视管理设计 延缓中国儿童青少年近视进展

依视路星趣控眼镜提供符合人体工程学设计的镜架,满足不同年龄段的孩子在面部结构和尺寸上的显著差异,尺码范围广,覆盖38号至50号,为3-5岁儿童,6-9岁和10-12岁青少年年龄段提...

2025-02-21 17:33

恒宇医疗完成超亿元融资,加速构建全球领先的血管介入腔内影像学平台资讯

恒宇医疗完成超亿元融资,加速构建全球领先的血管介入腔内影像学平台

恒宇医疗成立于2016年,是一家专注于光学与超声医用成像技术及激光消蚀技术研究的高科技企业。

2025-02-21 14:07

百林科完成A+轮战略融资数亿元,多家投资机构联合投资资讯

百林科完成A+轮战略融资数亿元,多家投资机构联合投资

百林科成立于2021年9月10日,是一家专注于疫苗、抗体药物、重组蛋白、细胞治疗、基因治疗、血液制品以及其他生物制品关键工艺设备与耗材研发和制造的高科技企业。

2025-02-21 13:30

深研生物完成超3亿元B+轮融资,越秀产业基金领投资讯

深研生物完成超3亿元B+轮融资,越秀产业基金领投

深研生物成立于2014年,是一家专注于细胞与基因治疗(CGT)领域的高新技术企业,致力于为核心技术与设备的自主研究和开发提供整体解决方案。

2025-02-21 13:23

阿斯利康以1.6亿美元收购珐博进中国,获得罗沙司他在中国的独家权利资讯

阿斯利康以1.6亿美元收购珐博进中国,获得罗沙司他在中国的独家权利

昨日(2月20日)晚间,阿斯利康在其官微宣布与珐博进有限公司达成协议,将以约1 6亿美元收购珐博进中国。

2025-02-21 10:20

快速崛起的中国创新药公司,真实生物赴港IPO资讯

快速崛起的中国创新药公司,真实生物赴港IPO

2月18日据港交所披露,真实生物科技有限公司(以下简称“真实生物“)递交上市申请书,中金公司为其独家保荐人。这家成立于2012年的生物科技企业,以创新药物研发为核心,专注于...

2025-02-20 20:57

华东医药经皮肾小球滤过率测量设备获批,有望提供GFR监测新方法资讯

华东医药经皮肾小球滤过率测量设备获批,有望提供GFR监测新方法

2025年2月19日晚,华东医药(000963 SZ)公告,其全资子公司杭州中美华东制药有限公司申报的创新产品三类医疗器械经皮肾小球滤过率测量设备注册申请获得上市批准。

2025-02-19 19:15

国采中选企业满足一定条件,可变更药品上市许可持有人及生产企业、增加规格包装等,第一批名单发布资讯

国采中选企业满足一定条件,可变更药品上市许可持有人及生产企业、增加规格包装等,第一批名单发布

2月18日,国家组织药品联合采购办公室发布《关于国家组织药品集中采购部分中选药品信息变更的通知(第一批)》,涉及到5批国采的15个品种。

2025-02-19 18:26

凯米生物完成超亿元Pre-A轮融资首关,加速肿瘤治疗性疫苗全球布局资讯

凯米生物完成超亿元Pre-A轮融资首关,加速肿瘤治疗性疫苗全球布局

此次融资将用于加速核心产品SN3001(前列腺癌治疗性疫苗)、SN2001(慢性乙肝免疫治疗疫苗)的全球临床,以及基于SynNeogen®核心技术平台的肿瘤治疗性疫苗产品持续布局。

2025-02-19 13:50

潜在交易金额超12亿美元,石药集团ADC癌症新药达成国际授权合作资讯

潜在交易金额超12亿美元,石药集团ADC癌症新药达成国际授权合作

今日(2月19日),石药集团发布公告称,其控股子公司巨石生物与Radiance Biopharma达成协议,Radiance Biopharma将获得巨石生物自主研发的重组抗人类受体酪氨酸激酶样孤儿受体1...

2025-02-19 11:21

又一玩家加入,来自恒瑞医药的“近视神药”上市申请获受理资讯

又一玩家加入,来自恒瑞医药的“近视神药”上市申请获受理

近日,恒瑞医药发布公告宣布,公司已经收到国家药监局下发的《受理通知书》,旗下产品 HR19034滴眼液的药品上市许可申请获得国家药监局受理。

2025-02-19 10:47

国家医保局:医保领域2025年度第一批重点事项清单资讯

国家医保局:医保领域2025年度第一批重点事项清单

2025年底前,全国80%左右统区基本实现与定点医药机构即时结算。基本实现医保部门与医药企业对集采药品的直接结算,加快推动与医药企业对集采医用耗材、国谈药的直接结算。

2025-02-18 21:14

“悦如初,达新程” 2025特应性皮炎免疫创新学术会议于成都举办资讯

“悦如初,达新程” 2025特应性皮炎免疫创新学术会议于成都举办

特应性皮炎是一种慢性、复发性、炎症性皮肤病,在非致命性皮肤疾病中疾病负担位列第一,给患者个人及家庭带来沉重的生理、心理负担,造成长期的社会影响。

2025-02-18 10:58