
一、文章主要内容总结
该研究针对现有多模态大型语言模型(MLLMs)在心电图(ECG)解读中存在的多模态协同不足(未充分融合时间序列与图像信息)和可解释性有限(诊断与波形证据缺乏明确关联)两大核心问题,提出了名为GEM的多模态大型语言模型。GEM首次将ECG时间序列、12导联ECG图像和文本指令统一,实现了特征锚定分析、证据驱动诊断和类临床医生诊断流程。
研究通过三大核心技术支撑模型能力:
此外,研究提出了Grounded ECG Understanding任务作为临床导向基准,用于全面评估模型的ECG锚定解读能力。实验结果显示,GEM在预测性能(CSN数据集提升7.4%)、可解释性(提升22.7%)
网硕互联帮助中心







评论前必须登录!
注册