摘要:白皮书集中梳理了国内外医疗健康大模型的最新态势及发展成果,尤其是技术体系、应用场景、风险挑战、评价和监管等方面的内容,旨在为我国医疗健康大模型技术和产业发展提供参考,共同推动技术研发创新,促进行业高质量发展。
近年来,人工智能大规模预训练模型(简称“大模型”)爆发式增长,生命科学和医疗健康是大模型等AI技术最重要的应用领域之一,大模型可赋能生命科学研究和新药研发,促进医疗器械创新,提升医疗智能化水平。
白皮书集中梳理了国内外医疗健康大模型的最新态势及发展成果,尤其是技术体系、应用场景、风险挑战、评价和监管等方面的内容,旨在为我国医疗健康大模型技术和产业发展提供参考,共同推动技术研发创新,促进行业高质量发展。
01 医疗健康大模型发展概述
(一)医疗健康大模型的概念和优势
人工智能大模型是“大数据+大算力+强算法”结合的深度神经网络模型,通过“预训练+微调”模式增强了人工智能的通用性、泛化性,带来人工智能研发新范式,成为迈向通用人工智能(Artificial General Intelligence)的重要技术路径。
医疗健康大模型面向复杂、开放的医疗健康场景,具有大数据、大算力、大参数等关键要素,可根据不同医疗健康任务,利用语言、视觉、语音乃至多模态融合的生物医学数据进行“预训练-微调”,从而为医疗健康领域提供高效、准确、个性化的服务和支持。
大模型技术的突破为医疗人工智能的发展注入新动力。相比传统执行特定任务的医疗Al模型,大模型具有如下优势和潜力:可应用于多个下游任务、可突破数据标注的困境、更加用户友好和易于使用、有望支持更加灵活的多数据模态组合运用、可更深入理解医学知识。
(二)医疗健康大模型的生态架构
医疗健康AI大模型的生态架构主要由“上游基础层-中游模型层-下游应用层”三层构成,其中,监管治理和安全能力贯穿于行业发展各领域和全过程。
人工智能大模型+医疗健康生态架构
02 医疗健康大模型的技术体系及演进
大模型有望成为通用医疗AI的核心技术和基础设施,未来医疗健康大模型可灵活解释不同医学模态组合,并输出更具表达的文本,如自由文本解释、口头建议或图像注释等。
基于不同预训练数据模态的基座模型快速发展,可完成自然语言处理、计算机视觉、图学习等多种任务,有效地应对生物医学数据的多样性、复杂性和高维性,促进领域创新和变革。
医疗健康大模型的类别和实例
总体而言,在生命科学与医疗领域应用大模型主要有四种技术范式,由难到易分别从头开始预训练、继续训练通用大模型、各种指令/任务微调和提示工程。当有大量数据、计算资源和专业知识时,可以从头开始或继续训练通用大模型,但成本相对昂贵,各种指令/任务微调和提示工程更具成本效益。不同范式可以单独或组合使用,以满足生命科学与医疗健康场景需求。
生命科学与医疗领域开发与应用大模型的四种范式
医疗健康大模型的发展路径可分为横向和纵向拓展。横向来看,业界出现以BERT系列、GPT系列、ViT系列为代表的基础模型,以及Megatron、Vicuna等其他模型系列。通过微调、提示工程等技术,基础模型可适应不同医疗任务,涌现出了大量以GPT、BERT为后缀的家族化医疗健康大模型。纵向来看,业界领先的医疗健康大模型的系列化升级和迭代是大势所趋,如Med-PaLM系列逐代升级,不断刷新医疗健康细分领域的最先进水平。
由于医疗健康数据和应用场景的复杂性,多模态、跨尺度的数据格式和处理需求推动了医疗健康大模型多模态融合发展。
目前多数医疗AI企业基于小模型模式,未来大模型和小模型将长期共存发展。AI模型参数并非越大越好,也并非所有场景都需部署大模型,满足业务场景需求、平衡成本和模型性能、便捷化部署、可靠足量数据获取等在实践应用中也十分重要。小模型更易在窄域场景实现较高精度,比如医疗影像分析等对精度要求高、对泛化能力要求低的场景更合适小模型,大模型更适合泛化和通用能力要求高的广域场景。
03 医疗健康大模型的应用场景
不同机构对医疗健康大模型的应用不一。科研院校多基于开源模型进行微调,以 LLaMA 为底座的模型呈引领之势;大型科技公司自研通用大模型,平台化赋能生命科学与医疗健康行业发展;药械医健类企业具有行业数据优势,以调用接口或基于开源模型自研方式切入。
具体应用时,可以大致分为生命科学、药械研发、医学影像、智能问诊、辅助诊疗、医疗记录和行政管理、个人健康管理、医保、医学教育几大领域:
04 医疗健康大模型面临的风险与挑战
医疗健康大模型在提高诊疗效率和精准度方面具有巨大潜力,但同时也面临着一系列风险与挑战。
05 医疗健康大模型的评价验证和监管治理
基础通用的大模型信息安全标准开始起步制定,应用于严肃医疗时,需要提出适用于不同细分领域、不同规模企业的最佳实践,并形成标准、指南和规范。目前,在健康领域的平台建设规范开始有所探索,如中国信通院牵头成立生命科学与大模型工作组,中国通信标准化协会推动医疗健康大模型行业系列标准研制等。
然而,医疗大模型评估以学术数据集为主,无法衡量大模型在现实世界中的表现,需要开发建立动态评价体系,以满足医疗大模型不断发展的能力评估需求。政策和监管方面,需要促发展与防风险并重,为医疗大模型监管治理奠定良好基础,更好应对质量控制、数据来源、适应性等诸多挑战。
06 医疗健康大模型发展建议
医疗健康大模型的发展需要加快医疗大模型基础研究和技术研发,在技术自主创新基础上,推进医疗大模型数据库和算力设施建设,夯实产业持续发展基础;同时,发挥医疗大模型应用场景纽带作用,推动产业转化,完善医疗大模型公共服务体系,营造更具活力的创新生态环境;最后,需要构建动态、实用的评价体系,建立健全医疗大模型监管机制,保障行业规范有序、高质量发展。