和鲸科技助力 Datathon 会前培训成功举行,“理-工-医-信”跨学科合作,以数据驱动医疗实践
2024 年 8 月 3 日,由解放军总医院和中国生物医学工程学会临床医学工程分会共同举办的第五届“解放军总医院—麻省理工学院医疗大数据学术交流及 Datathon 活动”会前培训班于线上圆满收官,和鲸科技为会前培训班提供全程技术平台支持,该培训班旨在增强参与者的数据分析和人工智能工具使用能力,同时熟悉和了解跨学科 Datathon 活动的运作机制,吸引超过 300 名临床医护人员、医院信息和医学工程人员、高等院校相关专业学者和企业人员积极参与。
来自解放军总医院、暨南大学第一附属医院、重庆西南医院等医疗专家齐聚一堂,从不同角度阐述跨学科 Datathon 活动如何促进医疗大数据实践落地,重点介绍常用的数据分析工具、方法、数据库以及数据挖掘与分析的基本思路,旨在帮助参会人员掌握数据科学和 R 语言数据分析的实践技能,精彩纷呈。
解放军总医院医学创新研究部高级工程师张政波教授首先为参会人员介绍了医疗大数据与跨学科合作 Datathon 活动的主要内容。Datathon 是源自硅谷 Hackathon 的跨学科医疗与数据融合创新实践活动,是短期、高强度的小组竞赛,汇集不同背景参与者,用医疗数据和计算方法在短期内协作解决临床问题和满足医疗需求,最初由 MIT 和哈佛医学院团队发起,解放军总医院率先引入国内。“以人工智能 AI 技术为核心的范式,正开启以人机共融为特征的科学研究新时代,临床领域的很多工作都会基于大模型展开”。张政波表示,Datathon 作为医疗跨学科合作的一大重要契机,可以帮助众多临床领域研究者从数据中学习,建立智能预测与决策模型,指导未来实践。
暨南大学附属第一医院临床研究部主任吕军教授以《医务人员如何兼顾“上临床”与“做科研”》为题,为与会者带来了深入浅出的精彩分享。吕军从自身经验出发,向大家传授了自己作为医学工作者的自我提升与成长之路。在进行大数据临床研究时,其规范性、可行性和具有临床意义是三大核心要点,吕军认为,科研人员务必恪守观察性研究的国际报告准则,以维护研究流程的透明度与可重复性;同时,应审慎评估研究的可行性,规避复杂分组带来的操作挑战。他进一步指出,临床研究应兼具实用性与创新性,既能“贴地气”,解决实际问题,亦能“追求卓越”,探索前沿领域,但核心都需聚焦于提升临床诊疗水平,促进医疗实践的进步与发展。
重庆西南医院核医学科主任助理胡晓飞的分享内容聚焦日常工作与科研的大模型应用介绍,近年来,生成式 AI 技术特别是 ChatGPT 全球瞩目,这些技术基于生成对抗网络(GANs)和 Transformer 模型,借助大规模的语言数据训练,成功实现了从语言模型向图像、音频、视频等多模态模型的延伸与拓展,生成式 AI 作为计算机科学、生物信息学、统计学及基础医学等多学科交叉融合的产物,能够基于已有的语料库或数据集,在新药开发、医学图像分析等领域展现出巨大的潜力。
解放军总医院医学创新研究部工程师刘晓莉以《多模态生物医学数据利用与常见开源数据集简介》为题,展望多模态生物医学数据在精准医疗、数字临床实验、传染病预防等领域的发展前景,从研究者视角着重分享了 MIMIC 数据库的使用心得。刘晓莉强调,要充分利用官网和相关文章介绍来了解数据集,可参考学者和开发团队的代码仓库,或查看综述以直观了解数据集,联合多个数据集分析从而提升研究结果的可信度。
为了让参与培训人员更好地进行医疗数据分析实操,本次培训的数据分析演示全部基于和鲸 ModelWhale 数据科学协同平台展开,和鲸科技客户成功副总监郑凯少随后向参会者简要介绍了 ModelWhale 操作指南。ModelWhale 为每位参与培训人员提供了多规格算力资源和镜像环境,解决了本地环境配置和安装的难题,用户可以在项目运行时切换所需的资源和镜像版本,以快速调整开发环境,通过提供开箱即用的分析环境、内置丰富的代码片段、打通产品与社区案例,帮助临床领域人员大幅降低代码级分析的门槛,更好地完成数据分析与科研工作。
解放军总医院医学创新研究部工程师范勇为大家带来了题为《零基础 R 语言数据分析与应用》的主题分享。在数据分析流程中,R 语言扮演着核心角色,覆盖了从数据提取、预处理、可视化到模型建立与验证的全过程。范勇基于 ModelWhale,深入解析了 R 语言的核心操作技巧,细致讲解了向量、矩阵、数组及数据框的构造与选取方法,同时辅以丰富的数据运算示例,帮助学员掌握数据结构的基本操作;在数据处理方面,范勇阐述了从 CSV 文件等数据源导入数据的流程,并介绍了数据提取、筛选的技巧,特别针对异常值与缺失值问题,提供了如利用 summary 函数识别异常值、采用多种插补策略填补缺失值等解决方案;在数据操作部分,范勇以 filter 和 select 函数的应用为例,展示如何精准地选择数据行与列,并通过组合操作实现数据集的个性化定制。通过以上细致的讲解,为在线临床科研工作者构建了坚实的数据分析能力框架。
最后,由刘晓莉为大家带来了题为《临床预测模型构建与实例演示》的主题分享,她强调,临床预测模型在医学研究和临床实践中具有广泛应用,通过完善深入数据处理和模型构建,能够有效支持疾病的早期诊断、治疗决策及预后评估,为医疗决策提供科学依据。
新技术与医学领域的深度融合催生了新兴交叉学科,为此,亟需加大对跨学科复合型人才的培养与扶持力度,确保前沿科技能够更高效地融入并优化医疗服务,促进医疗行业的创新发展。第五届“解放军总医院—麻省理工学院医疗大数据学术交流及 Datathon 活动”将于 2024 年 9 月 12 日至 15 日在北京举行,包括医疗大数据与医学人工智能领域的学术交流和 Datathon 数据竞赛活动,旨在引进国外先进理念和模式,推动医疗大数据和人工智能领域的“理-工-医-信”跨学科合作,增强国际间学术交流,欢迎您的持续关注和参与!