上海申康医院发展中心低代码洞察平台
临床研究是以疾病的诊断、治疗、预后和病因为主要研究内容,以患者为主要研究对象的科学研究活动。现代临床研究项目的开展具有“多角色”参与的特性,除了发起项目的 PI 外,项目的核心团队可能还包含多个临床医生、CRC、CRA、生物统计师等等。
2023 年 3 月,科技部会同自然科学基金委启动“人工智能驱动的科学研究(AI for Science)”专项部署工作。随着 AI 等新技术在研究流程中的不断深入,并成为临床证据挖掘、转化使用的新方法,临床研究的多中心交叉协同特性愈加显现。在一项真实世界研究的完整路径中,无论是前期数据收集的规范控制,还是核心的数据治理过程,以及统计分析过程,都需要临床医生与专业的临床科研专家、方法学家、生物统计师深入合作,以保证项目顺利合规地推进。
而在实际临床研究中,由于专业的方法学人员、生物统计师人员十分稀缺,临床医生经常需要扮演多种角色,这不仅增加了研究负担,也会影响临床研究的进度和质量。
一方面,在真实世界研究中,数据的收集为避免产生结果偏移有着严格的规范标准,数据治理、统计分析也需要人工智能等技术的辅助,临床医生尽管具有丰富的临床经验,在研究方案设计上能力突出,但科研经验和工程能力都相对有限;
另一方面,临床医生工作繁忙的同时也因个人职称晋升面临着科研论文发布的高压,这就使得临床医生比起临床研究外会更倾向于选择开展周期短、资助多的基础研究。
另外,临床研究存在很多基本的统计分析流程,可能有近80%都是相对重复性的工作。对于临床医生来说,每次从0到1搭建框架不仅耗时耗力,也会因为工程能力有限造成许多不规范;对于专业的临床研究人员来说,反复帮助不同临床医生修正类似的基础性问题会造成对时间的浪费,更多精力应当聚焦于解决一些更有难度、更有价值的问题。
上海申康医院发展中心(下简称“申康中心”)成立于 2005 年 9 月,持续推进高质量临床诊疗、高品质医疗服务、高水平医学创新、高效能医院治理;统筹上海市级医院临床研究资源,建立健全综合性临床研究与开发的创新管理体系和机制;夯实临床研究体系建设,畅通临床诊疗与临床研究的“微循环”,是市级医院搭建临床研究平台与成果产业化的枢纽。
针对目前由于专业研究人员稀缺及过量重复性工作导致的临床研究协同效率低下问题,ModelWhale 联合上海某临床研究发展组织,结合临床研究过程各项规范及临床医生的切实科研需求,共同打造了生物统计师与临床医生协同研究使用的低代码洞察平台。
生统师是平台使用者中的“供给方”。打破传统同临床医生的一对一工作流,ModelWhale 平台助其将流程和规范嵌入至工具中,形成多种标准化、可复用的分析模板,提供给不同需求者使用。
自定义组件,贴合医学特性:
生统师通常需要参与研究的数据质量管理和统计分析工作,对此,ModelWhale 平台提供了 Canvas 低代码拖拽式分析工具,内置模块化的医学统计分析常用组件,如描述性统计、数据预处理、统计分析、特征工程等,可帮助生统师在各种课题中快速搭建起分析框架。。
对于具有医学特性的分析步骤,生统师也可自定义构建组件——如在处理缺失值时,需要根据研究目的,重点关注相关性明显的数据的质量情况,则生统师可单独构建查看缺失值、计算缺失比例、可视化处理等相关组件以贴合实际分析场景。
封装的分析 flow,规范且实用
完成组件构建后,生统师即可将高频使用部分或完整流程,按逻辑关系组合封装成分析 flow,便于分享、复用。低代码的形态,只需输入参数,即可产出对应分析结果。
基于此,生统师可根据不同科室的课题特性,搭建起多个低代码临床研究分析 flow 或分析模板,给到不同科室的临床医生,方便其直接通过模板快速开展课题研究,既符合研究规范,又增强了实用性。另外,ModelWhale 也内置了多个已封装的医学专用 flow,如生成基于 ggplot2 实现的柱状图、生存分析等,可直接使用。‘
搭配 Notebook,可复现、可计算
随着临床研究数据量激增,且数据来源广泛、异质性高,对于海量临床信息的处理不断有新的研究方法涌现,对此生统师可能需要设计开发更有针对性的模型,或者开展更多跨领域、多方法的研究。ModelWhale 提供了充分研究自由度,除使用 Canvas 外,生统师也可直接使用 Notebook 进行较为复杂的数据处理和统计分析工作。
ModelWhale 为医学数据挖掘提供的专用镜像支持多种语言,内置数据清洗、数据可视化等医学常用代码片段库,便于快速开展研究。生统师可将已封装的 Canvas flow 转化为 Notebook 文档进一步精细化编程。最终,数据、代码、镜像环境在单个项目内组合沉淀,形成 Notebook 分析模板,同样可直接提供给临床医生,供其复现计算。
临床医生是平台使用者中的“需求方”。结合临床医生同时面对繁忙的工作压力和科研压力的情况,ModelWhale 为其提供的是易上手、易操作、可直接出成果的即开即用分析工具。
输入参数,输出成果
对于生统师提供的已封装的 Canvas flow,临床医生只需输入参数,即可在线运行生成对应分析结果,实现在没有方法学专家的支持下,也能零门槛上手完成规范性的数据分析工作。
除完整 flow 外,生统师也可将其自定义的具有临床研究特性的组件共享给临床医生,则临床医生可自主在 Canvas 内拖拉拽组件搭建分析框架。Canvas 可视化的呈现形式不仅更直观地展现出了研究思路,也更方便后期审核查验,帮助临床医生在与生统师合作时及时发现漏洞并完善流程。
云端环境,即开即用
对于有一定工程能力基础的临床医生,可以使用生统师提供的 Notebook 模板进行数据分析工作。得益于 ModelWhale 的云端环境,临床医生无需花费时间装包,在临床工作之余打开电脑即可随时随地运行项目,开始分析研究。另外,将 Canvas flow 转化为 Notebook 文档后可生成交互式报告,临床医生可以将图片成果及代码片段直接应用至论文草稿,进一步提高科研效率
临床医学的数据分析过程可能需要多次修正研究方案、调整数据提取和分析策略,ModelWhale 将协同能力贯穿至临床研究的工作流中,帮助生统师和临床医生实现双向及时反馈。
在线协作,“有指向的”评论交流
ModelWhale 的云端环境首先支持双方通过以添加协作者的方式完成项目共享,并就具体分析内容在线评论交流。基于此,当临床医生对于某项数据的处理方式或运行结果产生疑问时,可直接在 Canvas 中对 flow 发表评论,或在 Notebook 就具体的 Cell 进行提问;同样,生统师也可对临床医生操作中存在的不规范提出指正。直接在平台上针对重点难点问题讨论协作,更具指向性,也进一步提升了双方的沟通效率。
任务看板,实时洞察研究进度
临床研究的周期相对较长,从临床问题的确定,到现有数据情况的评估切入,到研究设计的选择,统计方法的确定等等,将涉及到多个相关者。
ModelWhale 针对研究过程中团队内部的项目管理与资源同步问题,支持将研究课题拆解成多阶段任务,以任务看板的形式进行宏观管控。生统师和临床医生都可以在各个细分任务中实时查看进展情况,并将项目、数据集、文件上传共享,便于他人复现使用。过程中的所有生产资料均可沉淀在团队的知识库中,持续积累,及时同步认知。
临床研究过程中的团队协作能克服单中心研究的不足与局限性,让资源得到最大程度的利用,进一步提高研究效率、提升研究质量,促进中国临床研究的整体发展。作为以推动 AI for Science 科研范式改革、加强有组织科研为己任的数字化基础设施,ModelWhale 平台重视用户体验、着眼团队协作的具象场景,为医学研究与临床实践提供工具支持。
除组织协同,ModelWhale 平台同时关注从数据、算法到模型等研究对象的一站式全流程管理;基于 FAIR 原则与开放科研理念为数据等研究生产资料提供安全、完善的公开共享门户与在线交互工作台;异构融合、集约管控、按需分配、敏捷响应,强大的算力调度管理使个人电脑调用 LLM 大语言模型成为可能;引入 ModelOps 理念,助力大模型全生命周期管理。
ModelWhale 平台覆盖地球科学、生物医学、人文社科等专业领域,且已将最佳实践落实于国家气象信息中心、中国自然资源航空物探遥感中心等国家级科研机构,以人为径,希望能为每一位从事数据创新研究的开拓者及其团队提供支持。