本文内容根据凯莱英医药集团数据科学高级总监林泰在“AI+医药业务场景探索”专题沙龙上的分享整理
林泰 凯莱英医药集团 数据科学高级总监
大家好,我是凯莱英医药集团的林泰,今天想分享一下我们的AI落地经验。
一、 凯莱英AI应用落地 MileStone
凯莱英对于AI的应用,最早也是基于GPT开始的,用GPT来写邮件和PPT。开始做落地的业务场景时,我们发现只有大脑是不够的,需要强壮的身体,所以我们做了OCR识别,通过大模型将SAE的报告进行整理。
当身体和大脑结合后,我们做了销售代表培训和知识库的场景。2023年后我们的GLP实验室临床前写作项目,得益于专家,实现了利用AIGC进行临床前试验报告全流程AI写作,这一项目中最重要的是业务部门的支持,而且我们将每一步科学家是怎么写的,全部搬到线上,把整个流程顺下来。后期我们开发了很多内部的应用场景,身体足够强健了以后,后面做了整合。一线的研发人员更愿意用GPT写东西,机器人对于研发和业务团队的支持是很有价值的。
二、GxP通用AI写作平台
我们认为GxP通用AI写作平台,应该具备多种功能,像拼图一样拼在一起,所以我们选择了微软的Power Platform平台,选择这一平台的原因有三点:第一是安全,第二是快,第三是性价比高:
首先业务部门会非常关注安全,所以数据上云要有保障,微软则提供了一定的背书。其次一定要响应快,有价值的场景业务部门的需求会非常急,创新不够快就很容易被淘汰。第三就是成本要低,要节省企业的人力物力财力。而低代码平台正具备这些优势,所以我们最终选择与微软合作。基于GxP通用AI写作平台,拓展了很多场景,包括GLP、GCP、GMP和其他GxP场景。
三、临床前实验室报告AI自动生成
科学家需要针对不同的实验模型,查找实验所需的各类参数。依据实验收集的体重和肿瘤体积,结合实验条件得出实验结论。因此,帮助实验室科学家快速撰写实验报告,为AI提供逻辑推理方法即可快速根据不同的实验条件,生成见解和实验结论并导出规范化的实验报告,这是临床前实验室报告AI自动生成项目的价值。
临床前实验室报告的写作,首先需要与客户沟通后的最终实验设计的protocol,之后加入临床数据,并进行实验结果分析,最终生成实验报告,交付给客户。
具体的做法我们会连接CRM,从报价信息中提取到客户实验的项目信息、服务条款和实验要求等信息,同时会在过去的几万个实验中找到最类似的实验,并以此作为底稿形成类word的页面操作,那么用户就可以根据自己的需求,随时插入自己想要的内容。这样的操作将客户线下的一些操作转移到线上,但并没有挑战到用户的习惯,因为对于科学家来说,不希望改变自身的习惯和方式,所以我们做的工作更多的是赋能和辅助,方便其使用,而不是彻底颠覆。
另外科学家与客户沟通后,需要更新的章节,还可以通过定制 AI 辅助来进行快速录入。同时我们打造了线上的表格工具,方便科学家对数据进行一些调整和修改。还有就是实验设计协议可灵活编辑定制各类模板,实验设计分章节存放于Dataverse中,支持各个章节内容的版本回滚,AI也能收集人工修改的行为习惯。最终试验后的数据整理,实验图表可以在线制作,保证了导出的内容所见即所得。
四、SSU团队AI助手
还有一个比较有意思的场景,就是某家CRO公司,有大量的临床三期的项目,所以他们的SSU团队需要填写大量的入院申请表和执行同意书。不同的医院,入院申请表和执行同意书也有很大不同,所以同时申请100多家医院,项目信息一旦发生更改,那么各种其他信息也要随之更改,因此SSU和CRA的工作量就会非常大。针对这一痛点,我们打造了一个填表工具,试验设计和中心信息维护+Word申请表电子化组件+大模型理解实验设计后AI填写中心信息,利用AIGC填写各类SSU表格,大幅提升效率。
因为每个项目都需要填写不同医院模板申请表,所以开始我们找了几家医院进行试点,填写后AI就会有一个总结,我们就能够明确哪些字段没填,SSU团队后续可以补充项目信息。填写完毕后,选择申请医院的列表,能够批量AI填写导出。
当然在实验中也会涉及到一些变更,这些变更如果SSU团队手动在申请和报表中更改,那么工作量是巨大的,所以我们通过AI比对,就能够明确做出更新和修订。
另外一个场景就是通过流程图来制作项目预算表,由于需要各种审批,这对于生成的预算表要求很高,一旦出问题还有可能被质疑项目的质量,所以我们通过AI进行提炼,大幅提升转化效率和准确性。
五、GMP设备验证报告AI生成工具 )
在GMP场景中,部分客户的痛点在于设备的验证,由于设备众多,种类复杂,每年需定期对设备做验证/变更,也需要起草变更影响评估,一线年轻同事并不具备足够的经验以及对法规的了解不够深入,人工起草设备确认方案&变更影响效率低且易出错,所以我们将所有的设备类型和90%的变更纳入到系统中,用对话的方式引导用户选择最好的模板。
同时基于历史的验证方案知识库AI自动匹配最近一次同类型验证的方案,以章节模块化的方式体现在页面,供用户在页面类似word编辑,更新和增加的内容会跟着新版本的验证方案,存入验证方案知识库,基于最相近的验证方案进入OQ和PQ执行项的AI生成和编辑。
此外通过平台内嵌GMP法规&SOP AI Bot,支持智能关联到方案,只需要点选就可以加入到验证报告中,大幅提升写作速度。内部的知识库,以及历史方案,我们通过向量化的数据库去进行上传和管理,最后形成可以快速查询和匹配的工具。
此外我们还打造了Chatbot方便用户快速引用法规&SOP更新模板。在审批时,报告审批通过后内容就无法修改了,但是在执行端,客户要求在使用移动端收集信息时可以随时修改,所以我们做了AI的工具,使移动端可响应方案的灵活调整,这在实际场景中是非常有帮助的。当然一线执行同事有时不知道输入的结果是否有偏差,所以我们基于验证方案的接收标准,AI自动判断输入值是否合格,提示一线团队再次检查输入是否正确。
最后我想分享的案例是CDW,临床数据仓库(CDW)是一个全球系统,它以标准化的数据结构集成和存储临床数据及其定义的元数据。该系统提供的应用程序支持将临床数据和元数据定义,Mapping和传输到该数据仓库CDISC 通用数据模型中。CDW会暂存、集成和转换各类临床和试验数据,以正确的格式提供给Statistical Computing Environment系统使用。CDW元数据标准,确保可重用性、可追溯性和一致性,如今AI的快速发展,将研究目的和背景给到AI,AI就很容易匹配到临床的数据,我相信未来AI还会有更大的空间值得我们去探索。
以上就是我的分享,谢谢。