本文根据华润医药集团智能与数字化部副总经理陈怡静在CIAPH-第13届医药健康行业数字化高峰论坛”上的分享整理
陈怡静 华润医药集团 智能与数字化部副总经理
各位同仁大家好,非常荣幸今天有机会向大家分享华润医药近期在AI领域的实践和探索。今天的分享我将其分为三个部分,分别是华润集团的简介、DeepSeek爆火的背后、以及一些专业化落地场景。
华润集团简介
首先为大家介绍一下华润集团。华润集团是国务院国资委直接监管和领导的国有重点骨干企业之一,于2022年6月正式成为第一批转正的国有资本投资公司,在2023年的财富世界500强中位列第74位,同时也是首批央企公司治理示范企业。
华润集团下属6大业务板块,分别是大健康、综合能源、城市建设运营、大消费、产业金融、科技及新兴产业,华润医药集团是大健康板块的重要组成部分。华润医药集团是中国领先的综合性医药公司,位列行业前三,业务涵盖研发、生产、流通和零售等,拥有众多知名品牌。
从组织架构来看,华润医药集团旗下企业分为业务单元、直管企业和直管机构,其中业务单元由华润集团直管,主要包括华润医商、华润三九、华润双鹤和华润江中,华润医药主要发挥上市公司管理平台作用。直管企业由华润医药管理,主要包括东阿阿胶、华润博雅生物、华润生物医药、南格尔科技、中国药研。
从战略发展方向上来看,华润医药坚持以服务国家战略需求为导向,优化产业布局;以对标世界一流为抓手,推进管理提升与价值创造;以强化科技创新能力为基石,打造核心竞争优势;以内涵外延双轮发展为驱动力,开创发展新局面;以数智化为助推器,赋能业务创新转型。
DeepSeek爆火的背后
人工智能从1950年开始不断发展,主要可以分为四个阶段。第三阶段是2010-2020年,这一阶段各类新技术不断涌现,标志性的事件包括2016年AlphaGo 在围棋比赛中战胜了人类世界冠军李世石,证明了在复杂的智力游戏中,机器也有超越人类的能力。随后2017年谷歌发布Transformer 架构,深度学习的模型得以迅速的发展。第四阶段是2021年至今,各类生成式人工智能逐渐崭露头角,包括大家耳熟能详的各类GPT,还有像DeepSeek大模型等。
大模型的定义是包含超大规模参数的神经网络模型,通常在10亿参数以上,它同时具备训练数据集丰富、算力资源强大等特点。通常我们所说的大模型,更多是指大语言模型,它专注于语言任务,当然还有视觉大模型、行为大模型、多模态大模型等等。这里讲到的多模态,是指综合运用两种或两种以上的模态来传递信息,强调不同模态之间的相互配合和补充,以更有效地传达复杂的意义。
模型只是基础能力,大模型想要到场景中应用,还需要叠加许多功能,从而组合成产品。目前市场上也有很多AI产品,像AI写代码、聊天、机器人综合搜索等。大模型虽然强大,也并非是完美无缺,典型的局限性有以下两个,第一个是实时性,由于受到训练数据的时效限制,大模型无法回答领域相关的实时信息。第二个是幻觉,在没有标准时间刻度的情况下,大模型的语言生成能力将会大于逻辑的缜密判断,从而产生幻觉。
谈到大模型,不得不讨论DeepSeek。从DeepSeek爆火以来,打破了多项纪录,首先持续登顶全球140个国家及地区的移动应用市场榜首,同时也成为史上最快突破3000万日活的APP;目前已有超50家上市企业宣布全面接入该模型,此外超30家药企、医院、IVD公司、医疗机构等宣布加速整合DeepSeek技术。从技术评分上来说,在业界公认的全球基准标杆Chatbot Arena评分榜单中,DeepSeek的两款模型也位于前列。
DeepSeek的爆火还引发了一系列“鲶鱼效应”,例如打破了大模型既有的收费模式,同时也开启了新一轮的军备竞赛。此外医药行业加速渗透,促进了应用生态的重构,对于行业带来了空前的影响。除了大模型本身以外,它也带来了许多产业的革命性变革,例如智能汽车、机器人、智能穿戴设备,以及云服务和算力硬件的提供商。
为什么DeepSeek能够爆火?我认为有以下几个原因。首先DeepSeek的R1,性价比非常高,同时全部基础模型完全开源,真正降低了使用门槛,同时训练和使用成本大大降低。从DeepSeek的几个主要代际产品来看,V3到R1参数规模不断增大,训练的数据集不断加强,本身的基础模型的标度率也持续上升。随着技术架构的不断优化和工程能力的创新,使模型的能力大大增强。
另外从用户使用的角度来说,首先DeepSeek的中文语境能力非常强大——得益于训练时极其丰富的语料库,它的表达能力极强。另外就是思维可视化,可以让用户直观的看到模型的推理过程,从而极大降低不可解释性和幻觉,这对于生命科学行业来说至关重要。此外DeepSeek产品还具有一定的用户思维,例如默认接入联网搜索的能力,补齐大模型实时信息不足的短板,进一步提升资讯和信息的可信度。
综上所述,DeepSeek的爆火理所应当。接下来我们一起来看一些专业化落地场景。
专业化落地场景
2025年2月19日,国务院国资委在《中央企业“AI+”专项行动深化部署会》上指出国资央企要抓住人工智能产业发展的战略窗口期,强化深度赋能,深化场景应用,夯实算力基座,突破数据难题,要着力强化中央企业推进人工智能发展的要素支撑。
华润医药积极贯彻执行,加快推进人工智能应用。过程中认识到,在企业的真实场景中,所需的不仅是DeepSeek这样的生成式人工智能,更多的是需要判别式的人工智能,例如生产过程中的质量监测,研发过程中分子活性打分等,也就是说企业真正需要的是复合型AI应用。大模型只是使用生成式人工智能的基础,有了基础模型以后,还要不断优化提示词,同时制定流程使其具备相应的流程编排能力,还有能够根据情况数据搜索与检索增强,最后才能生成用户期待的高质量回复。
在华润医药内部,我们对于AI能够赋能的高价值场景进行了全面扫描,包括研发、生产、供应链、营销、客服服务、综合管理等。同时我们还根据场景本身业务的重要性、技术的能力也就是成熟度进行了四象限排列。其中辅助诊疗、市场趋势分析、医药资讯收集、医学文献分析、临床试验设计、质量在线监测,客户精准营销等是排列之后的重点场景。对于一些基础通用能力,华润医药则使用上级集团统建的平台与服务,这也充分体现了集团型企业的集约共享的优势。
AI赋能的场景非常多,华润医药是一家以研发创新和投资并购为主的企业,所以接下来我将重点分析研发和投资方面的一些场景,供大家参考。
1、研发
经过IT部门与研发部门的反复商议,我们明确了近期的重点场景是围绕药物发现及筛选、临床前开发阶段。举几个具体的例子。
01、第一个场景是利用提示词实现研发报告的准确分析。提示词可以深度的挖掘基础模型能力,同样的基础设施、同一个任务达到更优的回答效果。华润医药开展了提示词工程的整合和智能体的创建。
02、第二个场景是助力生物大分子研发提质增效。华润生物医药充分利用DeepSeek等语言模型的交互能力及RAG知识库,整合多个领域专有模型及程序,实现交互式服务调用。大幅降低湿实验人员对AI+CADD系列软件使用门槛,助力研发周期有效缩减,成功率明显提升。
03、第三个场景是降低药研场景任务难度及用数门槛。华润医药借助ChemLLM(首个化学领域的LLM)等模型能力,实现对话互动方式完成9项任务,包括名字转换,性质预测,逆合成分析等,完成了AIDD细分领域的产业化应用,有效提升药物设计的新颖性及多样性,大幅降低研发成本及时间。同时在分子数据挖掘与处理上,通过SQL可以实现特定条件下分子结构和性质的提取,如提取两个靶点间具有选择性的一系列化合物;通过插件可完成数据格式转换,LLM则可将任务进一步抽离为人类语言指令,大幅提升用数效率。
2、 投资
关于投资,我们也做了全场景扫描,包括AI优化投资决策,AI驱动风险管理,深度报告与策略优化,利用AI提升个人生产力等方面。这里也举几个具体的例子。
01、第一个场景是基于模版写作,生成投资简报。通过大模型,基于给定模版及数据来源构建智能体,能够实现投资简报的自动化生成,有效释放人力投入,提高分析效率,提升决策质量。
02、第二个场景是引入RAG实现金融数据精确查询。例如查询哪些市值500亿以上的公司过去两个季度净利润同比在加速增长?本地模型的结果参考价值有限,通过联网搜索,能够强化数据实时性,但对于专业人员来说仍然没有办法做更多维度和深层次的分析。通过RAG(搜索增强生成)技术引入交易所数据,则能够获得更加结构化的结果,以满足专业人员的使用。
大模型的强大能力在于,将人类模糊的查询条件(比如上面问题的“净利润同比加速增长”)转化为清晰可执行的指令(24Q3净利润同比>24Q2净利润同比)。但若没有底层结构化数据的支持,语言能力再强也是“巧妇难为无米之炊”。总体来说,通过引入RAG能力,约束查询的数据来源和范围,能够进一步提升回答的准确率。另外对于已有沉淀数据的激活也非常重要,如何将传统IT系统和平台中海量的结构化数据有效结合,值得探索。
03、第三个场景是通过流程编排强化政策分析能力。对于投资工作者来说,对于政策的研判也很重要。举例来说,提出问题美国对墨西哥加征关税对某两个公司有多大的影响?能够看到DeepSeek的回答思维链和结果很完整,但是实际价值不高。而人类研究员则会根据这一问题进行步骤拆解,最后以表格的形式输出,结果一目了然。
可以看到,在一些深度研究的任务中,人类研究员的解构能力要比大模型的写作能力更重要。如果我们将人类研究员的工作步骤做代码拆分,也是很复杂的,但这就是AI的流程编排,通过流程编排才能有效的实现步骤分解。总结来说,人类真的很强大,一个看似简单的工作,其实是N多任务同步或异步组成的。另外就是做AI流程编排,本质需要业务梳理清楚,并且尽可能标准化。同时IT流程编排的工具和技术能力也很重要。
相信各位同仁与我们一样,每天都会收到来自方方面面的需求,有的需求通过引入一些简单的工具,就能上线用起来。有的需求极为复杂。我认为导致需求复杂难以落地的原因有三点:第一就是真正复杂的场景往往不具备数据基础;第二就是业务标准和步骤不是足够清晰;第三就是业务应用AI的决心不足。
针对一些复杂场景,我们也逐步形成了一些考量思路,首先就是基于场景的重要性和性能成熟度四象限法则。另外要充分考量安全合规的要求,作为央企,尤其要考虑到数据的隐私性,有的是公司要求,有的是法律法规要求。此外还需要考量成本,每个场景的投入都有相应的ROI,需要考虑一个新场景的前置投入以及人员投入。最后就是联动和叠加效应,需要与业务场景的数字化建设同步开展,与必要工作(如数据治理)充分配合。
在AI转型的三大阶段(试点、小规模应用、全面推广)中,当下华润医药正在从试点跨越到小规模应用的阶段。
最后我们想说的是,真正的AI赋能要有优秀的基础模型加上强大的工程能力,还要有适合的业务场景和开放的生态合作。我们要致敬像DeepSeek这样有情怀、有技术实力的前沿的公司,感谢他们提供的所有的基础模型和强大的工程工具。同时我们也要不断地自鞭自勉,进一步地强化自身的技术部署能力和业务标准化的能力。更重要的是,我们希望能与更多的合作伙伴共同组成更加开放的生态。
以上就是我的分享,谢谢。