探索中国CIO人才现状 | 第三季调研报告
机器学习和人工智能将改变医疗信息化
2014-11-05  来源:techtarget

波士顿Beth Israel Deaconess医疗中心的急诊科医生兼工程师Steven Horng,是一个旨在向急诊室引入机器学习和人工智能(AI)的一员。

“很多人都在讨论如何让一台电脑来诊断病人或者取代医生,但我认为这是个错误的方向,其实际上应该是对医生的一种增强,把电脑作为一种工具,而不是替代品。”

Horng的10人团队正在引入一种几乎被同事们都忽略了的技术。机器学习算法隐藏在工作流程之下,协助医务人员以更有效的方式进行操作。要触及它就意味着发展新的数据科学,运行高度敏捷实验,并依托Beth Israel首席信息官ohn Halamka的灵活基础架构,组件专家指出,这是企业引进机器学习和人工智能的核心。

数据科学项目  

Horng的研究小组正在使用机器学习算法来解决正在困扰全国各地急诊室的数据质量问题:以结构化,标准化的方式获知病人来访的原因或“主要诉求”。医务人员需要精确,这使得数据采集成为一场战斗。用文字来记录主要诉求,例如,说明左路胸部疼痛。

Horng说:“能够确认胸口痛对接下来的临床护理和像顺序设定和临床路径之类的事情是非常有价值的”,但在大多数系统中这都很难实现。“难点一直在于如何在人们自说自话的情况下收集这类结构化数据。”

Horng的团队和他们纽约大学的计算机科学合作伙伴明白,如果人类和机器想要共同努力,在实际应用过程中构建非结构化数据,系统需要完成两件事情。根据他们的论文Predicting Chief Complaints at triage Time in the Emergency Department(在急诊科的分诊时对主要诉求的预测),“用户必须觉得这个软件确实节省了他们的时间,并且其结果是可信的。”

引入机器学习。“我们已经有了一个无论在后端和前端,将这些非结构化数据转化为结构化的数据域的机器学习方法,”Horng说。现在,病人在被护士分诊时,收集到的数据会通过一个预测分析引擎,其会确定排名前五的患者最有可能主要诉求。

“我们必须建立十分广泛的基础数据集——从如何表现主要诉求的本体到自然语言处理,”他说。这包括破译非结构化数据的“凌乱”部分:拼写错误,双重含义和棘手的“否定发现”问题,或医疗条件状态的可靠鉴定。今天,Horng表示,该计划极大地提高了主要诉求的数据采集率——从25%提高到了95%。

一个专门的研发团队  

Horng高度评价了Beth Israel的Halamka,他给团队“自由探索的权利,使我们在信息系统技术支持中扮演了有意义的角色,”他说。Horng和他的团队是IS信息系统技术支持部门的成员,遵守信息系统技术支持IS的政策,程序和治理结构,并直接控制软硬件。“这与大多数组织机构医生只作为顾问和事后诸葛亮非常不同,”他说。

Gartner分析师Kenneth Brant认为,首席信息官们在构建智能机战略,利用机器学习完成代替人类的任务的科技时,应该有样学样。设立一个专门的小组,进行研究和开发,是从文化上为企业做好准备的良好开端,Brant说。此外,建立一个像这样的团队将帮助首席信息官们就推动智能机战略所需要的技能进行思考 – 那些可能不属于IT部门的技能。

“如何建立智能机器或管理或部署它们与[运行] ERP系统是非常不同的,”Brant说。 “其需要在比IT知识基础更深入的人工智能方面的技能。”

由于智能机器技术还很不成熟,企业需要可以进行试验和测试,并能接受快速失败的员工。

Horng和他的团队持有快速失败的心态。“我们相信医生程序员方法,用户既是医生,又是开发者和测试者,”Horng说。 “这意味着我们会有非常快速的开发周期。”

构建未来,就要灵活思考  

基础设施建设也很关键。Horng依赖于Halamka构架的灵活性,其被专家誉为确保基础设施能够跟上不断变化状态的一种方法。Beth Israel服务器的虚拟化有多重故障保险,Horng说。Horng和他团队进行的机器学习项目运行在一个专用服务器上 - 独立于临床环境的其余部分。 “这意味着,无论机器学习方面发生什么 - 如果其崩溃,或出现一个问题,又或者服务器出现故障 - 它不会影响临床方面,”他说。

Citrix Startup Accelerator首席技术专家Michael Harries,称此为在架构中建设“拐点”,这是一个他认为比以往任何时候都更加重要的概念。“我们正处在一个时点上,在过去的十年中行业中变化的总量已经相当显著,但现实是,我们却还没有看到任何东西,”他在由MIT Technology Review麻省理工学院技术评论主办的新兴技术会议EmTech上说道。

“我可以集中控制所有的应用程序,无论在手机还是桌面电脑,或者任何将要出现的终端上,或者我可以从任何地方对其进行访问,这一概念是非常重要的,”他说。 “内容的交付与IT的交付应该被分离出来。”