IBM
折戟医疗 沃森败在哪里
IBM的沃森是人工智能领域的翘楚,而今受挫,不禁让人对医疗领域人工智能的应用前景产生了怀疑。
文|钱丽娜 石丹
当AI随着5G商用的落地被更广泛地应用成为可能,国内外不少医疗企业和医疗机构开始在AI领域大展拳脚。近期,外媒再曝IBM沃森率先入局医疗却踏步不前,其沃森医疗计划宣告失败。
沃森是IBM的“天之骄子”,更是人工智能领域的翘楚。公开资料显示,1997年,IBM研发的计算机深蓝(Deep Blue)战胜国际象棋冠军Garry Kasparov。2011年,这家公司以创始人Thomas J. Watson名字命名的计算机,继续着对人类智能极限的挑战。2014年初,IBM投资10亿美元专门建立“Watson Group (沃森集团)”。沃森在2015年4月成立了Watson Health部门,之后收购了大量医疗数据公司。
2016年9月,美国著名的德州大学MD安德森癌症中心(UT MD Anderson Cancer Center)癌症研究中心宣布中止与IBM在人工智能沃森 (Watson) 项目上的合作。2018年,IBM人工智能医疗部门沃森健康被曝大幅裁员。
IBM沃森是人工智能领域的翘楚,而今受挫,不禁让人对医疗领域人工智能的应用前景产生了怀疑。
时光倒流回2012年,时任MD安德森基因组医学部主席的Lynda Chin博士决定在癌症治疗中采用人工智能,以此来提升临床治疗的效率。
此前一年,IBM的沃森系统因为赢得了智力挑战赛Jeopardy!(《危险边缘》)而获得了全球关注。凭借沃森强大的自然语言理解能力,IBM打算将其应用在医疗健康领域,向AI医生的角色发展。
Chin博士选定沃森来开发临床决策系统——Oncology Expert Advisor(OEA,肿瘤专家顾问)。双方于2012年6月签订合约。MD安德森为该项目支付6200万美元,开发的目的是“作为一个试点解决方案,让MD安德森通过相关数据的分析,深入了解患者的治疗成果”,即理解数据在肿瘤解决方案中的作用。
而实验一旦成功,未来OEA将为那些无法获得专家治疗的病人提供同一级别的癌症治疗方案,从而在全球范围内提升癌症治疗的水平。
那么IBM是怎样训练沃森的专业技能的呢?官网显示,沃森通过利用自然语言处理和先进的机器学习算法,搜索涵盖300 多份医学杂志、250 多本教科书和 150 万页文本的语料库,借助从文献得来的相关证据,为发现的治疗方案提供补充。
沃森从患者的病历中提取关键特征,在与 EMR(电子病历) 集成时,使用自然语言处理来读取和理解病历中的所有患者数据,结合此前在安德森癌症中心获得的专家培训,得出经过排序的治疗方案,供医生参考。当医生选定某一种治疗方案时,它还会给出采用此方案的病例数、生存率、不良反应发生率等相关信息,帮助医生总体评估该方案的疗效与风险。
2012年起,安德森癌症中心为沃森提供训练数据,涉及病人的症状、基因序列、病理报告,这些信息与内科医生的报告、重要期刊论文整合,帮助医生制定诊断和治疗策略。
这是一个看上去很美好的模式。
不仅仅是MD安德森选择了沃森,IBM的合作名单中还有纪念斯隆-凯特琳癌症中心 (Memorial Sloan Kettering Cancer Center)、梅奥医院(Mayo Clinic)等著名医疗机构。2017年3月28日,百洋智能科技成为沃森健康(Watson Health)中国地区的战略合作伙伴,将沃森肿瘤会诊中心引入中国医院。
但是正当人们对沃森满怀期待时,它却像亚特兰蒂斯那般悄然消失在人们的视野中,随着安德森项目被审计,以及沃森健康部门的裁员,这件事情似乎打开了潘多拉的魔盒。
《商学院》记者就沃森健康部门裁员、与MD安德森癌症中心终止合作、系统诊断精确度、在医疗领域的突破及在中国医院部署等情况向IBM中国相关负责人发去采访提纲,至记者发稿,对方并未正面回复。
IBM败在了哪里
安德森与沃森的实践给后来者的启示是,这是一个在错误的时间用错误的方式,展示了一个错误定位的产品。
英特尔
医疗与生命科学负责人李健博士说,“从某种意义上说,医生有一点像厨师,除了知识积累和临床实践,还要靠经验取胜。医疗本身更像是科学与艺术的结合,所以医疗AI的训练不是靠机械式的灌输就能掌握的,更何况是复杂的肿瘤疾病领域。”
要理解AI能在医疗行业做什么,首先要理解医疗行业的诊疗特性。医疗行为大致可以分为两类,一类是标准化、流程化的诊疗。这其中有大量可描述、可追踪的指标和标准的治疗方案和标准的SOP流程,病人的预后也可以跟进。“在这个层面,人工智能可以发挥很大的作用,比如帮助医生减轻工作量,降低医疗成本,提高诊疗效率。”李健说,“比如医学影像领域用深度学习作为辅助手段,可以帮助医生提高影像识别的准确率。”
另一类则是像糖尿病、高血压、肿瘤等非标准化的疑难杂症领域,导致疾病的成因有环境、遗传、基因突变、生活习惯等各种因素,颇为复杂,医生需要吸纳各种信息后进行综合判断。因此,如果仅仅依靠机器阅读文献获得医疗方案很难令人信服。
“目前,医学资料库中良莠不齐是普遍现象,只有少量的文章有真正价值,很多文章引用的数据也常有矛盾,如果不是专家,机器根本无从判断。另外,在肿瘤治疗临床实践中,每个医生都可能有自己的看法,不同的医生对同一个图像还会有不同的看法,甚至不同国家和地区的肿瘤病人都有很大差异性,所以说这是一个综合学科的问题。” 李健说,“因此复杂性疾病领域的创新不能用过于标准化和小样本的方式去解决,至少目前的这种方式不可行。”
从事医疗影像创业的胡俊认为,IBM提供的工具适用性有限。“IBM野心过大,什么都想做,此其一。其二,若要让医生将人工智能纳入临床流程,需要形成工作习惯,但这个行为习惯的形成太过漫长。”
胡俊在沃森系统的体验中发现,医生按照系统要求输入病例时要花半个小时,使用起来非常不方便,更无法建立起相应的使用习惯,这个系统也没有和检测系统打通。
由此可见,原始数据的获取本身就存在着巨大的问题。有报告显示,美国医生每在患者身上花一个小时,他们需要在电子健康记录和书桌上额外花费近两个小时。为了诊断、治疗目的或研究目的,中国的医生也花费了大量的努力来获取和理解来自多个非结构化和半结构化来源的数据。例如在中山医院,医生需要花费 20 天左右的时间才能从200份非结构化报告中提取相关信息并转化为结构化的格式。
数据的问题在IBM的内部报告中也反映出来。2017年,时任IBM 沃森医疗部门执行健康官(Health’s deputy chief health officer)Andrew Norden的内部文件被公开,文件显示,沃森所用的训练数据不足,训练数据量最高的肺癌只有635例,而最低的卵巢癌只有106例;采用的是患者的假想数据来做训练;开出了不合适且危验的治疗方案,比如给正在严重出血的肺癌患者开出可能引起严重出血的安维汀。
IBM没能解开的死结
作为深度学习的产品,大数据是沃森学习发展应用的基础。但目前的问题是数据从哪里来,得来的数据又将如何标准化。
浙江大学孔德兴教授说,人工智能需要数据、算法、产品和应用模式四个要素。大数据有四个特点,海量、动态、多样化(多模态)、架构密度低,“大数据是一个从量变到质变的过程,训练一个肝癌的智能诊断系统要多少数据算好,并没有准确的依据。而这些数据要从各家医院汇集后还要找到有效的算法,做成产品才能真正发挥价值。”
由于筛查、诊疗、预后都离不开医学影像,目前人工智能技术大多集中在影像的智能处理上,主要从事图像的配准、分割与识别,其应用大致分为医疗影像、病理、风险预测、手术等几个模块。
孔德兴说,由于基础理论、框架和技术的不成熟,目前人工智能关注的只是像肺结节这样的单病种,还很难诊断像肺结核、尘肺、胸腔积液等疾病。由于深度学习存在不可解释性,即很难用输入的样本数据来合理说明事物的变化和发展规律,“让人工智能告诉病人为什么是肝癌,这就是用不可解释的东西来做解释。”
上海交通大学附属第六人民医院教授李跃华担心的则是,由于各家医院使用的设备不同、参数不同,导致各种医学检查图像不能统一,“如果图像做不到标准化,数据的处理、分割、提取没有统一的标准和严格的划分,就不是真正的大数据。”
事实上,市场上大部分公司的数据来源是2-3 家医院,数量和质量远远不够。以 CT 为例,医院在用的CT 机型有近百种,厂家有七八家。如果仅使用几个机型的数据,或者下载公开数据集的数据来训练模型,即使实验室准确率很高,也很难在实际应用中取得很好的效果。因此,虽然参与到这个领域的公司很多,但整体来看,尚处于初级阶段。只有获得权威临床认可,AI医疗才有价值。
业界专家一方面在努力推动技术进步,但同时也不无担心深度学习的技术天花板,需要全新的算法突破,而数据的合法性目前还一直处于一个模糊的地带。
如何平衡研发、创新、伦理、法规监管,这成为一个全新的课题。
《商学院》记者就这一问题采访荷兰人类研究中央审查委员会(CCMO)主席Joop VAN GERVEN教授。由于英国脱欧的影响,欧洲药品监管局(EMA)已从伦敦迁至阿姆斯特丹,加上荷兰是欧洲网络的主要监管机构,因此,荷兰有望在医药管理领域成为接替英国的主导角色。
Joop介绍,荷兰通过建立“共识模式”来回应公众关注的标准。早在1979年,荷兰便成立莱顿医学伦理第一委员会。1999年成立了政府认可的单一医学伦理审查委员会(MREC),将研究提案的科学性、伦理和监管评估职能分配给政府机构。每个MREC由医生、儿科医生、临床药理学家、健康法学家、研究方法学家、医学伦理学家、“外行”(参与者的立场)等人组成,CCMO在MREC的基础上还增加了行为科学家、基础科学家、护士(科学家)以及胚胎学家,监督和协调各MREC,以此来共同研究“复杂”领域的问题。
荷兰药物审评监管机构主席Ton de Boer也对《商学院》记者表示,“荷兰很重视人工智能在医药领域的发展,我们意识到AI发展的关键取决于信息的质量,但信息的质量囿限于我们的知识。同时,我们希望数据是透明的,可被监管的。”
在加强监管的同时,荷兰注重对创新的保护,利用监管、科学、伦理和法律专家之间的密切合作,为药物开发者提供科学建议,这些建议由药品评估委员会和CCMO提供,作为向制药公司和学术药物开发者提供的服务。过去二十年,科学家、临床医生和监管机构之间的紧密联系成为维持创新和专业知识与质量和监管之间平衡的重要资产,形成了有效的“荷兰模式”。
这个思路也正回应了中国业界呼吁建立医疗数据统一平台的想法,沃森所面临的数据窘境也是中国相关AI企业的缩影。新技术的发展需要在伦理、创新、研究、审查等方面既便利又灵活,避免AI公司因数据的合法性和标准化而陷入一个灰色的两难地带。
机会在传统医疗巨头手中?
“我认为,传统的医疗行业巨头未来会是AI医疗的话语权掌控者,而不是新兴的互联网公司或AI公司。”李健说。医学是一门注重实践、依赖循证的严肃科学,传统医疗巨头经过常年的积累才形成今天的知识体系,AI医疗从数据的来源、建模、训练到结果的评判都需要一个科学专业的评估标准和体系,“而IBM太过性急了,并不是有计算分析功能就能理解医疗专业领域的事。”
飞利浦
、GE医疗等传统医疗巨头正在投身人工智能领域。飞利浦拥有覆盖整个临床路径的产品,在诊断影像、患者监护等领域,拥有超声、CT、MR、X-ray、PET/CT、血管机、患者监护等丰富的产品组合。这些设备本身就是收集影像信息的载体,在数据获得上拥有先天的便利条件。
飞利浦中国区总裁何国伟介绍,目前,飞利浦与全球范围内4000家顶级医院、科研机构、创新平台等紧密合作,并在全球上万家医院部署了设备和解决方案,将智能算法和AI引擎深入集成到用户界面、医疗设备和医院工作流程中,旨在医疗领域创造出具有实际指导意义的AI应用。
飞利浦为客户存储超过1,450亿张医疗图像;可穿戴设备Lifeline监测服务为700万老年人提供支持;患者监护解决方案每年为2.75亿患者提供在重症监护病房(ICU)、普通病房和家中的监护服务,生成了
海量数据
;过去十年来,睡眠和呼吸护理业务通过500多万台互联睡眠治疗和呼吸设备,收集了共25亿个夜晚的睡眠治疗云端数据。天生拥有医疗数据富矿的飞利浦在五年前开始投入数字化创新和AI,全球400多位数据科学家专注于临床场景和工作流程。
飞利浦的数字化解决方案是基于临床洞察而不是基于纯粹的医学文献和教科书,这使其在解决患者和医护人员的切身需求与痛点时更有针对性。
何国伟认为:“AI 本身只是一个工具,而不是解决方案。AI算法和引擎只有深入集成到医疗设备、用于界面和医院的工作流程中,并且部署在清晰的临床情境中,才能发挥有效的作用。然而对医疗情境的设定,需要依据医疗服务提供者在具体临床情境中正在使用的指导方式和过往经验,以及当地的实际情况。这就是我们的AI算法与健康医疗紧密结合的‘最后一英里’。”
与此同时,GE医疗也开始将AI等应用直接嵌入医疗设备,基于庞大的装机量和海量原始数据,目前在全球已推出180多个智能分析型应用程序。GE医疗的企业级医疗影像存储、管理和分析解决方案为医疗机构管理着超过750亿份医疗影像资料。这些AI应用可以精准处理最原始的数据,更精准地提供影像等相关信息。
GE首款嵌入式AI影像设备已用于气胸、气腹和错位线的临床检测。套件基于非常大量的胸片数据,结合深度学习算法,可以在移动胸片拍摄后,给出气胸预判,提示医生注意高危元素。
究竟是由软件开发入手医疗还是以传统医疗硬件为基础开发软件应用,李健认为,各家应该发挥各家的特长。“医生有动力跟传统医疗巨头合作,那是因为这些巨头有丰富的数据,也有将数据变现的能力,医生可以参与到创新产品的研发中,还可以发文章。”
像IBM、英特尔等纯IT技术公司,因为本身没有特别专业的医学、产品团队和资源,是很难做到在医疗终端产品上凭一己之力进行AI医疗这种颠覆式创新的。“IT军团最好的方式是从提供算力、优化算法和数据采集等这些弹药型的工作开始,着力AI医疗生态系统建设和跨界合作;而面对复杂性疾病的解决方案、药物的开发和创新诊疗方式还是应该交由专业的医药公司和医疗器械公司去领导解决。”李健说。
人工智能的机遇和挑战
除了医学界和IT界在关注AI的发展,与健康相关的生态领域也涉入其中。
在招商信诺人寿针对全球调研发布的《2019健康指数调研白皮书》中,中国在全球健康指数中位列第五。巨大的职场压力、财务压力导致众多的健康问题。我国每年慢性非传染性疾病每年死亡在731万,占全部死亡的86.6%。其中,心脑血管疾病、癌症、糖尿病和慢性呼吸道疾病是我国最主要的疾病之源。
招商信诺人寿总经理赖军说,目前保险业已经在引入人工智能做业务辅助的工作,但是和医院的联网尚不成熟。出于社会伦理和社会保障的目的,即使有人工智能技术相助,医疗保险也很难去制定实施千人千面的保费。“但若在疾病预防、慢病管理中有效引入人工智能,这会对减少国家医疗负担起到作用,尤其是中国开始进入老龄化社会,随着年龄增长,慢病爆发呈上升趋势。”
在中国迈向老龄化,医生资源愈发宝贵的情况下,AI发展和商业化落地已成大势所趋。
MD安德森早有商业化的计划,曾给普华永道2300万美元,请其做商业计划书,将OEA推广到其他医院,希望产生收益,但没有医院对此感兴趣,项目不了了之。但是沃森传来的也并非全是坏消息,它与纪念斯隆-凯特琳癌症中心的肿瘤辅助系统研究合作仍在继续,美国临床肿瘤学会(ASCO)每年都会发布该系统的研究进展,并自2014年以来在肿瘤多个领域证明了AI可以提升临床决策和科研水平。
“沃森还是发展中的创新科技,始终值得肯定,只是IBM的营销有些过了头。”李健说。