河南快三摇奖福彩开奖结果

IBM醫療AI死于難產:NLP搞不定醫學問題

醫療健康 來源:AI 前線 作者:編譯:Debra

無論是大企業還是小企業,專業醫療公司還是沒有醫療背景的公司,醫療AI這個巨大的市場都在吸引著它們的目光,醫療AI賽道早已擁擠不堪。

藍色巨頭 IBM 在主要業務增長乏力,逐漸落后于谷歌、蘋果等公司的困境下,想要抓住醫療AI這根救命稻草活命。但在投入巨大人力、財力之后,仍然逃脫不了走進死胡同的一天,究其原因,還是在于落地困難。

電子和電子工程師協會雜志 IEEE Spectrum 的高級副主編 Eliza Strickland 上周發表了一篇文章《IBM 沃森醫療AI的低產和被高估的程度》。本文討論了IBM沃森為什么在醫療保健行業創建高效的AI醫生之前還有很長的路要走。

一戰成名

IBM 沃森是一個能夠用自然語言回答問題的問答計算機系統,它在2011年2月在智力競賽電視游戲 Jeopardy(危險邊緣)中擊敗兩個人類冠軍取得成功!

當時,IBM 的研究人員在探索將沃森的能力擴展到“革命化”醫療保健的可能性,決定將沃森出色的 NLP 功能應用于醫藥,甚至承諾提供商業產品。

2014年,IBM 第一次展示沃森使用人工智能改變醫學的潛力。在 Demo 中,沃森收集了一組奇怪的患者癥狀,并利用它們生成一個診斷清單。當時,沃森給人留下深刻的印象:沃森的記憶庫包含最罕見的疾病信息,其處理器完沒有偏見,使其優于其他幫助醫生的AI。它可以在幾秒鐘內處理一個棘手的病例。

如果沃森能夠將這種即時專業知識帶到世界各地的醫院和診所,人工智能似乎可以減少診斷錯誤,優化治療,甚至緩解醫生短缺的情況——不是替代醫生,而是通過幫助他們更快、更好地完成工作。——Strickland

然而,盡管有關人工智能產品商業化的新項目很有希望,但它無法實現這一承諾。在公司總部之外,IBM 發現其強大的技術無法與當今醫療保健系統的混亂現實相匹配。將沃森應用于癌癥治療這個醫學界面臨的最大挑戰之一時,IBM 遇到了機器學習方式和醫生工作方式之間的根本性不匹配。

“自那以來的八年里,IBM 大肆宣揚開發人工智能醫療技術,其中許多已經失敗了。此外,IBM 沃森醫療健康部門生產的產品更像是只能執行日常任務的基本 AI 助手,甚至連 AI 醫生都算不上。——Strickland

沃森在醫療保健行業面臨的挑戰

非結構化數據

雖然IBM想要努力探索沃森在醫療保健行業的可能性,但當時,他們面臨的最具挑戰性的問題是醫學中的大量患者數據,即非結構化數據。這包括醫生的筆記和出院摘要,這些充滿行業術語、縮寫和主觀聲明的摘要占典型患者記錄的約 80%。

癌癥診斷不準確

IBM沃森面臨的另一個挑戰是癌癥的診斷。紐約市凱特琳癌癥中心的肺癌專家 Mark Kris 與其他優秀的醫生一起,在 2015 年訓練了一個名為沃森腫瘤的 AI 系統,它可以通過讀取關于癌癥的大量醫學文獻和真實癌癥患者的健康記錄,揭示人類不為人知的疾病模式。

德州大學 MD 安德森癌癥中心的其他優秀醫生與 IBM 合作創建了一個名為腫瘤專家顧問的工具。然而,這兩種產品都遭到了嚴重的批判,稱沃森的腫瘤學顧問有時會提供“無用的”和“危險的建議”。

Strickland 寫道:“對這兩個項目的深入研究揭示了機器學習的設想與醫療保健現實之間的鴻鴻溝——”真正的人工智能“與當今醫生對功能性產品的要求”。

盡管沃森很快就學習了關于臨床研究的文章,但人們很難教會沃森以醫生的方式閱讀這些文章。 “醫生從文章中學到的用來改變他們護理的信息,可能不是論文里的重點。沃森的思維基于統計數據,所以它能做的就是收集有關主要結果的統計數據,“Mark Kris 補充道。

無法從患者的電子健康記錄中挖掘信息

研究人員進一步發現,沃森也無法從患者的電子健康記錄中挖掘信息。此外,他們意識到,在將新患者與其他大量癌癥患者進行比較以發現隱藏疾病模式時,沃森無能為力。此外,他們希望沃森能夠模仿專家腫瘤學家的技能,但結果讓他們感到很失望。

沃森為什么“發射失敗”?

率先進入,第一個出局

2014 年,IBM 創建了一個嶄新的總部,起名 IBM 沃森,在位于曼哈頓類似于微型天文館的玻璃實驗室中,IBM 會邀請潛在的客戶和來訪的記者進入沃森的電子“大腦”中,。在黑暗的空間里,游客坐在旋轉的凳子上,花哨的圖形圍繞著墻壁的弧形屏幕閃爍。

之后,沃森在電視節目《危險邊緣》中戰勝人類冠軍脫穎而出,IBM 便為其規劃了今后的職業生涯:成為一名 AI醫生。IBM 將沃森的自然語言理解能力應用于醫學,并承諾首批沃森醫療產品將在18-24個月內上市。

實際上,IBM宣布的那一天并沒有到來。在此后的八年中,IBM 高調宣布進行醫療 AI 研究,但其中一些已經失敗了。該公司花費數十億美元用于收購以加強實力,但內部人士表示,被收購公司尚未做出太多貢獻。從 IBM 的沃森健康部門生產的產品與曾經設想的優秀 AI 醫生根本不能相提并論:它們更像是可以執行某些日常任務的 AI 助手。

加州大學舊金山分校醫學系主任,同時是 2015 年出版的《數字醫療》(The Digital Doctor: Hope, Hype, and Harm at the Dawn of Medicine’s Computer Age )一書的作者 Robert Wachter 說道:“說好聽點,我認為他們遇到了一些麻煩。”他說,在某種程度上,IBM 正被其雄心壯志折磨:它是第一家大力推動人工智能進入診所的公司。但它也因夸大沃森的能力而蒙受惡意和懷疑。“他們先進行營銷,第二步才是產品,讓每個人都興奮不已,”他說。“然后是真正見分曉的時候,遇到棘手的問題,IBM 首先出局,向所有人證明了這很難。”

迄今為止很少有成功產品

自 2011 年以來,IBM 沃森宣布了許多醫療保健項目。他們的表現如何?


IBM 于 2011 年開始致力于將沃森引入醫療保健行業。從那時起,該公司已經發布了近 50 份關于合作伙伴關系的公告,旨在開發新的醫療保健工具。一些合作致力于為醫生和機構提供工具;一些人致力于消費者應用。雖然許多聯盟還沒有產生商業產品,但 IBM 表示這些研究工作很有價值,并且在維持很多關系。這是一個有代表性的項目樣本。


圖像之外,NLP 等 AI 技術很難有實際產品落地

然而,除了圖像,即使是今天最好的 AI 也難以理解復雜的醫療信息。實驗結果證明,編碼人類醫生在軟件方面的專業知識是一個非常棘手任務。正如全世界所看到的,IBM 已經在市場上學到了這些痛苦的教訓。雖然該公司并沒有放棄它的“登月計劃”,但它的“發射失敗”已經向技術專家和醫生們表明,訓練一名 AI 醫生是多么困難。

在 2011 年的《危險邊緣》中,沃森的勝利表明了其在自然語言處理(NLP)方面的卓越技巧。為了玩這個游戲,它必須解析復雜的文字游戲線索,搜索大量的文本數據庫以找到可能的答案,并確定最好的答案。沃森不是一個優化的搜索引擎;它不只是根據關鍵字返回文檔。相反地,它使用了數百種算法來映射句子中的“實體”并理解它們之間的關系。使用這種技能,它能理解游戲中的線索和它挖掘的數百萬文字來源包含的信息。

“看起來沃森好像可以理解語言的含義,而不僅僅是識別單詞的模式,”在《危險邊緣》比賽期間擔任 IBM 主要醫學科學家的 Martin Kohn 說道。“它比現有的 AI 強大了一個數量級。更重要的是,沃森通過機器學習自行開發了這種能力,發現了模式,并為如何從輸入(線索)到輸出(正確的響應)建立了模型。”

Kohn 從哈佛大學獲得醫學學位并獲得了麻省理工學院的工程學位,他很高興能幫助沃森解決醫學語言問題。“沃森似乎有可能克服這些復雜性,”他說。通過將其強大的 NLP 能力轉變為醫學理論,沃森可以閱讀患者的健康記錄以及醫學文獻的全部內容:教科書、同行評審期刊文章,批準藥物清單等。通過訪問所有這些數據,沃森可能會成為一名超級醫生,能夠辨別出人類無法看到的模式。

Chase 與 IBM 研究人員一起研究了一種診斷工具的原型,但 IBM 選擇不將其商業化,因此 Chase 在 2014 年與 IBM 分道揚鑣,作為眾多早期沃森的狂熱者中的一員,他對沃森從那時起在醫學商店進展緩慢感到失望。

關于醫療 AI 的一些現實

由于各種原因,醫生是一個保守派,采用新技術的速度很慢。但在醫療保健的某些領域,醫療專業人員開始認為人工智能系統是可靠和有用的。以下是 AI 醫學的一些早期發展。


在計算機業務中落后于谷歌和蘋果,IBM 急需開拓新領域回血,因此選擇了前景巨大的醫療 AI 領域。2014 年,IBM 向沃森部門投資 10 億美元,該部門正在為多個業務部門開發技術。2015 年,IBM 宣布成立一個特殊的沃森健康部門,到 2016 年中期,沃森健康已經收購了四家健康數據公司,總成本約為 40 億美元。IBM 似乎擁有使 AI 在醫療保健領域干一番事業所需的技術、資源和承諾。

今天,沃森領導人將創建沃森健康的過程形容為艱難崎嶇的道路,將 AI 帶進醫療領域是個非常大的挑戰。

例如,IBM 醫療保健和生命科學研究副總裁 Ajay Royyuru 說道,診斷工具沒有上市是因為此前不存在此類商業案例。“診斷不是我們的目標,”他說。“這是醫學專家們做得很好的事情。這是一項艱巨的任務,無論你用 AI 做得多好,它都不會取代專家。“

Bengio:迄今為止沒有一種 AI 可以匹配人類醫生的理解和洞察力

為了找到醫療人工智能的商業案例,IBM 開展了一系列令人眼花繚亂的項目,針對醫療保健系統中的所有不同參與者:醫生、行政人員、保險公司和患者,以獲得“使用 AI 分析大量數據集的決策支持。”IBM 宣傳力度最大的項目專注于腫瘤學,希望將沃森的“認知”能力轉化為大數據為患者提供個性化癌癥治療。

在許多應用實驗中,沃森的 NLP 與許多其他 AI 系統一樣,努力理解醫學文本。“我們在 NLP 方面的表現要比五年前好得多,但仍然比人類差得多,”蒙特利爾大學計算機科學教授,人工智能研究員 Yoshua Bengio 說。Bengio 表示,在醫學文本文件中,人工智能系統無法理解模糊性,也無法了解人類醫生會注意到的微妙線索,目前的 NLP 技術可以幫助醫療保健系統:“它不需要完全理解,就可以做一些非常有用的事情。”但到目前為止,沒有一種 AI 可以匹配人類醫生的理解和洞察力。“不,我們還打不到,”他說。

暫時克服不了癌癥

IBM 對癌癥的研究是這家公司遇到的主要挑戰之一。一位肺癌專家 Mark Kris 表示:“我認為沒有人會知道這(實現癌癥診斷)會花多長時間。”他所在的研究機構早在 2012 年就和 IBM Watson 展開了合作。

Kris 和其他醫生在 2015 年訓練了一個人工智能系統,該系統成為了 Watson 腫瘤產品。德克薩斯大學 MD 安德森癌癥中心的醫生與 IBM 合作創建了一個名為 Watson 腫瘤顧問。白血病部門測試了該工具,但它從未商業化。

Watson 腫瘤顧問遭受了多方批評。有文章指出 Watson 腫瘤是無用甚至會提供危險的建議。Kris 說他經常聽到批評說該產品不是“真正的人工智能”。在投入 6200 萬美元之后,IBM 與 MD 安德森癌癥中心的合作項目最后以失敗告終而被取消。

該項目表明,機器學習的承諾與醫療保健的現實根本不匹配,在“真正的 AI”與當今醫生對功能性產品的要求之間存在著巨大鴻溝。


一些研究將 Watson 的癌癥治療建議與醫院腫瘤學家的建議進行了比較。一致性百分比表示 Watson 的建議與專家的治療計劃相匹配的頻率。

Watson 腫瘤通過獲取大量癌癥患者健康記錄和醫學文獻來學習。IBM 希望 Watson 憑借其強大的計算能力來檢查這些記錄中的數百個變量,發現人類無法看到的模式。功夫不負有心人,Watson 很快就學會了如何瀏覽臨床研究的文章并確定基本結果,但遺憾的是它不會像醫生那樣閱讀文章。醫生是從文章中提取信息,用來改變他們的治療方法,而 Watson 的思維是基于統計數據,所以它能做的就是收集有關主要結果的統計數據。“但醫生不這樣做。”

例如,在 2018 年,FDA 批準了一種新癌癥藥物,它對所有表現出特定基因突變的腫瘤都有效。人類醫生會建議每個肺癌患者都接受這種基因檢測,但 Watson 不會根據有 55 名患者中 4 名肺癌患者改變結論。

無法從健康記錄中挖掘信息

此外,研究人員還意識到,沃森無法從醫學文獻的突發新聞中獨立提取見解只是第一個打擊,另外,它還無法像他們預期的那樣從患者的電子健康記錄中挖掘信息。

還沒完,AI 超級醫生夢想的最后一擊,是研究人員意識到,Watson 無法將此前在癌癥患者身上發現的隱藏模式與新的癌癥患者進行比較。Sloan Kettering 和 MD 安德森都希望 AI 能夠模仿他們的專家腫瘤學家的能力,他們在為新患者制定醫療方案時利用他們對患者、治療和結果的經驗。可以進行類似分析的機器功能將非常強大。

與現有醫療體系黃金標準不符

但是,醫療保健系統目前的標準并不鼓勵這種現實世界的學習。MD 安德森的腫瘤學專家顧問僅發布了與官方醫學指南相關的“基于證據”的建議以及醫學文獻中發表的研究結果。如果人工智能系統的建議基于它在醫療記錄中發現的模式——例如,某種類型的患者在某種藥物上表現更好——其建議不會被視為基于證據的,即醫學中的黃金標準。如果沒有科學研究的嚴格控制,這種發現只會被認為是相關性,而不是因果關系。

Kohn 和其他很多人認為,為了 AI 能夠發揮其全部潛力并變革醫學,醫療保健的標準必須改變。“黃金標準并不是真正的黃金,”Kohn 表示,人工智能系統可以考慮的因素比臨床試驗中表現的要多得多,并且可以將患者進行更多分類,以提供“真正的個性化護理”。基礎設施也必須改變:醫療保健機構必須同意共享其專有和隱私控制的數據,以便 AI 系統可以從數百萬患者數據中學習。

美國市場遇冷

根據報告顯示,IBM 在美國市場遇冷。一些腫瘤學家說他們更相信自己的判斷,不需要沃森告訴他們該做什么。其他人則表示,它只是會提供一些他們了然于胸的建議。但 Kris 表示,一些醫生發現它可以作為一種即時的補充性意見,以安慰緊張的病人。“盡管它不完美,且作用有限,但它非常有用。” IBM 的銷售代表在美國以外的地區運氣好點,印度、韓國、泰國和其他醫院都采用了這項技術。許多醫院在營銷時以使用 IBM Watson 品牌為傲,告訴患者他們將享受人工智能癌癥治療。

盡管面臨一些挑戰,IBM 沃森也的確有一些成績,比如 IBM 與北卡羅來納大學、耶魯大學和其他知名機構合作開發的沃森基因組。該工具可幫助遺傳學實驗室為腫瘤科醫生提供報告。沃森讀取患者基因突變列表,并在幾秒鐘內生成一份描述所有相關藥物和臨床試驗的報告。此外,2017 年 IBM 在北卡羅來納大學的合作伙伴發表了一篇論文,介紹了沃森基因組工具的有效性。

無論有效與否,IBM 沃森仍然需要跨越重重障礙,才能實現 IBM 將沃森變成無可挑剔的“AI 醫生”的夢想,其他在醫療 AI 賽道上遭遇類似困境的企業,也應以此為鑒,及時做出應對策略和調整,才是最要緊的。

正如翼展科技 CTO 邊海鋒所說:“對于那些沒有醫療背景,但卻有資金和各種資源支持的大公司,他們做醫療 AI 的挑戰主要是在產品上缺乏領域知識,找不到能夠解決客戶痛點的應用場景,其次是如何打造一個熟悉醫療客戶群體的團隊。”

來源:AI 前線   作者:編譯:Debra

標簽
醫谷,分享創業的艱辛與喜悅,如果您是創業者,期望被更多的人關注和了解,請猛點這里  尋求報道

意見
反饋

掃碼
關注

掃碼關注醫谷微信

手機訪問

掃碼訪問手機版

返回頂部

河南快三摇奖福彩开奖结果