2017-03-13 11:06:42分類:行業(yè)資訊4606
從2016年開始,人工智能威脅醫(yī)生的論調不絕于耳。2017年剛開年,包括《自然(Nature)》和《美國醫(yī)學協(xié)會雜志(Journal of the American Medical Association)》在內的幾家核心期刊,就接連刊登了幾起“機器人”醫(yī)生打敗人類醫(yī)生的案例。
在討論人工智能是否能徹底讓醫(yī)生“失業(yè)”之前,我們先來區(qū)分一下“強人工智能”和“弱人工智能”。
強人工智能是通用型的,在什么場景都能夠隨機解決各種問題的智能,能夠在復雜系統(tǒng)內,應對開放式問題,比如政治問題、經濟問題等。這種智能具有自我意識的,和生物一樣,有生存和安全的需求,因此它們可以自己提出問題。
與之相對,弱人工智能只能在某個特定場景,并且封閉的系統(tǒng)內,解決某個特定的問題。弱人工智能沒有自我意識和主觀能動性,需要人類對其輸入某一指令才會運轉。
不過,連最初提出“強人工智能”概念的約翰·羅杰斯·希爾勒本人都不相信,強人工智能可以實現。
日前,在中歐衛(wèi)生管理與政策中心舉行的第19期衛(wèi)生政策上海圓桌會議上,原上海市第一婦嬰保健院院長段濤表示,人工智能可能是掀起公立醫(yī)院改革的一股意想不到的力量,醫(yī)院現在” 最缺的是病理科醫(yī)生、影像醫(yī)生等,但再過三五年,這些醫(yī)生將一點不缺。”
皮膚科
“美國最近科技雜志連著發(fā)文章,皮膚科醫(yī)生已經被人工智能打敗了”,段濤在會上提到,“皮膚科有了人工智能的診斷,全中國90%的皮膚科醫(yī)生可以不需要了,你把照片拍好給它,它診斷水平比90%以上中國皮膚科醫(yī)生的水平都要高。”
段濤指的是,《自然(Nature)》刊發(fā)的皮膚科人機大戰(zhàn)??茖W家先讓一個“卷及神經網絡(CNN)”分析學習了近13萬張皮膚病臨床圖片,涵蓋了2023種皮膚疾病。
21位醫(yī)生受邀,與機器人展開了兩場針對皮膚癌診斷能力的較量:第一場區(qū)分角質細胞癌和良性脂溢性角化病;第二場區(qū)分惡性黑色素瘤和良性痣。結果,人工智能正確識別良性病變和惡性病變的綜合靈敏度達到91%,打敗了多名皮膚科醫(yī)生。
科學家表示,正在努力讓這項智能診斷技術與智能手機兼容,“皮膚科家庭醫(yī)生”離我們不遠了。
其實,以色列公司Emerald Medical Applications已經開發(fā)了一款運用云人工智能技術和手機攝像頭檢測黑色素瘤的手機應用,并已在FDA注冊。
據市場調查公司 IDC 估測,雖然目前只有 1% 的軟件應用有人工智能的特征,但到 2018年,這個數字預計能達到50%。
眼科
不止皮膚科,人工智能在眼科的診斷水平也表現不俗。
去年11月,谷歌的研究者在《美國醫(yī)學協(xié)會雜志(Journal of the American Medical Association)》上發(fā)表的一篇文章,稱其開發(fā)出了一種解讀視網膜照片中,糖尿病性視網膜病變發(fā)病跡象的深度學習算法,這種算法的水平已經達到眼科醫(yī)師的診斷水平。
谷歌請到印度和美國的醫(yī)生,共同創(chuàng)建了一個包含12.8萬張圖像的開發(fā)數據集,用于訓練這種算法。隨后,谷歌用9,963張圖像作為驗證集,請到8位醫(yī)生和算法進行PK。
這場競賽的結果是,人類醫(yī)生略遜一籌。算法得到的F-Score值(結合靈敏度和特異性的度量,最大值為1)為0.95,而8位眼科醫(yī)生F-Score的中位數值是0.91。
需要明確的是,診斷糖尿病性視網膜病變是一個多步驟的過程,2D眼底照片只是其中一部分,某些情況下,醫(yī)生需要使用3D成像技術,光學相干斷層掃描(OCT),詳細檢查視網膜的各個層。
國內的Airdoc也開發(fā)了一個功能相同的深度神經網絡。經測試,該算法在有明顯癥狀和無明顯癥狀二分方面的準確性與三甲醫(yī)院資深眼科醫(yī)生持平,在眼底照片國際標準5分類方面的準確性也不遜于專業(yè)眼科醫(yī)生。
影像科和病理科
微軟研究院曾提出,基于深度學習的圖像識別技術的識別精度能夠超過人類。在醫(yī)療大數據中,影像數據是相對結構化的數據,因此人工智能在這個領域的應用最多,技術成熟度也最高。
段濤從幾個投資人處獲悉,“一家人工智能公司,做肺部結節(jié)的圖片,就是放射科,他們把全中國最好的幾個肺部讀片專家的結果作為標準,用人工智能,做了不到兩百個病人的案例,最終他們得出來的一個結論是什么呢?這個人工智能系統(tǒng)可以達到95%到98%的專家水平。”
在國外的這個領域,Enlitic可能是最有名的一家公司,他們致力于用圖像識別算法,在X光、CT掃描、超聲波檢查、MRI等的圖像中做癌癥早曬。據悉,該公司曾在公共數據集上測試其圖像識別算法,通過肺部CT結果診斷肺癌,結果發(fā)現算法的準確率比放射科專家高出50%以上。
Enlitic的算法在提高病理診斷的效率和精確性上,也發(fā)揮了顯著作用。例如,在乳腺癌前哨淋巴結轉移診斷中,人工智能算法的誤診率為7.5%。公司請到一批病理學專家對同批切片做診斷,誤診率為3.5%,而當病理學家運用該算法做輔助診斷時,誤診率被進一步降至0.5%。
國內的人工智能醫(yī)療影像公司DeepCare也做過類似的事。他們請了4位分別來自北京的特級三甲、普通三甲和地方三甲醫(yī)院的醫(yī)生看70張疑似乳腺癌轉移的片子。4名醫(yī)生的年資分別是40年、30年、20驗和10年。同時參與讀片的還有人工智能機器人。
70張片子中,有30張是陰性的,40張是陽性的。40年經驗的醫(yī)生對此的診斷準確率達到98%以上,而其他3名醫(yī)生的平均準確率在70%。而DeepCare的工智能機器人準確率達到了93%。
據該公司透露,測試之后的兩個月,該算法的準確率提升到了95%。
的確,隨著人工智能算法“吃”的數據和學習的專家意見越來越多,其在某些特定診療問題上的能力終將超越人類,而這些都屬于弱人工智能范疇。
但是,在面對生命體這樣一個復雜的系統(tǒng)時,人類全科醫(yī)生那樣的,面對開放問題的綜合處理能力,卻是“機器人”望塵莫及的,應該說,這樣的強人工智能,至今尚未出現。
另外,涉及處方權等法律問題,以及醫(yī)學人文等感性問題時,人工智能系統(tǒng)永遠無法代替人類的角色。
“你還要那么多醫(yī)生干嘛?”
段濤在演講結束時表示,“未來真的不知道會怎么樣,所以人工智能會導致我們公立醫(yī)院解構和重構非常重要的驅動因素。”