AI可以是殺戮的武器,也可以是救世的良方

本文主要講述了吳恩達(dá)團(tuán)隊(duì)最新成果——用深度學(xué)習(xí)來(lái)改善臨終關(guān)懷服務(wù),希望可以給你帶來(lái)啟發(fā)和思考。

上周,在日內(nèi)瓦舉行的聯(lián)合國(guó)特定常規(guī)武器公約會(huì)議上,伯克利大學(xué)教授Stuart Russell向大眾發(fā)出了警告:基于AI的殺人機(jī)器人將會(huì)對(duì)人類造成極大的威脅。

AI可以是殺戮的武器,也可以是救世的良方

與此同時(shí),吳恩達(dá)所在的斯坦福團(tuán)隊(duì)又將AI在醫(yī)療領(lǐng)域的作用往前推進(jìn)了一不。與此前的“AI看片”不同,這次,吳恩達(dá)希望利用深度學(xué)習(xí)技術(shù),為那些身患絕癥、時(shí)日不多的病人,更好地提供臨終關(guān)懷服務(wù),讓他們更有尊嚴(yán)地度過(guò)剩下的日子。

聽(tīng)起來(lái)似乎有點(diǎn)不可思議,那么吳恩達(dá)團(tuán)隊(duì)到底是怎么做的呢?下面的這篇論文或許可以給我們一些思考和啟迪。

AI可以是殺戮的武器,也可以是救世的良方

摘要

為住院病人提供更高質(zhì)量的姑息治療一直是醫(yī)療保健機(jī)構(gòu)的重點(diǎn)工作之一。研究表明,醫(yī)生們往往會(huì)過(guò)高估計(jì)預(yù)后效果,加之治療手段的慣性,導(dǎo)致病人實(shí)際得到的姑息治療不如預(yù)期。為此,我們提出了一種解決方案:利用深度學(xué)習(xí)的技術(shù)加上電子健康檔案(EHR)數(shù)據(jù)。目前一家學(xué)術(shù)醫(yī)療中心已得到機(jī)構(gòu)審查委員會(huì)的批準(zhǔn),正在對(duì)這種方法進(jìn)行試驗(yàn)。算法會(huì)自動(dòng)評(píng)估住院病人的EHR數(shù)據(jù),幫助姑息治療懷團(tuán)隊(duì)判斷哪些病人可能需要姑息治療。該算法實(shí)際上是用病人先前的HER數(shù)據(jù)訓(xùn)練出來(lái)的一個(gè)神經(jīng)網(wǎng)絡(luò),它可以預(yù)測(cè)出病人由于各種原因在3至12個(gè)月內(nèi)死亡的幾率,以此作為是否為其提供姑息治療的一個(gè)指標(biāo)。我們的預(yù)測(cè)可以讓姑息治療團(tuán)隊(duì)以積極主動(dòng)的方式找到此類病人,而不是依賴主治醫(yī)師的推介,或花時(shí)間研究所有病人的病例。另外,我們還提出了一種新的解釋方法,用以詮釋模型作出的預(yù)測(cè)。

引言

研究表明,大約80%的美國(guó)人希望能在自己家中度過(guò)生命的最后時(shí)光,但是如愿的只有20%。事實(shí)上,超過(guò)60%的死亡發(fā)生在醫(yī)院的急診病房,而病人在臨終前的最后一段時(shí)間會(huì)接受侵入性治療。在過(guò)去10年間,可以提供姑息治療的醫(yī)院一直在增加。在2008年,全美所有病床數(shù)超過(guò)50張的醫(yī)院中,有53%的醫(yī)院設(shè)有姑息治療團(tuán)隊(duì),2015年這一比例已攀升至67%。雖然可以提供姑息治療的醫(yī)院越來(lái)越多,但是根據(jù)國(guó)家姑息治療登記處(National Palliative Care Registry)的數(shù)據(jù),在所有需要接受姑息治療的病人(占所有住院病人7% – 8%)中,只有不到一半的人真正接受了這種治療。造成這種情況的主要原因是姑息治療專業(yè)人員的短缺以及缺乏讓醫(yī)療系統(tǒng)聘用這些人員的激勵(lì)措施。通過(guò)相關(guān)技術(shù)我們可以高效地識(shí)別出最需要姑息治療的病人,但是在現(xiàn)有治療模式下人們可能會(huì)忽視技術(shù)的應(yīng)用。

在本文中,我們主要從兩個(gè)角度探討這個(gè)問(wèn)題。首先,醫(yī)生不推薦病人接受姑息治療的原因有很多,例如:對(duì)病情的預(yù)估過(guò)度樂(lè)觀、時(shí)間壓力或治療慣性。這可能會(huì)導(dǎo)致病人在臨終前無(wú)法按照自己的意愿生活,反而接受過(guò)度的侵入式治療。其次,姑息治療專業(yè)人員短缺嚴(yán)重,這使得通過(guò)人工審查病例的方法對(duì)候選病人進(jìn)行篩選既昂貴又耗時(shí)。

人們可能很難明確地規(guī)定一個(gè)標(biāo)準(zhǔn),用來(lái)判定哪些病人能從姑息治療中獲益。在本論文中,我們使用深度學(xué)習(xí)算法對(duì)住院病人進(jìn)行篩選,識(shí)別出最有可能需要接受姑息治療的病人。該算法處理的是一個(gè)代理(proxy)問(wèn)題:預(yù)測(cè)某一病人在未來(lái)12個(gè)月內(nèi)的死亡幾率,根據(jù)預(yù)測(cè)結(jié)果作出關(guān)于接受姑息治療的建議。這樣姑息治療團(tuán)隊(duì)就可以根據(jù)病人的EHR數(shù)據(jù)作出客觀的建議,幫助抵消主治醫(yī)師潛在的診斷偏差,而且還不需要人工對(duì)每個(gè)病例都進(jìn)行審查。當(dāng)前用于識(shí)別此類病人的工具存在一些局限,我們會(huì)在下一部分進(jìn)行討論。

相關(guān)工作

準(zhǔn)確的預(yù)后信息對(duì)病人、護(hù)理人員和臨床醫(yī)生都是有價(jià)值的。一些研究表明,臨床醫(yī)生一般都對(duì)自己的絕癥患者的預(yù)后效果估計(jì)過(guò)于樂(lè)觀。這里有幾種解決方案試圖使病人的預(yù)后信息更加的客觀和智能化。在這些解決方案中,許多都是根據(jù)患者的臨床和生物學(xué)兩種參數(shù)來(lái)構(gòu)建模型產(chǎn)生一個(gè)評(píng)分,而這個(gè)評(píng)分可以用來(lái)估計(jì)預(yù)期的存活率。

用于姑息治療的預(yù)后方法

姑息性表現(xiàn)尺度是針對(duì)姑息治療,修改了人體機(jī)能狀態(tài)量表(KPS)而發(fā)展得來(lái)的。它是基于例如活動(dòng)度、活動(dòng)能力、自理能力、食物和體液攝入量、意識(shí)狀態(tài)等可觀察因子來(lái)計(jì)算的。姑息性預(yù)后評(píng)分(PPS)也是為姑息治療制定的一種評(píng)分機(jī)制,它的重點(diǎn)是放在晚期癌癥患者身上。PPS是基于以下的變量來(lái)進(jìn)行多元回歸分析計(jì)算:臨床預(yù)測(cè)生存期(CPS)、卡氏評(píng)分(KPS)、厭食、呼吸困難、總的白細(xì)胞數(shù)量(WBC)和淋巴細(xì)胞百分比。而另一種與PPS在相同時(shí)期內(nèi)發(fā)展起來(lái)的指標(biāo),姑息預(yù)后指數(shù)(PPI),也是基于性能狀態(tài)指標(biāo)進(jìn)行了一個(gè)多元回歸分析來(lái)得到了評(píng)分,例如口服攝入、水腫的基礎(chǔ)得分、休息時(shí)呼吸困難和譫妄(急性腦綜合征)。這些分?jǐn)?shù)難以在大規(guī)模上進(jìn)行實(shí)現(xiàn),因?yàn)樗鼈兩婕懊鎸?duì)面的臨床評(píng)估,涉及臨床醫(yī)生對(duì)生存者狀態(tài)的預(yù)測(cè)。此外,這些評(píng)分的目的是在姑息治療中來(lái)使用,而那時(shí)病人已經(jīng)處于疾病晚期階段,不能達(dá)到更早鑒別他們疾病狀態(tài)的目的。

加護(hù)病房ICU的預(yù)后方法

也有一些常常用在ICU上的預(yù)后評(píng)分模型。APACHE-II評(píng)分(急性生理、年齡、慢性健康評(píng)測(cè))是用來(lái)預(yù)測(cè)ICU中危重住院患者住院死亡危險(xiǎn)程度的。這種模型最近已經(jīng)被APACHE-III改進(jìn)了,主要是細(xì)化了評(píng)分項(xiàng),采用了ICU入院之前的諸如主要的內(nèi)科和外科疾病分類、急性生理異常、年齡、原有功能的局限性、主要的合并癥和治療地點(diǎn)等因素。另一個(gè)在ICU中常用的評(píng)分系統(tǒng)是簡(jiǎn)化急性生理評(píng)分,也稱作SAPS II,它是根據(jù)病人的生理和潛在疾病這些變量來(lái)計(jì)算的。當(dāng)病人已經(jīng)轉(zhuǎn)入ICU時(shí),雖然這些評(píng)分對(duì)治療組來(lái)說(shuō)是有用的,但是他們?cè)诖_定患者是否是有長(zhǎng)期死亡風(fēng)險(xiǎn)的方面是有限的。但是這些評(píng)分仍然能夠讓他們對(duì)其目標(biāo)和價(jià)值進(jìn)行有意義的討論,以便他們確定另一種護(hù)理方式。

早期識(shí)別的預(yù)后方法

為了盡早發(fā)現(xiàn)絕癥患者,為其制定一個(gè)臨終的計(jì)劃并確保其有意義,現(xiàn)在這方面已經(jīng)有許多的研究和開(kāi)發(fā)的方法了。CriSTAL (適當(dāng)?shù)恼疹櫤宛B(yǎng)護(hù)篩選標(biāo)準(zhǔn))就是一種用來(lái)確定老年患者是否接近生命的盡頭,以及量化在住院時(shí)的死亡風(fēng)險(xiǎn)或出院后不久的死亡風(fēng)險(xiǎn)的方法。為了識(shí)別瀕死的病人,CriSTAL 提供了一個(gè)采用十八個(gè)預(yù)測(cè)因子的檢查表。

CARING是一種用于識(shí)別可以從姑息治療中獲益患者的方法。其目標(biāo)是使用六個(gè)簡(jiǎn)單的標(biāo)準(zhǔn)來(lái)判斷1年內(nèi)有死亡風(fēng)險(xiǎn)的患者。PREDICT也是基于六項(xiàng)預(yù)后指標(biāo),這些指標(biāo)是從CARING中提煉出來(lái)的。該模型根據(jù)976名患者的情況建立的。

Intermountain死亡風(fēng)險(xiǎn)評(píng)分是一種基于實(shí)驗(yàn)室常規(guī)檢查的針對(duì)所有原因進(jìn)行死亡率預(yù)測(cè)的評(píng)分機(jī)制。該模型提供了30天、1年和5年死亡風(fēng)險(xiǎn)的評(píng)分,它的訓(xùn)練集包含71921人的數(shù)據(jù),測(cè)試集包含47458人的數(shù)據(jù)。

大數(shù)據(jù)時(shí)代的預(yù)后信息

醫(yī)療保健系統(tǒng)中電子病歷系統(tǒng)的普及和針對(duì)高維數(shù)據(jù)方面機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,為我們?cè)卺t(yī)療上作出貢獻(xiàn)提供了一個(gè)特殊的機(jī)會(huì),特別是在疾病預(yù)后方面。上面描述的所有方法,以及我們所回顧的方法,至少有以下缺陷之一。他們都是采用了規(guī)模較小的數(shù)據(jù)集(僅限于特定的研究或一群人),或用太少的變量(故意使模型簡(jiǎn)單化,或是為了避免過(guò)擬合),或模型太簡(jiǎn)單而不能捕捉人類健康的復(fù)雜性和微妙之處,或者局限于某些亞群體(根據(jù)疾病類型,年齡等)。而我們?cè)谶@篇工作中解決了這些限制。

方法

姑息治療團(tuán)隊(duì)在很大程度上不清楚疾病的類型、階段和嚴(yán)重程度(病人是否被送入加護(hù)病房進(jìn)行治療)以及病人的年齡等要素,我們從他們的角度探討了如何預(yù)測(cè)死亡率的問(wèn)題。我們采用一種由數(shù)據(jù)驅(qū)動(dòng)的方法,構(gòu)建了一個(gè)考慮每位病人EHR(長(zhǎng)時(shí)間內(nèi)的病例)的深度學(xué)習(xí)模型,并且確保分析不會(huì)局限于任何亞群體或類同的群體。我們要解決的問(wèn)題是識(shí)別需要接受姑息治療的病人,為了是這一問(wèn)題便于處理,我們使用了下面這個(gè)代理(proxy)問(wèn)題陳述:

給定某一病人和日期,使用該病人上一年的EHR數(shù)據(jù),預(yù)測(cè)其在自該日期起的12個(gè)月之內(nèi)的死亡率。

我們將這個(gè)問(wèn)題看作為一個(gè)二分類問(wèn)題,然后通過(guò)構(gòu)建深度學(xué)習(xí)監(jiān)督模型來(lái)解決。我們的目標(biāo)不只是構(gòu)建出可以很好地解決上述問(wèn)題的模型,我們還希望探討該模型在解決以下這個(gè)子問(wèn)題(即:預(yù)測(cè)住院病人的死亡率)時(shí)的表現(xiàn)。因?yàn)楣孟⒅委煿ぷ髡咄菀捉槿胱≡翰∪说闹委煛?/p>

為監(jiān)督學(xué)習(xí)構(gòu)建數(shù)據(jù)集

我們將已登記死亡日期的病人作為positive實(shí)例,將其他病人作為negative實(shí)例。然后,我們將病人的預(yù)期死亡時(shí)間作為分界點(diǎn),將健康檔案上的時(shí)間線劃分為虛擬未來(lái)(virtual future)和過(guò)去事件。我們利用每位病人在虛擬過(guò)去(virtual past)的數(shù)據(jù)來(lái)預(yù)測(cè)他們?cè)谖磥?lái)3-12個(gè)月內(nèi)的死亡幾率。注意:在定義預(yù)測(cè)日期時(shí),必須避免違反常識(shí)性的限制條件(見(jiàn)下文),不然的話標(biāo)簽就會(huì)無(wú)效。我們只針對(duì)可以在滿足這些約束情況的前提下找到預(yù)測(cè)日期的病人。

Positive實(shí)例:positive實(shí)例的限制條件的確定基于這一理論基礎(chǔ):在死亡之前的3-12個(gè)月內(nèi)被推薦接受姑息治療的病人最能從中獲益。我們認(rèn)為在病人死亡前的3個(gè)月內(nèi)對(duì)其進(jìn)行死亡幾率預(yù)測(cè)為時(shí)太晚,因?yàn)椴∪嗽诮邮芄孟⒅委熐靶枰欢ǖ幕I備時(shí)間;這一時(shí)間超過(guò)12個(gè)月也不可行,因?yàn)轭A(yù)測(cè)病人在很長(zhǎng)時(shí)間范圍內(nèi)的死亡幾率非常困難。更重要的是,姑息治療介入?yún)f(xié)助是有限的,最好主要用于滿足較為迫切的需求。

Positive實(shí)例的預(yù)測(cè)日期必須滿足以下限制條件:

  • 預(yù)測(cè)日期必須為記錄在案的問(wèn)診日期。
  • 預(yù)測(cè)日期必須至少比病人死亡日期早 3 個(gè)月(否則死亡日期會(huì)太靠近預(yù)測(cè)日期)。
  • 預(yù)測(cè)日期最多只能比病人死亡日期早 12 個(gè)月(否則死亡日期會(huì)離預(yù)測(cè)日期太遠(yuǎn))。
  • 預(yù)測(cè)日期必須比首次問(wèn)診日期至少晚 12 個(gè)月(否則病人就沒(méi)有足夠的歷史數(shù)據(jù)來(lái)作為預(yù)測(cè)的依據(jù))。
  • 預(yù)測(cè)對(duì)象最好為住院病人,前提是他們必須滿足上述條件(因?yàn)橄噍^于其他類型的病人,住院病人更愿意接受姑息治療建議)
  • 預(yù)測(cè)日期必須早于滿足上述限制條件的其他所有候選日期。

negative 案例:對(duì)于negative案例(未記錄死亡日期的病人),必須確保案例中的病人在自預(yù)測(cè)日期起的 12 個(gè)月內(nèi)沒(méi)有死亡。我們選擇的預(yù)測(cè)日期必須滿足以下所有條件:

  • 預(yù)測(cè)日期必須為記錄在案的問(wèn)診日期。
  • 預(yù)測(cè)日期必須至少比最后一次接觸病人的日期早 12 個(gè)月(以避免發(fā)生拍攝 EHR 快照后死亡日期不明確的情況)。
  • 預(yù)測(cè)日期必須至少比首次問(wèn)診日期晚 12 個(gè)月(否則無(wú)法獲得足夠的歷史數(shù)據(jù))。
  • 預(yù)測(cè)對(duì)象最好為住院病人(優(yōu)先于其他類型的病人),前提是他們滿足上述限制條件(作為 positive 實(shí)例的對(duì)照組)
  • 預(yù)測(cè)日期必須早于滿足上述限制條件的其他所有可能候選日期。

AI可以是殺戮的武器,也可以是救世的良方

圖 1. 以病人存活圖表示右刪失長(zhǎng)度

  • 縱坐標(biāo):病人比例;橫坐標(biāo):天數(shù)
  • 紅線:死亡病人(死亡前存活的天數(shù))
  • 綠線:存活病人(確認(rèn)存活時(shí)間)
  • 黑色虛線:分割線
  • 藍(lán)色虛線:最少存活時(shí)間

住院病人(admitted patients):預(yù)測(cè)日期與住院日期相對(duì)應(yīng)的病人為住院病人,其余病人為非住院病人。(注意:非住院病人治療歷史中可能還有其他記錄在案的住院經(jīng)歷)。對(duì)住院病人的預(yù)測(cè)日期進(jìn)行再調(diào)整: 將住院后的第二天作為預(yù)測(cè)日期。這樣做的理論根據(jù)是:在住院后的24小時(shí)內(nèi),醫(yī)院通常會(huì)用最新的數(shù)據(jù)(初步檢測(cè)數(shù)據(jù)、診斷數(shù)據(jù)等)對(duì)病人記錄進(jìn)行更新,住院后的第二天更適合作為預(yù)測(cè)日期。注意:住院病人是本試驗(yàn)所有病人的一個(gè)子集(而不是一個(gè)單獨(dú)的數(shù)據(jù)集)。positive實(shí)例和negative實(shí)例都對(duì)預(yù)測(cè)日期后收集的所有數(shù)據(jù)進(jìn)行審核。

AI可以是殺戮的武器,也可以是救世的良方

表1:病人人數(shù)的劃分

AI可以是殺戮的武器,也可以是救世的良方

圖2.? 預(yù)測(cè)時(shí)病人的年齡

特征提取

我們將每位病人的預(yù)測(cè)日期之前的12個(gè)月作為觀察期。在每位病人的觀察期內(nèi),我們使用ICD9(國(guó)際疾病分類第9修訂版)診斷和計(jì)費(fèi)編碼、《當(dāng)代操作術(shù)語(yǔ)集》(Current Procedural Terminology,CPT)操作編碼、RxNorm處方編碼以及觀察期內(nèi)的醫(yī)患接觸來(lái)生成特征。

我們按照以下方法生成特征。為了捕獲數(shù)據(jù)的縱向性質(zhì),我們將每位病人的觀察期劃分為4個(gè)觀察階段,表III顯示了這四個(gè)階段與預(yù)測(cè)日期(PD)的對(duì)比,階段1最靠近預(yù)測(cè)日期,階段4離預(yù)測(cè)日期最遠(yuǎn)。我們對(duì)各觀察階段分配不均勻的時(shí)間長(zhǎng)度,目的是為了讓模型更多關(guān)注靠近預(yù)測(cè)日期的數(shù)據(jù)。在每個(gè)病人的各觀察階段中,我們記錄了每個(gè)編碼類別中的每個(gè)編碼出現(xiàn)的次數(shù)(開(kāi)處方、計(jì)費(fèi)等)。我們將這些編碼出現(xiàn)的次數(shù)作為一個(gè)單獨(dú)的特征。

我們還考慮了病人的人口統(tǒng)計(jì)數(shù)據(jù)(年齡、性別、種族、民族)以及觀察期內(nèi)各編碼類別的匯總數(shù)據(jù)(如下所示):

  • 類別內(nèi)特殊編碼出現(xiàn)次數(shù)。
  • 類別內(nèi)編碼出現(xiàn)的總次數(shù)。
  • 在任一天所分配的編碼的最大數(shù)量。
  • 在任一天所分配的編碼的最小數(shù)量(非零)。
  • 一天內(nèi)分配的編碼的數(shù)量范圍。
  • 一天內(nèi)分配的編碼的數(shù)量均值。
  • 一天內(nèi)分配的編碼的數(shù)量方差。

我們將所有這些特征(各觀察階段中編碼出現(xiàn)的次數(shù),觀察期內(nèi)各類別的匯總數(shù)據(jù),以及人口數(shù)據(jù))連接起來(lái)形成特征集。在特征集中,我們?nèi)コ辉?00或少于100位的病人群體中出現(xiàn)的特征。最后得出的特征集共有13654條特征。在這些特征中,每位病人平均有74個(gè)非零特征值(標(biāo)準(zhǔn)差為62),最多有892個(gè)特征值??偺卣骶仃嚨南∈柚荡蠹s為99.5%。

AI可以是殺戮的武器,也可以是救世的良方

圖3.?在測(cè)試集數(shù)據(jù)上模型輸出概率的可靠性曲線(標(biāo)定線)

  • 縱軸:positive實(shí)例的比例;橫軸:預(yù)測(cè)值均值
  • 虛線:校準(zhǔn)線
  • 藍(lán)線:所有病人(0.042)

算法和訓(xùn)練

我們的模型是由一個(gè)輸入層(13654個(gè)維度)、18個(gè)隱藏層(每層 512 個(gè)維度)和一個(gè)標(biāo)量輸出層構(gòu)成的深度神經(jīng)網(wǎng)絡(luò)(DNN)。我們?cè)谳敵鰧討?yīng)用邏輯損失函數(shù)(logistic loss function),在模型每層上都應(yīng)用縮放指數(shù)線性單元(Scaled Exponential Linear Unit ,SeLU)。我們使用 Adam optimizer?和大小為128個(gè)樣本的 mini-batch?對(duì)模型進(jìn)行了優(yōu)化。然后,我們對(duì)每250 個(gè)mini-batch迭代提取中間體模型snapshot(Intermediate model snapshots),選擇在驗(yàn)證集上表現(xiàn)最好的snapshot作為最終模型。我們發(fā)現(xiàn)沒(méi)有必要進(jìn)行明確的正則化操作。通過(guò)對(duì)各種網(wǎng)絡(luò)深度(從2到32)和激活函數(shù)(tanh、ReLU和SeLU)進(jìn)行廣泛的超參數(shù)搜索,我們得到了最終的網(wǎng)絡(luò)架構(gòu)。

評(píng)估

由于數(shù)據(jù)是不均衡的,將準(zhǔn)確度作為評(píng)價(jià)指標(biāo)是不可行的。在不均衡問(wèn)題中ROC曲線有時(shí)可能會(huì)有誤導(dǎo)作用。因此,我們使用平均準(zhǔn)確度(AP)分?jǐn)?shù)作為評(píng)價(jià)指標(biāo),也稱為模型選擇AUPRC曲線( Area Under Precision-Recall Curve )。

結(jié)論

在本節(jié)中,我們將根據(jù)在驗(yàn)證集上獲得最好AP分?jǐn)?shù)選擇的模型,來(lái)給出在測(cè)試集上獲得的技術(shù)評(píng)估結(jié)果。我們觀察到模型根據(jù)0.042的Brier score進(jìn)行了合理的校正(如圖3所示)。在我們感興趣的高閾值的規(guī)則下,該模型在估計(jì)概率方面是一個(gè)比較保守(顯得信心不足)的模型,但是這應(yīng)該不會(huì)有什么壞的影響。

AI可以是殺戮的武器,也可以是救世的良方

圖4是插值精度召回曲線( Interpolated Precision-Recall curve)

  • 水平虛線表示0.9的精度水平。
  • 垂直虛線表示曲線達(dá)到0.9精度時(shí)的召回率。

AI可以是殺戮的武器,也可以是救世的良方

圖5是模型在測(cè)試集上表現(xiàn)情況的受試者工作特性曲線(ROC)

插值精度召回曲線如圖4所示。該模型的AP評(píng)分為0.69(入院病人為0.65)。早期召回這個(gè)結(jié)果是可取的,因此可以認(rèn)為在精確為0.9時(shí)召回是一個(gè)度量指標(biāo)。該模型在0.9的精度上實(shí)現(xiàn)了召回率為0.34(入院病人的召回率達(dá)到0.32即可)。受試者工作特性曲線如圖5所示。該模型實(shí)現(xiàn)了0.93的正確率(0.87即可判定是患者)。ROC和精密召回圖都顯示出,該模型顯示出強(qiáng)烈的早期召回行為。

定性分析

值得一提的是,預(yù)測(cè)死亡率是確定能從姑息治療中獲益病人的一個(gè)代理(proxy)問(wèn)題。為了評(píng)估模型在原始問(wèn)題上的性能,我們檢驗(yàn)了高輸出概率的假陽(yáng)性患者情況。我們注意到,雖然這樣的患者并沒(méi)有在他們的預(yù)測(cè)日期12個(gè)月內(nèi)死亡,但是他們經(jīng)常被診斷為疾病晚期和/或需要高標(biāo)準(zhǔn)的醫(yī)療服務(wù)。這在第五節(jié)所示的陽(yáng)性和假陽(yáng)性例子中可以看到。

在達(dá)到精度為0.9的患者中,姑息治療小組對(duì)其中50個(gè)隨機(jī)選擇的患者進(jìn)行進(jìn)行了圖表檢查,發(fā)現(xiàn)所有這些人在其預(yù)測(cè)日期內(nèi)都適合轉(zhuǎn)診,即使他們存活了一年多。這表明,在解決代理(proxy)問(wèn)題方面,死亡率預(yù)測(cè)是一個(gè)合理的(和易處理的)選擇。

AI可以是殺戮的武器,也可以是救世的良方

隨機(jī)陽(yáng)性患者高概率評(píng)分的預(yù)測(cè)解釋。表格僅顯示導(dǎo)致概率的下降的因素。

AI可以是殺戮的武器,也可以是救世的良方

隨機(jī)陽(yáng)性患者高概率評(píng)分的預(yù)測(cè)解釋。表格僅顯示導(dǎo)致概率的下降的因素。

 

論文地址:https://arxiv.org/abs/1711.06402

翻譯:AI科技大本營(yíng)(ID:rgznai100);參與:尚巖奇,劉暢

本文由 @AI科技大本營(yíng) 授權(quán)發(fā)布于增長(zhǎng)黑客,未經(jīng)作者許可,禁止轉(zhuǎn)載。

 

Growth Hacker(增長(zhǎng)黑客):依靠技術(shù)和數(shù)據(jù)來(lái)達(dá)成各種營(yíng)銷目標(biāo)的新型團(tuán)隊(duì)角色。從單線思維者時(shí)常忽略的角度和高度,梳理整合產(chǎn)品發(fā)展的因素,實(shí)現(xiàn)低成本甚至零成本帶來(lái)的有效增長(zhǎng)…

本文經(jīng)授權(quán)發(fā)布,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.allfloridahomeinspectors.com/cgo/market/1951.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2017-12-09 10:59
內(nèi)容付費(fèi)將進(jìn)入下半場(chǎng),知識(shí)掮客們?yōu)楹位帕耍?/span>
下一篇 2017-12-09 15:38

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論