近日,在杉樹科技人工智能大師圓桌會議上, “冷撲大師”設(shè)計者、美國卡內(nèi)基梅隆大學(xué)(CMU)的計算機系教授托馬斯?桑德霍姆(Tuomas Sandholm)告訴澎湃新聞(www.thepaper.cn),相比AlphaGo下圍棋時能得到的完美信息,在日常生活中,我們更多的會遇到不完美信息博弈的場景,比如醫(yī)療領(lǐng)域里的腎臟移植。在桑德霍姆的幫助下,美國器官移植網(wǎng)絡(luò)的非營利性組織(United Network for Organ Sharing,簡稱UNOS)成功建立了更有效的腎臟分配制度。,
利用不完美信息的博弈,“冷撲大師”(德州撲克人工智能程序)今年4月份在海南完勝中國“學(xué)霸”隊。 對于“冷撲大師”的設(shè)計者托馬斯•桑德霍姆(Tuomas Sandholm)來說,贏下比賽是第一步,他更期待的是利用“冷撲大師”的算法,在現(xiàn)實生活中找到實際的應(yīng)用場景。
近日,在杉樹科技人工智能大師圓桌會議上, “冷撲大師”設(shè)計者、美國卡內(nèi)基梅隆大學(xué)(CMU)的計算機系教授托馬斯•桑德霍姆(Tuomas Sandholm)告訴澎湃新聞(www.thepaper.cn),相比AlphaGo下圍棋時能得到的完美信息,在日常生活中,我們更多的會遇到不完美信息博弈的場景,比如醫(yī)療領(lǐng)域里的腎臟移植。在桑德霍姆的幫助下,美國器官移植網(wǎng)絡(luò)的非營利性組織(United Network for Organ Sharing,簡稱UNOS)成功建立了更有效的腎臟分配制度。
在德州撲克中,玩家不知道對手手中是什么牌,不知道五張公共牌會開出怎樣的結(jié)果,也不知道對手猜測自己握有怎樣的手牌。要想取勝,計算機需要找到一個無論對方怎么做,自己都不會產(chǎn)生損失的策略。不完美信息的博弈就是讓人工智能學(xué)會找到平衡風(fēng)險與收益的方法。這與器官移植有著相似點。因為對于等待器官移植的病人來說,他只知曉自己的情況,無法了解整個器官供應(yīng)鏈條中的信息。這種情況下,我們就需要在“不完美信息”的情景中做出決策。
用算法提高腎臟捐贈的匹配率和捐贈效率
目前,傳統(tǒng)的器官移植主要有兩類:一類是親屬捐獻,即病人親屬捐獻,這類捐獻的好處就是病人往往不用等;另外一類是死者捐獻,一些死者在死前會簽署捐獻協(xié)議,承諾死后捐獻器官。但不論是哪一種,器官捐獻的數(shù)量都遠遠落后于病人數(shù)量。
除了移植器官數(shù)量稀少外,器官移植還涉及到移植分配和效率問題。舉例來說,移植的器官與接受器官移植的病人,因為血型不符或白血球抗原過敏,導(dǎo)致器官移植之后,病人的身體與器官相互排斥。這樣一來,不見得等到有移植的器官,病人就能得救,他同樣冒著極大的風(fēng)險。
因此,如何讓有限的器官,送到有需要的病人那,成為關(guān)鍵,這就需要設(shè)計一個合理的分配機制。從目前的醫(yī)療實踐來看,腎臟移植有兩種方式。一是建立多人交換循環(huán)。比如,A家屬給自己的病人A捐獻不了,但卻適合另外一家的病人B。而B的親屬的器官剛好適合病人A。在這種情況發(fā)生的時候,雙方可以通過交換捐獻的方式解決問題。依此類推,建立更完整的病人數(shù)據(jù)庫就能擴大受益家庭和病人。但是,這種移植方案也有一個漏洞,即多臺手術(shù)必須同時做。一旦有腎臟移植的捐贈者出現(xiàn)反悔,就會導(dǎo)致整個捐贈鏈條不可進行。
近日,在杉樹科技人工智能大師圓桌會議上, “冷撲大師”設(shè)計者、美國卡內(nèi)基梅隆大學(xué)(CMU)的計算機系教授托馬斯?桑德霍姆(Tuomas Sandholm)告訴澎湃新聞(www.thepaper.cn),相比AlphaGo下圍棋時能得到的完美信息,在日常生活中,我們更多的會遇到不完美信息博弈的場景,比如醫(yī)療領(lǐng)域里的腎臟移植。在桑德霍姆的幫助下,美國器官移植網(wǎng)絡(luò)的非營利性組織(United Network for Organ Sharing,簡稱UNOS)成功建立了更有效的腎臟分配制度。,
多人交換移植
第二種方式是鏈?zhǔn)狡ヅ?。簡單的說就是將死者捐獻的器官移植給某個病人,但前提條件是病人的親屬答應(yīng)把腎捐給下一個病人,這個病人的親屬又答應(yīng)把腎捐給下一個,形成鏈?zhǔn)椒磻?yīng)。鏈?zhǔn)揭浦驳淖畲蠛锰幨遣⒉恍枰獓?yán)格同時執(zhí)行,每一個家庭都是病人先得到腎再由捐贈人捐獻器官。如果有人反悔,雖然會有一些負面的影響,但是相對來說影響會小很多。鏈?zhǔn)揭浦驳牧硪粋€好處是可選擇性高,相對來說,會大大提高系統(tǒng)的移植效率。不過,缺點是會消耗一部分死者捐獻的腎源。
選擇死者腎源的鏈?zhǔn)揭浦?/p>
在這的情況下, UNOS建立了捐贈者和病人的數(shù)據(jù)庫,內(nèi)容包括需要移植器官的病人和捐獻者的身體情況、血型、身型,還有病人的地理位置,并努力地搜集病人的數(shù)據(jù)和愿意捐獻器官的親屬的數(shù)據(jù),更好地把這些親屬匹配起來。最后,利用人工智能算法建立并設(shè)計一套算法以在萬億次交換的可能性當(dāng)中,找到條件匹配的捐贈者和受贈者,從而提高捐贈的效率。
上海財經(jīng)大學(xué)教授,中國運籌學(xué)會青年科技獎獲得者何斯邁告訴澎湃新聞(www.thepaper.cn),目前美國于2007年已經(jīng)正式立法,允許交換移植。在桑德霍姆建立算法并應(yīng)用到UNOS平臺后,該平臺的腎移植的數(shù)量從每年28000例提升到33600例。
效率與公平,最后由誰來決定
雖然利用人工智能算法提高了腎臟移植的匹配率,但因為死者捐贈的腎遠遠不夠滿足無親屬捐贈的病人需求。一個腎在一方面可以通過鏈?zhǔn)揭浦簿群芏嗟牟∪耍瑫r一定會有病人因此無法得到合適的器官移植。這樣一來就會出現(xiàn)經(jīng)典的電車難題:一輛電車脫軌了,一邊的軌道上有一群小朋友在玩。如果你是火車司機,你可以選擇將火車扳一個岔道從而拯救這些小朋友,但是會害了在岔道上工作的另一個人。你會怎么做呢?
電車難題
為了盡量避免這種情況,桑德霍姆的計算模型在做出決策時,并不是簡單地以人越多越好為優(yōu)先。因為抗體和血型特殊很難配上,只有在追求短期移植效率最高時,這種特殊病人才會積壓下來。在這種時候,算法就必須預(yù)測每一個腎捐給一位病人之后能活多久,他們之間移植存活率有多高。
對于計算機來說,所有涉及的因素都可以量化,但在現(xiàn)實生活中,情況并不是都可以量化的。例如,按照計算機排序和等待時間,下一個腎臟應(yīng)該移植給一位80歲的老人,但計算機根據(jù)他的身體狀況算出,他移植后只能再活一年。但如果移植給下一位病人,一位10歲的兒童,卻能活30年。這種情況下,醫(yī)生該如何選擇?
桑德霍姆給出的回答是:“我們的算法負責(zé)計算,并告知醫(yī)生移植后的效率哪個更高。但最后做出決定的應(yīng)該是醫(yī)生和病人。”