時間:2017-06-14 來源:互聯網 瀏覽量:
美國每年有一千名兒童在出生後的第一年去世,其中六分之一死因不明
嬰兒猝死綜合征並不是一種單一的疾病,而是一係列因素導致一些嬰兒在關鍵的發育階段變得更加脆弱造成的
約翰·卡亨(John Kahan)在他的微軟公司(Microsoft Corp.)辦公室裏放著一張令人心痛的照片。照片中,卡亨、他的妻子以及三個女兒正在慶祝一個男嬰的誕生——男嬰的金紅色頭發被一頂帽子遮住了。卡亨在微軟負責客戶數據和相關分析的管理工作。
在這張照片拍攝幾小時後,卡亨接到電話:他的愛子阿倫(Aaron)已經停止了呼吸。(如今他每每複述接到電話的那一刻時都會禁不住哽咽。)幾天後,阿倫就那麼莫名其妙地離世了,他死於嬰兒猝死綜合征(SIDS)。
去年,隨著阿倫13周年祭日的臨近,卡亨決心攀登非洲最高山峰乞力馬紮羅山, 為SIDS研究募集資金並開展宣傳,以此紀念他唯一的兒子。當卡亨登山歸來時,他的團隊給他準備了一份驚喜——他們已經開始分析與美國嬰兒死亡相關的數據,並利用數據分析算法來嚐試尋找新的預防方法,以降低每年死於SIDS的嬰兒數量。到目前為止,這些數據科學家已經為該研究投入了大約500個小時的私人時間。作為卡亨的雇主,微軟公司通過旗下慈善機構Microsoft Philanthropies為他們的這項工作免費提供了雲托管和軟件工具。
如今,通過動用可以識別趨勢的分析和數據可視化工具,該團隊已經在抗擊SIDS方麵發現了富有希望的線索。這種技術通常被用於生成微軟首席執行官薩蒂亞·納德拉(Satya Nadella)的日常績效指標動態圖,或者告訴Windows團隊如何最好地為客戶服務。而在這項研究中,這種技術幫助研究人員發現了各種相關性,例如早期產前保健與較低的嬰兒死亡率相關。這項研究工作還提供了有關已知SIDS風險因素(如產婦吸煙行為)的更多信息。
“阿倫在13年前就離世了。13年來,我們並沒有真正讓情況改觀。”卡亨稱,“這基本上意味著在此期間美國大概有5.2萬名兒童因為SIDS丟了性命。他們的父母就像我們這樣,呆坐在那兒不知道這一切究竟是怎麼回事。”卡亨還在遊說美國國會維持醫療研究經費並開放醫療數據用於相關科研。
微軟正與西雅圖兒童醫院(Seattle Children’s Hospital)旗下由神經科學家尼諾·拉米雷斯(Nino Ramirez)領導的研究團隊展開合作。拉米雷斯的團隊可以進入一個專用實驗室進行各種試驗,比如測試不同因素對鼠腦組織切片的影響等。他們正在研究哪些預防途徑經得起進一步研究。前景良好的研究發現將會發表在醫學和數據科學期刊上,以期影響臨床實踐。
“雲端處理能力、可視化技術、以及大規模運用數據科學算法和以閃電般速度分析相關性的能力——放在15年前,這一切無論在哪裏都是無法做到的。即便能做到,可能也需要架設數不清的IBM大型計算機,而且分析結果輸出要等待很長時間。”卡亨說。
阿倫出生時,曾在IBM擔任高管的卡亨剛剛在微軟工作六個月。卡亨的妻子希瑟(Heather)也是IBM前高管。由於他們一家人在西雅圖幾乎舉目無親,時任微軟首席執行官史蒂夫·鮑爾默(Steve Ballmer)和首席財務官約翰·康納斯(John Connors)以及相關員工為葬禮事宜和醫療費用協調伸出了援手,並確保一家人得到安穩過渡。希瑟孕期並沒出現任何有問題的跡象,隨後的屍檢也沒給出阿倫的死亡原因。卡亨正在重新分析屍體解剖結果,以評估最新研究發現是否能夠揭示問題到底出在哪兒。
胡安·米格爾·拉維斯塔(Juan Miguel Lavista)是卡亨手下的首席數據科學家。2013年,女兒剛出生一周的拉維斯塔走進了卡亨的辦公室,並問起卡亨辦公桌上的嬰兒照片。在卡亨說出阿倫的事之前,拉維斯塔原以為照片中的這個嬰兒是卡亨的一個女兒。現在,拉維斯塔是SIDS研究項目的帶頭人。該團隊的成員還包括烏爾舒拉·查猶斯卡(Urszula Chajewska),其在職業生涯早期曾使用機器學習技術來篩查英特爾(Intel)芯片製造廠的故障設備。
通常情況下,像微軟這樣的公司一般使用這些工具來優化銷售業績,或者追蹤旗下業務的表現,但這些技術在發現醫療領域的突破方麵同樣大有用武之地。“我們在微軟的本職工作與SIDS研究工作截然不同,但從數據科學的角度來看,它們並沒有兩樣。”拉維斯塔說。
卡亨稱,美國每年有一千名兒童在出生後的第一年去世,其中六分之一死因不明。上世紀90年代初,“仰睡”(Back to Sleep)運動在美國興起,其目標就是動員家長不要讓嬰兒俯臥著睡,此舉使得嬰兒死亡人數顯著下降。但從那時起,嬰兒的不明原因死亡率一直保持著穩定。
拉米雷斯稱,SIDS並不是一種單一的疾病,而是一係列因素導致一些嬰兒在關鍵的發育階段變得更加脆弱造成的。SIDS在嬰兒出生後的第二個月中最為常見,但通常在嬰兒滿一周歲之後就不會發生了。罹患SIDS後,某種因素會導致嬰兒無法吸入足夠的空氣,而正常的孩子一般會醒來,這些嬰兒卻不會。發現這些病例中的一係列共同因素或者確定出哪些嬰兒風險最大將有助於醫生和家長改變風險因素並更密切地監測嬰兒。
傳統的SIDS研究通常隻涵蓋數百個病例。相比之下,微軟的這個研究團隊能夠挖掘美國疾病控製和預防中心(U.S. Centers for Disease Control)采集的海量數據集,並找出較小樣本中很難發現的相關性。機器學習和人工智能專家已經在治療癌症和其他疾病方麵應用這種技術。
美國疾病控製和預防中心的數據庫收集了2004年至2010年期間在美國出生的所有嬰兒的信息(分為90列),共有2900萬份記錄。這些記錄包括母親的孕期保健情況、種族、教育程度和收入等因素。當一個嬰兒死亡時,死亡信息也會被收集。微軟的數據科學家們創建了一個交互式網絡圖,以顯示與嬰兒及其父母相關的每個單一變量之間的關係以及它們與SIDS的相關性。
其中一個發現是,懷孕後前三個月獲得產前保健服務的女性所產嬰兒死於SIDS的風險低於平均水平。而若在懷孕3個月之後才開始獲得產前保健服務,這種風險將提高30%至40%。查猶斯卡稱,原因可能不光是保健服務。事實上,或許是醫生可以說服孕婦采取戒煙或服用維生素等有益的措施。但數據依然能幫助政策製定者更精確地對免費產前保健等服務展開成本影響分析。
“你可以去跟從政者說,還有多少孩子正在因為SIDS死亡。現在一切突然變得很真切。”在西雅圖兒童醫院擔任綜合腦研究中心(Center for Integrative Brain Research)主任的拉米雷斯稱,“如果你遇到一位家長,即便他們已經八十歲了,這種精神上的創傷也是永遠無法忘卻的,而我們正在談論的是數以百萬計的嬰兒。我們怎能無視這個問題呢?”
這些數據還顯示了與最低SIDS發病率相關的最佳產前保健次數。類似的,研究人員幾年前就已經知道,吸煙的孕婦會產下SIDS發病率更高的嬰兒。但微軟團隊的數據會顯示每天每吸一支煙會導致風險增加多少。戒煙可能很難,但這些數據表明即便隻能說服孕婦少吸煙也能產生積極作用。
最終,拉米雷斯希望為孕婦創建一個在線工作表,以便讓填表的醫生了解每位患者的SIDS風險因素。現在,與患者討論的風險因素要籠統得多,並且一般都基於種族和年齡等因素,不能將許多不同的信息結合起來以得出更為豐富的概率觀。
“(SIDS)研究領域並不是特別大。最初都是兒科醫生在研究,但是兒科醫生並沒有數據科學的背景。”拉米雷斯說,“他們有自己的數據庫,他們試圖開展綜合分析,但專業的數據分析並不存在。專業數據分析目前存在於遺傳學和癌症研究領域,並且已經在這些領域帶來了天翻地覆的改變。我們這裏開始的工作已經給SIDS領域帶來了一點點變化。”