使用機(jī)器學(xué)習(xí)識(shí)別無法診斷的癌癥
為癌癥患者選擇適當(dāng)治療方法的第一步是確定他們的特定癌癥類型,包括確定原發(fā)部位 - 癌癥開始的器官或身體部位。
在極少數(shù)情況下,即使進(jìn)行大量測(cè)試也無法確定癌癥的起源。雖然這些原發(fā)性不明的癌癥往往具有侵襲性,但腫瘤學(xué)家必須用非靶向療法治療它們,這些療法通常具有嚴(yán)重的毒性并導(dǎo)致低存活率。
麻省理工學(xué)院科赫綜合癌癥研究所和馬薩諸塞州總醫(yī)院(MGH)的研究人員開發(fā)的一種新的深度學(xué)習(xí)方法可以通過仔細(xì)研究與早期細(xì)胞發(fā)育和分化相關(guān)的基因表達(dá)程序來幫助對(duì)未知原發(fā)性癌癥進(jìn)行分類。
“有時(shí)你可以應(yīng)用病理學(xué)家必須提供的所有工具,但你仍然沒有答案,”科赫研究所的Charles W.(1955)和Jennifer C. Johnson臨床研究員以及MGH的病理學(xué)家Salil Garg說。“像這樣的機(jī)器學(xué)習(xí)工具可以讓腫瘤學(xué)家選擇更有效的治療方法,并為患者提供更多指導(dǎo)。
Garg是發(fā)表在Cancer Discovery上的一項(xiàng)新研究的資深作者。人工智能工具可以高度敏感和準(zhǔn)確地識(shí)別癌癥類型。Garg是該研究的資深作者,麻省理工學(xué)院博士后Enrico Moiso是主要作者。
開發(fā)中的機(jī)器學(xué)習(xí)
解析原發(fā)性未知腫瘤中基因表達(dá)的差異是機(jī)器學(xué)習(xí)需要解決的理想問題。癌細(xì)胞的外觀和行為與正常細(xì)胞完全不同,因?yàn)樗鼈兊幕虮磉_(dá)方式發(fā)生了廣泛的變化。由于單細(xì)胞分析的進(jìn)步和對(duì)細(xì)胞圖譜中不同細(xì)胞表達(dá)模式進(jìn)行編目的努力,有大量的 - 如果,在人眼看來,是壓倒性的 - 數(shù)據(jù)包含不同癌癥如何以及從哪里起源的線索。
然而,建立一個(gè)機(jī)器學(xué)習(xí)模型,利用健康和正常細(xì)胞之間的差異,以及不同種類的癌癥之間的差異,進(jìn)入診斷工具是一種平衡行為。如果一個(gè)模型太復(fù)雜,并且考慮了太多癌癥基因表達(dá)的特征,那么模型可能看起來完美地學(xué)習(xí)了訓(xùn)練數(shù)據(jù),但在遇到新數(shù)據(jù)時(shí)卻步履蹣跚。但是,通過縮小特征數(shù)量來簡(jiǎn)化模型,模型可能會(huì)錯(cuò)過導(dǎo)致癌癥類型準(zhǔn)確分類的信息。
為了在減少特征數(shù)量和仍然提取最相關(guān)信息之間取得平衡,研究小組將模型集中在癌細(xì)胞發(fā)育途徑改變的跡象上。隨著胚胎的發(fā)育和未分化的細(xì)胞特化為各種器官,多種途徑指導(dǎo)細(xì)胞如何分裂、生長(zhǎng)、改變形狀和遷移。隨著腫瘤的發(fā)展,癌細(xì)胞會(huì)失去成熟細(xì)胞的許多特殊性狀。與此同時(shí),它們開始在某些方面類似于胚胎細(xì)胞,因?yàn)樗鼈儷@得了增殖、轉(zhuǎn)化和轉(zhuǎn)移到新組織的能力。已知許多驅(qū)動(dòng)胚胎發(fā)生的基因表達(dá)程序在癌細(xì)胞中被重新激活或失調(diào)。
研究人員比較了兩個(gè)大型細(xì)胞圖譜,確定了腫瘤和胚胎細(xì)胞之間的相關(guān)性:癌癥基因組圖譜(TCGA),其中包含33種腫瘤類型的基因表達(dá)數(shù)據(jù),以及小鼠器官發(fā)生細(xì)胞圖譜(MOCA),它描述了胚胎細(xì)胞在發(fā)育和分化過程中的56個(gè)獨(dú)立軌跡。
“單細(xì)胞分辨率工具極大地改變了我們研究癌癥生物學(xué)的方式,但我們?nèi)绾问惯@場(chǎng)革命對(duì)患者產(chǎn)生影響是另一個(gè)問題,”Moiso解釋說。“隨著發(fā)育細(xì)胞圖譜的出現(xiàn),特別是那些專注于器官發(fā)生早期階段的細(xì)胞圖譜,如MOCA,我們可以將我們的工具擴(kuò)展到組織學(xué)和基因組信息之外,并為分析和識(shí)別腫瘤以及開發(fā)新療法的新方法打開大門。
然后將腫瘤和胚胎細(xì)胞中發(fā)育基因表達(dá)模式之間的相關(guān)性圖譜轉(zhuǎn)換為機(jī)器學(xué)習(xí)模型。研究人員將TCGA中腫瘤樣本的基因表達(dá)分解為對(duì)應(yīng)于發(fā)育軌跡中特定時(shí)間點(diǎn)的單個(gè)組件,并為這些組件中的每一個(gè)分配一個(gè)數(shù)學(xué)值。然后,研究人員建立了一個(gè)機(jī)器學(xué)習(xí)模型,稱為發(fā)育多層感知器(D-MLP),該模型對(duì)腫瘤的發(fā)育成分進(jìn)行評(píng)分,然后預(yù)測(cè)其起源。
腫瘤分類
經(jīng)過培訓(xùn),D-MLP被應(yīng)用于52個(gè)特別具有挑戰(zhàn)性的原發(fā)性未知癌癥的新樣本,這些癌癥無法使用可用工具進(jìn)行診斷。這些案件代表了MGH從2017年開始的四年期間最具挑戰(zhàn)性的案件。令人興奮的是,該模型將腫瘤分為四類,并產(chǎn)生了可以指導(dǎo)這些患者診斷和治療的預(yù)測(cè)和其他信息。
例如,一個(gè)樣本來自有乳腺癌病史的患者,他在腹部周圍的液體空間中表現(xiàn)出侵襲性癌癥的跡象。腫瘤學(xué)家最初找不到腫瘤腫塊,也無法使用他們當(dāng)時(shí)擁有的工具對(duì)癌細(xì)胞進(jìn)行分類。然而,D-MLP強(qiáng)烈預(yù)測(cè)卵巢癌。在患者首次就診六個(gè)月后,終于在卵巢中發(fā)現(xiàn)了一個(gè)腫塊,被證明是腫瘤的起源。
此外,該研究對(duì)腫瘤細(xì)胞和胚胎細(xì)胞的系統(tǒng)比較揭示了對(duì)特定腫瘤類型的基因表達(dá)譜的有希望的,有時(shí)甚至是令人驚訝的見解。例如,在胚胎發(fā)育的早期階段,形成一個(gè)基本的腸管,肺和其他附近的器官從前腸產(chǎn)生,大部分消化道從中腸和后腸形成。該研究表明,肺源性腫瘤細(xì)胞不僅與預(yù)期的前腸表現(xiàn)出很強(qiáng)的相似性,而且與中腸和后腸衍生的發(fā)育軌跡也表現(xiàn)出很強(qiáng)的相似性。諸如此類的發(fā)現(xiàn)表明,有朝一日,發(fā)育計(jì)劃的差異可能會(huì)被利用,就像基因突變通常用于設(shè)計(jì)個(gè)性化或有針對(duì)性的癌癥治療一樣。
雖然該研究提出了一種對(duì)腫瘤進(jìn)行分類的有力方法,但它有一些局限性。在未來的工作中,研究人員計(jì)劃通過整合其他類型的數(shù)據(jù)來提高其模型的預(yù)測(cè)能力,特別是從放射學(xué),顯微鏡和其他類型的腫瘤成像中收集的信息。
“發(fā)育基因表達(dá)僅代表可用于診斷和治療癌癥的所有因素的一小部分,”Garg說。“將放射學(xué)、病理學(xué)和基因表達(dá)信息整合在一起是癌癥患者個(gè)性化醫(yī)療的真正下一步。
免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
- 震驚!LCK 新晉天才新人登場(chǎng),對(duì)
- 明日之后新年之際,新房等待入住
- 暗區(qū)突圍 7 級(jí)頭及暗區(qū)突圍四大
- 鳴潮中菲比的突破材料如何獲取?
- 當(dāng)前 dnf 中哪個(gè)職業(yè)更易混團(tuán)?
- 原神:一款充滿樂趣與挑戰(zhàn)的手游
- 暗區(qū)突圍人機(jī)對(duì)戰(zhàn)模式:暗區(qū)突圍
- dnf 不同起源強(qiáng)化卷性價(jià)比對(duì)比
- 神谷英樹:他所打造的所有游戲皆
- DNF 締造者適合用哪款傳說裝備?
- 特朗普曾下令對(duì)‘伊斯蘭國’成員
- 魔獸世界 WLK 情人節(jié)掉落 245B