支付寶進軍大模型醫(yī)療應(yīng)用,技術(shù)一號位:我們有4個切入點
相信很多大家對支付寶進軍大模型醫(yī)療應(yīng)用,技術(shù)一號位:我們有4個切入點還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
面對來勢洶洶的大模型應(yīng)用浪潮,支付寶醫(yī)療技術(shù)一號位魏鵬這樣說道。
今年,螞蟻大舉進軍醫(yī)療,已是再明顯不過。作為螞蟻大模型應(yīng)用三大領(lǐng)域之一(其余是金融與生活),落地進展顯得尤為矚目。
模型層面,支付寶醫(yī)療大模型,在中英文醫(yī)療考試、基準測試達到甚至超過GPT-4水準。
場景方面,他們先后聯(lián)合浙江衛(wèi)健委、上海市第一人民醫(yī)院率先落地數(shù)字人應(yīng)用。今年外灘大會上,支付寶正式推出AI健康管家,吸引了多地衛(wèi)健委、三甲醫(yī)院以及??茖<业?0余個專業(yè)智能體首批入駐。
因此談大模型在醫(yī)療方面的應(yīng)用,本身在領(lǐng)域內(nèi)有十年深耕的螞蟻支付寶,一定是繞不開的玩家。
為此,我們同支付寶醫(yī)療技術(shù)一號位魏鵬,聊了聊當前大模型醫(yī)療應(yīng)用的行業(yè)發(fā)展與技術(shù)挑戰(zhàn)。
核心觀點如下:
支付寶進軍醫(yī)療AI,主要有四個切入點:醫(yī)保問答、全科醫(yī)生、同院內(nèi)服務(wù)的串聯(lián)、??浦悄荏w;
大模型參數(shù)量在百億參數(shù)就夠,重點不在數(shù)量在質(zhì)量。
在醫(yī)療領(lǐng)域,情感、道德和人文關(guān)懷是非常重要的。
AI在醫(yī)療領(lǐng)域的主要作用是提高效率,醫(yī)生的角色是不可替代的。
在不改變原意的基礎(chǔ)上,量子位做了如下整理。
對話支付寶醫(yī)療技術(shù)一號位
1、支付寶進軍醫(yī)療,主要有四個切入點量子位:現(xiàn)在大模型在醫(yī)療行業(yè)的應(yīng)用很火也很熱,螞蟻進軍醫(yī)療,怎么切入?
魏鵬:我們現(xiàn)在有四個切入點。
第一個就是醫(yī)保問答,類似于政策類咨詢。首先這跟支付寶APP契合度很高。
很多用戶都其實在問一些政策類問題,那我們從實際用戶需求出發(fā)。市面上的一些通用大模型產(chǎn)品,他們回答也比較泛泛,質(zhì)量參差不齊。
當然這部分也得益于我們同醫(yī)保局的深入合作。醫(yī)保局他們也面臨著大量的客戶咨詢需求,但很多政策解讀和相關(guān)文件并不公開或者很難檢索查找,有時還會涉及復(fù)雜圖表解讀。這些其實通過我們圖像解析、檢索增強等方面技術(shù)可以解決。
我們跟醫(yī)保局包括像一些問題生成、標注標準、評判標準等方面都建立了很深度的鏈接。目前我們在北上杭這塊準確率,基本上能做到百分之八九十,還在繼續(xù)優(yōu)化中。
第二個是全科醫(yī)生。醫(yī)療領(lǐng)域面臨一個主要問題是,AI目前還無法替代專業(yè)醫(yī)生進行診斷。因此我們更多地將AI定位為輔助醫(yī)生的角色。
比如,當你去醫(yī)院時,可能不確定應(yīng)該掛哪個科室的號,這時全科醫(yī)生就能提供幫助。你可以與全科醫(yī)生交流,提供一些基本信息,他們會根據(jù)你的癥狀給出初步判斷,可能會建議你去神經(jīng)科、消化科等特定科室。全科醫(yī)生會收集你的相關(guān)信息,并給出一些建議。對于慢性病患者,他們還會提供日常的健康建議,包括對一些健康指標的解讀。
這就是我們對全科醫(yī)生角色的定義。目前,我們的整體發(fā)展方向正是如此。
我們認為,AI在提供日常醫(yī)療科普、解讀檢驗報告和建議以及掃描藥品包裝了解藥物用途等方面具有潛力。例如,用戶可以通過拍照識別藥物,了解其治療的疾病。
此外,我們還會根據(jù)用戶的具體癥狀,提供多輪問詢服務(wù),并將信息匯總,以便轉(zhuǎn)交給專業(yè)問診平臺。通過這種方式更精準地定位用戶的需求,給到合適的醫(yī)生那里進行診斷。
這樣的流程不僅節(jié)省了時間,也提高了效率。
量子位:背后邏輯是什么?
魏鵬:當前醫(yī)療應(yīng)用這個階段,不僅僅單純是技術(shù)或產(chǎn)品問題,它其實還涉及到人文道德的層面。
從個人角度來看,患者通常更愿意面對真人醫(yī)生進行診斷;從社會層面來看,它肯定是需要人來承擔這樣的責任。因此,醫(yī)生的角色是不可替代的。
AI在醫(yī)療領(lǐng)域的主要作用是提高效率。
實際上,醫(yī)生的大部分時間都花在了詢問病人問題上,而真正用于做出決策和治療的時間相對較短。尤其是對于那些資深醫(yī)生來說,他們更愿意將時間投入到解決復(fù)雜和棘手的病例上。但醫(yī)生的時間是有限的,因此如何充分利用醫(yī)療資源是一個重要問題。在這一點上,AI可以發(fā)揮重要作用,通過處理重復(fù)性工作來提升效率。
2、大模型醫(yī)療應(yīng)用還在早期,最大挑戰(zhàn)在數(shù)據(jù)量子位:第三個切入點呢?
魏鵬:第三個是院內(nèi)服務(wù)的串聯(lián),這主要是為了提升醫(yī)療服務(wù)的效率。我們同浙江衛(wèi)健委合作打造了數(shù)字人安診兒。這也是因為浙江數(shù)字化建設(shè)較為全面。所有醫(yī)院數(shù)據(jù)都能與衛(wèi)健委打通,包括患者的報告/掛號記錄都能在系統(tǒng)中查到。
以安診兒作為樣板間,我們也繼續(xù)跟各個地方醫(yī)院進行對接合作:直接跟醫(yī)院信息系統(tǒng)(HIS)進行打通。
這需要制定一個標準,比如不同的接口標準,以及如何在醫(yī)院內(nèi)實現(xiàn)AR導(dǎo)航、查看報告記錄、解讀報告等功能。此外,還包括掛號和排號通知等服務(wù),目的是將整個就醫(yī)流程在醫(yī)院內(nèi)落地。
量子位:挑戰(zhàn)在什么地方?
魏鵬:挑戰(zhàn)之一是不同醫(yī)院的HIS系統(tǒng)開發(fā)水平參差不齊。有時候需要與醫(yī)院去做對接協(xié)調(diào)。一個HIS系統(tǒng)涉及多家研發(fā)機構(gòu)。
所以這部分的挑戰(zhàn),更多還是來源于ToB或者toH這種私有化定制的這個訴求。這并不是技術(shù)層面上的挑戰(zhàn)。
量子位:像安診兒這樣的標桿產(chǎn)品,以數(shù)字人為代表,會是這次大模型落地的技術(shù)必選項嗎?除此之外,還有必備的技術(shù)點位?
魏鵬:數(shù)字人無疑是未來發(fā)展的必然趨勢。此外,數(shù)字人的發(fā)展可能需要結(jié)合情感語音技術(shù)。我們正在努力攻克這方面的難題。在醫(yī)療領(lǐng)域,情感、道德和人文關(guān)懷是非常重要的。因此,數(shù)字人在提供服務(wù)時,不僅要技術(shù)先進,還要兼顧人文關(guān)懷,不能顯得冷漠無情。我們的目標是打造既有技術(shù)精度又有人文溫度的數(shù)字人。
量子位:第四個切入點是什么?
魏鵬:我們正在探索也是最難的一部分,就是??浦悄荏w。AI能夠像專家一樣,或者??瀑Y深醫(yī)生一樣,跟用戶去交互。
目前還只是做了個開始。因為這部分涉及一些挑戰(zhàn)。
最主要的就是數(shù)據(jù)問題。試想一下,那種非常厲害的醫(yī)生平時太忙了。整個診斷過程不會很詳細很明確地寫出來,而像那些病歷、診療記錄往往也很潦草,數(shù)據(jù)無法很好地提取和利用。
如果沒有充分的數(shù)據(jù),模型就很難學習。
我們同杭州有這方面意愿的醫(yī)生一起去探索,包括像他們愿意按照真正的質(zhì)量標準,幫我們?nèi)ジ膶懖±?住院記錄;還有像通過醫(yī)生口述的方式,共同將診斷過程通過知識圖譜(KG)的模式沉淀下來。
量子位:數(shù)據(jù)這塊,是不是整個行業(yè)應(yīng)用最大的挑戰(zhàn)?
魏鵬:嗯對,對于AI這塊,數(shù)據(jù)其實是非常大挑戰(zhàn)。
比如像政策解讀,我們技術(shù)同學花很長時間去搞懂政策文件怎么去接入。首先得搞懂里面講的是什么,然后找到合適的技術(shù)方案去做解析,比如是RAG、向量數(shù)據(jù)庫,還是知識圖譜?此外你還需要考慮如何處理數(shù)據(jù)塊,某些場景可能需要使用長文本上下文來全面解讀信息。
其次是醫(yī)療數(shù)據(jù)信息更加需要專業(yè)、權(quán)威、可信。我們之前發(fā)現(xiàn)了不少Badcase。比如有人問“懷孕幾周后可以墮胎”,模型錯誤地回答說兩周可以進行。后來我們調(diào)查發(fā)現(xiàn),其實是有醫(yī)生在網(wǎng)上回答過這個問題。
這個案例讓我們意識到,很多時候數(shù)據(jù)不準確是導(dǎo)致模型回答錯誤的主要原因。這也導(dǎo)致我們模型訓(xùn)練過程中標注成本非常高。
量子位:模型參數(shù)量,業(yè)內(nèi)有沒有形成一個共識?
魏鵬:目前我是覺得百億參數(shù),就像我們百靈現(xiàn)在65B,前面差不多72B這個量級。不過大語言模型在使用上,我個人覺得參數(shù)量不是問題,主要還是數(shù)據(jù)的質(zhì)量。這個參數(shù)量應(yīng)該能讓模型學到很多的支持。
包括現(xiàn)在業(yè)界主流也是認為現(xiàn)在公開數(shù)據(jù)基本上已經(jīng)學完了,那怎么去做?
像數(shù)據(jù)合成,核心還是解決模型的推理問題,可能在數(shù)學、代碼這部分能力會用得多一點。
但醫(yī)療這塊我覺得還處于數(shù)據(jù)的獲取/處理上,首先把公開“臟”數(shù)據(jù)清洗一下,還有看怎么能夠把院內(nèi)數(shù)據(jù)充分利用起來,充分清洗和改寫成模型能夠?qū)W習的。這些解決了之后才會考慮說怎么去合成數(shù)據(jù)。
量子位:現(xiàn)在還處于早期的階段,大概什么時候能解決這些問題。
魏鵬:國內(nèi)可能需要一段時間,我覺得至少可能兩三年。這部分領(lǐng)域還是太專了,也很深。我們愿意跟這個行業(yè)去做合作。
量子位:這個所定義的“深”指的是什么呢?
魏鵬:首先要提高識別率,我們需要大量醫(yī)生的參與,尤其是那些能夠提供真實報告數(shù)據(jù)的醫(yī)生。醫(yī)生需要對數(shù)據(jù)進行精確標注,尤其是那些高難度的病例,比如癌癥篩查的影像資料。普通的醫(yī)生可能難以識別出癌癥的細微特征,這就需要資深專家的介入。
為了積累這些數(shù)據(jù),我們需要與醫(yī)院建立長期合作關(guān)系,因為每種疾病,比如一線治療,都需要多年數(shù)據(jù)的積累以及技術(shù)上的深入解讀。
這樣看來,要實現(xiàn)真正的普惠,我們還有很長的路要走。核心問題還是數(shù)據(jù),我們需要與醫(yī)生和醫(yī)院建立更深的合作關(guān)系。
量子位:中醫(yī)方面的計劃呢?
魏鵬:這也是數(shù)據(jù)方面的問題。
因為在國內(nèi),中醫(yī)領(lǐng)域的數(shù)據(jù)相對來說是比較豐富和全面的。基于這樣的考慮,我們決定進入中醫(yī)這個領(lǐng)域,但目前我們也還是比較謹慎的。
從技術(shù)角度來看,中醫(yī)的理論體系可能相對于西醫(yī)來說沒有那么明確,很多時候它的表述也更加模糊。因此,我們還在持續(xù)探索,試圖找到更好的方法。相關(guān)的語料庫正在擴充,需求也在增加,但如何能夠真正做好,我們的技術(shù)和產(chǎn)品團隊正在考慮如何構(gòu)建評測集。
這兩方面的工作我認為還需要時間來逐步完善。正如我剛才提到的,這屬于??祁惖姆懂?。
3、創(chuàng)業(yè)公司還是有機會,只有撐死沒有餓死,主要在找切入點量子位:現(xiàn)在想進軍醫(yī)療的,你覺得他們還有機會嗎?
魏鵬:行業(yè)里有句話:只有撐死的,沒有餓死的。找到一個好的切入口就行。
量子位:你覺得什么樣特質(zhì)的公司能笑到最后?
魏鵬:第一是長期主義,第二是目標核心,要去解決問題,能夠充分跟政府、醫(yī)院、ISV在內(nèi)的整個生態(tài)建立好關(guān)系。比如像醫(yī)生端,他們是否能有動力去支持這件事情。
量子位:現(xiàn)在有沒有形成一個評測標準?
魏鵬:我們現(xiàn)在評測標準本身里面有一些維度,比如像專業(yè)性、事實性、完整性、用戶體感。
用戶體感就是用戶自己去標注,來判斷是不是像醫(yī)生來交流。
量子位:之前張亞勤提到這樣一個演變趨勢:信息智能——具身智能——生物智能,醫(yī)療有會不會經(jīng)歷這樣的趨勢?
魏鵬:整體大方向肯定是往這個趨勢走,但關(guān)鍵還是得找到一個切入點,比如怎么跟機器人去做結(jié)合,現(xiàn)在摸索更多的還是輔助手術(shù)/操作這種。
量子位:最后總結(jié)一下,區(qū)別于其他領(lǐng)域,大模型對于醫(yī)療是一個怎樣的變革?
魏鵬:首先,核心就是效率。之前也有類似的問答系統(tǒng),但它背后主要基于決策樹,回答能力有限。但現(xiàn)在有大模型之后,整個效率也會更高一點。
第二,這個場景天然就涉及到多輪交互的需求。只要解決好這個需求,就能顯著提升整體體驗。很多小問題,AI就可以幫忙處理。比如一些政策性問題,無需親自去醫(yī)保部門去咨詢。這些實際上都是效率的顯著提升。
醫(yī)療資源本就稀缺,無論是過呢還是國外,只要能提高整體效率,對這個領(lǐng)域就已經(jīng)是巨大的貢獻。
如果能在一個點上做到極致,就已經(jīng)很好了。追求全面而不求精,我認為并不符合當前的場景和需求。
—完—
以上就是關(guān)于【支付寶進軍大模型醫(yī)療應(yīng)用,技術(shù)一號位:我們有4個切入點】的相關(guān)內(nèi)容,希望對大家有幫助!