理財AI勇闖「無人區(qū)」:理解專家、成為專家
相信很多大家對理財AI勇闖「無人區(qū)」:理解專家、成為專家還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
用十年時間成為全球在線服務(wù)數(shù)億用戶的財富管理平臺后,擺在螞蟻財富面前的是一段少有人走過的路:
這5億活躍用戶第一次動動手就能接觸到各類普惠的理財產(chǎn)品,但真正理財行為成熟的僅占兩成。而放眼中國7.2億基金投資者里,每3600人才能分到1位傳統(tǒng)理財顧問來服務(wù)。投多顧少,對很多普通投資者來說,往往處于專業(yè)服務(wù)的「無人區(qū)」。俗話說,「瞎子引瞎子,二人掉深淵」,用戶側(cè)對專業(yè)服務(wù)的需求呼喚技術(shù)的進步。
2020年,「 AI 理財助理」支小寶正式對外上線,螞蟻財富希望能補足行業(yè)服務(wù)的空白。不久,螞蟻財富又投入50個人年—— 一個操作系統(tǒng)的開發(fā)成本——再造支小寶 (1.0)。
誰曾想半年后,這位剛達專業(yè)水準的 AI 助理,又率先搭上大模型的快車,從檢索式 AI(1.0)進化到生成式AI(2.0),讓4300萬普通投資者先一步擁有了自己的「私人理財專家」。
據(jù)螞蟻財富保險智能服務(wù)部總經(jīng)理陸鑫介紹,技術(shù)團隊用最新的大模型技術(shù)去實現(xiàn)支小寶這樣一個嚴謹產(chǎn)業(yè)應(yīng)用時,做了三層工作:底層是面向嚴謹應(yīng)用定制的鳳凰大模型 Finix,中間層是模仿專家思考和工作流程的 agentUniverse (下文簡稱 aU )專業(yè)智能體框架,兩者結(jié)合支撐了最上層支小寶有效的投顧服務(wù)。
一、空降熱搜,AI 的話大家聽懂了
兩個月前,金價狂飆,連帶新版支小寶空降熱搜。
「能不能買?」「要不要買?」用戶的咨詢?nèi)绯彼阌縼?。一個月內(nèi),支小寶已發(fā)出上萬次針對黃金的理性投資提醒。雖有些「爹味」,但支小寶卻真的讓很多盲目跟風(fēng)的人冷靜了一下。在熱搜話題里,有人甚至調(diào)侃,「 AI 幾句話,立省10萬?!?/p>
熱搜似乎只是一個縮影,實際上反映出大語言模型煥新理財助理后產(chǎn)生的巨大變化——提醒變得通俗易懂,讓人聽得進去。新版支小寶上線不久,用戶已超四千萬。
「黃金現(xiàn)在能買嗎?」面對這個大家普遍關(guān)心的問題,支小寶很快給出直觀全面的分析,提醒在高點保持觀望,不急于馬上增持。論據(jù)上,既綜合了平臺上幾十家基金公司的共識和分歧、利空利好因素,也考慮了個人持倉。
同樣的問題扔給通用大模型,TA 的回答更像隔靴搔癢,因為不會對我們的問題做任何假設(shè),所以,說了很多,卻又像什么都沒說。
面對「小米現(xiàn)在怎么樣」這樣有些沒頭腦、模糊的查詢,支小寶現(xiàn)在也能給出滿意的答復(fù)。
支小寶底層引入嚴謹應(yīng)用大模型 Finix 和專業(yè)智能體框架 aU 后,金融意圖識別準確率從80% 提升到95%,用戶的平均對話輪次增加了約40%。這無疑是質(zhì)的提升,技術(shù)團隊說到,面向嚴謹應(yīng)用去定制大模型技術(shù)后,讓支小寶不僅「更像一個人」還能「像一位專家」,能解決用戶的真實疑惑。
余音未落,我們瞥見支小寶首頁右上方顯示,已有600多萬人發(fā)起了提問。
二、「模仿專家」的關(guān)鍵:意圖理解的飛躍
在「模仿專家、成為專家」的「職業(yè)規(guī)劃」下,支小寶的技術(shù)發(fā)展也被分為兩層:一層,讓支小寶模仿專家去理解用戶;第二層,讓它不再被動等待問題,通過主動服務(wù)用戶,成為專家。
「模仿專家」準確把握用戶意圖,這在投顧服務(wù)中尤其具有挑戰(zhàn)性。
不同于搜索場景中明確詳細的用戶 query,理財對話中,用戶的表達往往簡單模糊,如「小米現(xiàn)在怎么樣」、「現(xiàn)在黃金怎么樣」,乃至錯字或縮寫,如「推薦一支軍工基」。前大模型時代,AI 依靠關(guān)鍵詞匹配或淺層語義分析,很容易判斷失誤,導(dǎo)致服務(wù)偏離用戶真實需求。
支小寶1.0嘗試過用上下文建模緩解這一問題,終究不過揚湯止沸。接入大語言模型后,基于大語言模型的多智能體( Agent )框架(「仿金融專家多智能體協(xié)同推理」)徹底顛覆了傳統(tǒng)從 NLU 到生成的 Pileline 。
當你問「小米現(xiàn)在怎么樣」,可以腦補這樣一段畫面,支小寶內(nèi)部的多個 Agent 將各司其職:
一個用戶服務(wù) Agent 結(jié)合服務(wù)歷史和用戶畫像,生成多個可能的意圖假設(shè),一個知識檢索 Agent 為每個假設(shè)搜集背景知識和相關(guān)資訊,一個專業(yè)顧問 Agent 從市場和投顧專業(yè)視角補充觀點和建議。
通過多專家的「協(xié)同推理」,這些來自不同 Agent 的信息聯(lián)合起來確定最可能的用戶意圖,置信度最高的意圖被認定為用戶真實意圖。最后,Agent 們協(xié)作生成最終回答。
這種基于大語言模型的多智能體框架,很容易讓人聯(lián)想到電影《頭腦特工隊》中人腦的運作。樂樂、憂憂、怒怒、厭厭和驚驚,各司其職,共同決定主人萊莉?qū)ν饨绱碳さ姆磻?yīng)。
新的解題模式與傳統(tǒng)方式有兩個明顯不同。
新框架下,系統(tǒng)不是直接做出判斷,而是沿著分歧的「枝條」、「分叉」,推理各種可能?!改憧梢岳斫獬墒且粋€地圖,或者是一棵帶有分支的樹,然后沿著分支漫游。」技術(shù)團隊打了個比方。
另外,得益于「協(xié)同推理」,即便個別 Agent 判斷失誤,其他 Agent 也可以通過協(xié)同推理予以糾正,大大提高了系統(tǒng)的魯棒性。
「我們利用專家多智能體的專業(yè)知識和推理能力,吃掉了用戶表達中不可避免的的模糊和存疑,最后,用更大規(guī)模的嚴謹應(yīng)用大模型兜住了前面所有可能的誤差?!辜夹g(shù)團隊解釋道,將對話系統(tǒng)的基礎(chǔ)從傳統(tǒng) Pipeline 升級到嚴謹應(yīng)用大模型 Finix和專業(yè)智能體框架 aU 的組合后,金融意圖識別準確率從80% 躍升至95%。
值得一提的是,在「仿金融專家多智能體協(xié)同推理」過程中,「用戶畫像」扮演著關(guān)鍵角色,這也是螞蟻財富的傳統(tǒng)強項。
大模型技術(shù)突破之前,他們就能通過分析用戶在平臺上的有效脫敏信息,包括理財行為、理財偏好等生成用戶畫像。1.0階段就沉淀了多個專業(yè)的金融模型,能在平臺噪音中提煉用戶動機,預(yù)測用戶行為。
現(xiàn)在,支小寶還有一個專門團隊負責(zé)用戶畫像生產(chǎn),借助大語言模型,用戶畫像的顆粒度和洞察深度又被提升到了新高度。
三、「成為專家的 AI 」: 不止被動解答還能主動搭話
螞蟻財富很早就涉足到理財這個垂直領(lǐng)域的自然語義理解,投入很多精力去讓機器人聽懂問題,但結(jié)果發(fā)現(xiàn)大部分人在專業(yè)嚴謹應(yīng)用中難以開口問出有效問題,所以支小寶在技術(shù)上做了一些嘗試,跳出問答界面,成為專家,去主動服務(wù),詢問用戶是否需要幫助
在支小寶問答首頁,大量用戶真實問題聚合成的「猜你想問」、「熱門問題」很接地氣,能免去小白和 i 人用戶「難以開口」的尷尬。
「幫我挑只新能源基金」,接到命令后,支小寶迅速調(diào)用各類 API,篩選出10只備選基金,提示風(fēng)險并表達對新能源行業(yè)的中性立場,也主動提供看好的消費行業(yè)基金供參考。
完成對話后,支小寶還會主動預(yù)判下一步需求,如「看看消費行業(yè)的基金」或「新能源行業(yè)的后市展望。」選擇其中一個,對話會繼續(xù)開展下去。
除了中心化的對話窗口,現(xiàn)在的支小寶還能深入到用戶理財場景中,作為專家主動和用戶交互,發(fā)起對話,引導(dǎo) TA 進入下一個服務(wù)場景。
比如,用戶查看基金持倉陣地、進入基金詳情頁時,支小寶會主動搭話,問詢是否需要解讀漲跌,或者調(diào)整持倉。如果主動引導(dǎo)「命中」用戶需求,讓他們覺得有用,用戶很可能會繼續(xù)提問,推動服務(wù)走向深入。
這種多輪溝通的能力,正是破解金融服務(wù)難題的關(guān)鍵所在。這就像我們在看病求醫(yī)問藥的時候,需要醫(yī)生和我們的多輪復(fù)雜溝通才能摸清「癥結(jié)」,「開具處方」。
技術(shù)團隊進一步解釋說,大模型壓縮了海量的世界知識和金融知識,有一定的推理能力,而專家智能體引入行業(yè)專家的 SOP 進一步強化了這種推理能力,讓支小寶學(xué)會預(yù)測用戶在享受某項服務(wù)后,下一步最可能需要什么。
過去,由于技術(shù)局限性,支小寶追求對話準確性,并不會特別關(guān)注輪次。現(xiàn)在,輪次已經(jīng)成為衡量服務(wù)深度的重要指標:用戶與新版支小寶的對話輪次提升了約40%。
四、對齊:成為「專家」的關(guān)鍵一環(huán)
在向「專家」進階的路上,AI 其實也跟人一樣努力。每個月,技術(shù)團隊都會拿出包含2000多個問題的評測數(shù)據(jù)集,讓人類專家和支小寶來一場雙盲 PK,看看后者有沒有長進。
現(xiàn)在,面對「巴菲特現(xiàn)在為什么加倍下注油氣股票 」、「巴菲特為什么減持比亞迪」、「橋水基金的投資哲學(xué)是什么」這樣的問題,支小寶也能像金融專家一樣解讀。
通用大語言模型雖然可以通過檢索增強生成( RAG )迅速捏合一個摘要式答案,卻難以像分析師一樣深入剖析問題。
回答「巴菲特現(xiàn)在為什么加倍下注油氣股票 」。
讓支小寶向?qū)<覍R,正是這支隊伍的核心工作,其中一個極其重要的工作就是「對齊訓(xùn)練」,這也是 ChatGPT 獲得成功的關(guān)鍵。
不過,「理財專家」定位使得支小寶的對齊水位需要比 OpenAI 的「3H 」( Helpful、Harmless、Honest )更高,面向理財這樣的嚴謹應(yīng)用,支小寶技術(shù)團隊「由內(nèi)到外」向?qū)<覍R,對齊標準從3H 升級為嚴謹性和專業(yè)性,整體工作也可謂細致入微。
首先,對齊工作背靠兩個核心訓(xùn)練環(huán)節(jié)——監(jiān)督微調(diào)( SFT )和基于人類反饋的強化學(xué)習(xí)( RLHF ),前者明確指示模型應(yīng)該完成哪些任務(wù),后者教導(dǎo)模型如何以人類偏好的標準完成這些任務(wù)。
為了讓支小寶能嚴謹?shù)赝瓿扇蝿?wù),大模型底座就需要努力克服眾所周知的模型幻覺。類似于駕照訓(xùn)練讓司機對齊了安全駕駛的標準,支小寶底層模型也對齊了嚴謹?shù)臉藴?。在監(jiān)督微調(diào)( SFT )階段,他們從數(shù)據(jù)、量綱、實體、關(guān)系、事實、觀點和計算等維度拆解「嚴謹」,為不同任務(wù)場景準備相應(yīng)的數(shù)據(jù)集,教會支小寶如何嚴謹?shù)靥幚頂?shù)字、觀點、實體,保障它們的可信可溯源。
在基于人類反饋的強化學(xué)習(xí)( RLHF )環(huán)節(jié),他們進一步訓(xùn)練大模型對嚴謹性和專業(yè)性的自發(fā)遵從,這也是讓大語言模型勝任嚴謹應(yīng)用的關(guān)鍵。新版支小寶會在缺乏信息時「認慫」,避免強答;會像人類專家一樣,提供專業(yè)分析的同時,識別和安撫用戶情緒,這都歸功于這個訓(xùn)練環(huán)節(jié)為系統(tǒng)對齊了專家的回答標準。
接受完監(jiān)督微調(diào)( SFT )和基于人類反饋的強化學(xué)習(xí)( RLHF )「調(diào)教」的大語言模型,就像手握駕照的司機,上路總歸有危險,還需要安全的汽車和交通系統(tǒng)。為此,技術(shù)團隊也安排了數(shù)據(jù)鏈路、智能體反思、安全圍欄、攻防巡檢等系統(tǒng)性措施進一步保障支小寶的嚴謹性。
不過,知易行難,最大的挑戰(zhàn)其實是構(gòu)建專家水平的高質(zhì)量指令集所需要的定力和資源——當你為大語言模型寫好劇本后,接下來就要準備相應(yīng)的指令數(shù)據(jù)(和銀子)。
技術(shù)團隊花了大量心思構(gòu)建金融能力指令集。他們借鑒了布魯姆模型,這是教育心理學(xué)中一種廣受認可的能力評估方法,提供了清晰的認知發(fā)展路徑,將能力培養(yǎng)劃分為記憶、理解、應(yīng)用、分析、評價、創(chuàng)造等遞進階段,為訓(xùn)練過程提供了明確主線。
通過將這六個認知層次與不同業(yè)務(wù)場景交叉對應(yīng),技術(shù)團隊詳細定義了支小寶在每個場景和認知階段應(yīng)掌握的具體技能,并據(jù)此設(shè)計訓(xùn)練任務(wù),最終形成了一套專業(yè)的金融能力培養(yǎng)方案。
在數(shù)據(jù)標注上,螞蟻財富也投入了大量精力和資源。支小寶底層的嚴謹應(yīng)用大模型面向?qū)<疫M行對齊訓(xùn)練,這意味著只有專家水準的人才能滿足標注工作的嚴謹性和專業(yè)性,他們不僅為此組建了一個具有專業(yè)標注能力的團隊,還維護著一支具有金融和算法復(fù)合能力的技術(shù)隊伍,專門針對高難度問題構(gòu)建精準的金融語料和數(shù)據(jù),確保支小寶能夠在復(fù)雜的金融領(lǐng)域游刃有余。
五、接力:「原生大模型技術(shù)人員」
時間倒轉(zhuǎn)2018年,支小寶的「前身」——內(nèi)部代號為「安娜」的智能理財 AI 項目啟動,恰逢 OpenAI 的 ChatGPT 前身 GPT-1.0開始研發(fā)。當時,AI 的真正威力尚未完全釋放。
支小寶的初期團隊匯聚了 NLP、CV 和工程技術(shù)等多領(lǐng)域的精英。他們懷著探險家的熱情出發(fā),卻很快發(fā)現(xiàn)前路崎嶇難行。每一步都像在荒野中開辟道路,即便親眼目睹大語言模型帶來的巨大突破,仍難以完全信任它的潛力。過往積累的知識和技能仿佛一夜貶值,也徒增一些不安與壓力。
如今,這個技術(shù)團隊也不斷擴充著新鮮血液,一群「原生大模型技術(shù)人員」正成為團隊中堅力量。這些人能丟掉之前的技術(shù)包袱,天生以大模型思維解決問題,仿佛從不擔心技術(shù)的邊界,在不知不覺中拓展了曾經(jīng)的技術(shù)邊界。
技術(shù)更迭如同潮水,一浪高過一浪。就像多年前支付寶的掃碼支付,當那聲清脆的「滴」響起,曾經(jīng)令人驚嘆的技術(shù)復(fù)雜性瞬間歸于平靜??傆幸惶?,轟轟烈烈的大模型還有它的原生技術(shù)人員,也將沉淀為后代生活中一個平凡的 Token。
但更多的普通人,已經(jīng)就此獲益。
以上就是關(guān)于【理財AI勇闖「無人區(qū)」:理解專家、成為專家】的相關(guān)內(nèi)容,希望對大家有幫助!