AI“大姨”現(xiàn)場刁難智能客服!直擊一群AI打PK賽,真能落地的那種
相信很多大家對AI“大姨”現(xiàn)場刁難智能客服!直擊一群AI打PK賽,真能落地的那種還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
兩個(gè)AI現(xiàn)場攻防,翻車了人類就在旁邊“蛐蛐”。
現(xiàn)在的AI比賽真是越來越因吹斯汀了。
這不,一個(gè)拿著“花開富貴”大姨人設(shè)的Agent直接甩了個(gè)鏈接,對面的AI客服就開始大段大段冗長回復(fù),幾個(gè)回合都是如此。
圍觀人類一點(diǎn)兒都不留情面,馬上銳評:
遇到妙語連珠的,人類也紛紛爆燈。
還是這個(gè)“阿姨”人設(shè)的Agent,她打了個(gè)錯(cuò)別字,問AI“九空”是什么意思。
對方AI客服立馬發(fā)現(xiàn)它想說的其實(shí)是“九腔”,還給出了正確的解釋。
在云棲大會(huì)現(xiàn)場,我們圍觀了這樣一場精彩有趣的AI比賽。
比賽規(guī)則是讓8家企業(yè)在一周內(nèi)構(gòu)建智能客服,不僅要現(xiàn)場展示效果和技術(shù)方案,還要接受各種人設(shè)Agent的情景考驗(yàn)。都是難以應(yīng)對的那種,要么是不會(huì)網(wǎng)購且愛打錯(cuò)別字的阿姨,要么是正在氣頭上的都市麗人。
結(jié)果就上演了剛剛那精彩一幕。
更有意思的是,還有選手找公司財(cái)務(wù)搞定了這一項(xiàng)目。
要知道,他的對手都是業(yè)內(nèi)頗有來頭的企業(yè),不乏已經(jīng)上市的那種。
所以,這到底是個(gè)啥比賽啊?
1周搞定“說人話”AI客服
如上提到的比賽,是業(yè)界首個(gè)企業(yè)級AI應(yīng)用開發(fā)挑戰(zhàn)賽:百煉杯“智能好客服”PK賽。
為啥能稱得上企業(yè)級?
不僅參賽選手都是企業(yè),而且比賽重要的參考維度是能否實(shí)際落地。
比賽為選手提供百煉開發(fā)平臺,可使用通義千問系列模型作為底層模型,平臺提供Prompt優(yōu)化工具、RAG、Agent構(gòu)建等能力,支持低代碼、高代碼等不同需求開發(fā)。
對參賽作品的要求很簡潔,就是打造一個(gè)滿足現(xiàn)在用戶需求的智能客服。能理解用戶問題、結(jié)合上下文給出解決辦法,并且有情商、說人話、能面對各種復(fù)雜情景。
而且上手門檻很低。
比如參賽選手云蝠智能,他們的主打業(yè)務(wù)是電話客服,在文本客服方面的積累不多。這次參賽,他們壓根沒讓工程師參與,而是找公司財(cái)務(wù)完成了整個(gè)業(yè)務(wù)流程的交付。
之所以這樣做,是因?yàn)樵乞鹬悄苷J(rèn)為智能客服產(chǎn)品的最終用戶很多都是小型或中小型企業(yè),他們對于無代碼、低代碼開發(fā)的需求很高。他們這么做也是進(jìn)一步驗(yàn)證,如今的大模型平臺已經(jīng)可以提供零門檻的智能客服構(gòu)建流程。
另一位參賽選手合力億捷也提到,職場新人通過1-2天的學(xué)習(xí),就能在百煉平臺上自己開發(fā)Agent。
比如打造一個(gè)電商客服,具體技術(shù)方案如下:
用戶輸入問題后,通義千問會(huì)先進(jìn)行意圖理解和分類,然后系統(tǒng)將提取關(guān)鍵數(shù)據(jù)并調(diào)用API,再利用RAG技術(shù)進(jìn)行知識檢索,最后把經(jīng)過封裝的Prompt提交給通義千問大模型,最后生成答案給客戶。
根據(jù)比賽數(shù)據(jù)的多場景特性,拆解了應(yīng)答服務(wù)流程。按照場景特征將意圖與知識細(xì)分為8大類和若干小類。
合力億捷介紹,開發(fā)過程中也遇到了一些問題。一開始完全依賴百煉平臺的輸出能力進(jìn)行意圖分類,但是在上下文意圖不連貫的時(shí)候,就會(huì)出現(xiàn)分類和輸出不穩(wěn)定的情況。為此選手對提示詞進(jìn)行優(yōu)化,強(qiáng)調(diào)關(guān)鍵特征和要求。
經(jīng)過三次迭代后,回復(fù)準(zhǔn)確率從最初的80%提升到了96%。
要知道,這解決了目前智能客服行業(yè)面臨的很多挑戰(zhàn)。
智能客服作為一個(gè)普及度非常高的AI應(yīng)用,大眾滿意度卻不盡如人意。大家都調(diào)侃,AI客服的作用就是為了“轉(zhuǎn)人工”。
這一方面是因?yàn)閭鹘y(tǒng)AI客服的底層技術(shù)不夠先進(jìn),導(dǎo)致回復(fù)比較機(jī)械化,不能滿足人類真正的服務(wù)需求,也缺乏情感價(jià)值。
參賽選手亞信科技解釋,用戶對于智能客服的期待是“像真人交談一樣自然”。這背后需要智能客服可以理解用戶意圖、懂得結(jié)合上下文語境、提供個(gè)性化的建議。
隨著大模型趨勢到來,底層技術(shù)瓶頸得到進(jìn)一步改善。
但是企業(yè)用上大模型開發(fā)智能客服,還存在諸多門檻。
合力億捷提到,通用模型需要進(jìn)一步微調(diào)才能滿足個(gè)性化需求。但實(shí)際情況中,往往是懂開發(fā)的人不懂業(yè)務(wù),懂業(yè)務(wù)的人不懂開發(fā)。
而且本身智能客服給大模型提出的要求也很高。需要精準(zhǔn)理解用戶意圖、強(qiáng)大的上下文能力、可以調(diào)用工具等。模型生成的內(nèi)容也要與時(shí)俱進(jìn),數(shù)據(jù)庫更新不及時(shí)也會(huì)導(dǎo)致理解和識別準(zhǔn)確率降低。
這意味著企業(yè)自己做模型開發(fā)的門檻和成本都很高。加之智能客服領(lǐng)域本身競爭激烈、收益比較低,企業(yè)面臨的智能化升級壓力很大。
不過隨著大模型開發(fā)平臺不斷升級完善,云廠商們?yōu)槠髽I(yè)們提供了更便捷的工具。
這次PK賽中,選手們就是完全利用百煉平臺進(jìn)行開發(fā)。
其中一些功能都給選手留下了深刻印象。比如亞信科技和合力億捷都提到了工作流應(yīng)用。它無需通過構(gòu)建智能體實(shí)現(xiàn)工作流,能讓應(yīng)用調(diào)試、修改Prompt等都變得更方便,而且執(zhí)行效率穩(wěn)定,性能可靠。
本次比賽的主題智能客服,只是百煉平臺典型應(yīng)用場景之一。
阿里云披露,今年5-7月,百煉服務(wù)客戶數(shù)量快速從9萬增長至23萬,漲幅超150%。
AI應(yīng)用開發(fā),拖拉拽即可
去年10月,阿里云發(fā)布了百煉大模型平臺,主要功能就是讓開發(fā)者通過簡單的拖拉拽,在5分鐘開發(fā)一款大模型應(yīng)用,幾小時(shí)煉出一個(gè)專屬模型。
今年5月,百煉升級為2.0版本,成為阿里云承載云+AI能力的重要平臺,提供一站式、全托管的大模型定制與應(yīng)用服務(wù)。
它可分為計(jì)算層、模型層和應(yīng)用層。
底層計(jì)算依托于強(qiáng)大阿里云基礎(chǔ)設(shè)施。
剛剛結(jié)束的云棲大會(huì)上,阿里云CTO周靖人宣布,阿里云全面投入升級AI大基建,AI驅(qū)動(dòng)的全系產(chǎn)品家族完成升級。包括磐久AI服務(wù)器、HPN7.0高性能網(wǎng)絡(luò)架構(gòu)等,都為AI訓(xùn)練、推理、部署和應(yīng)用更高效而來。
模型層提供通義系列、行業(yè)大模型以及豐富第三方模型(如Llama、百川等)。
支持多模態(tài)模型服務(wù),提供靈活高效易用的模型API與SDK。提供文本生成、圖片生成、視覺理解、視頻生成、語音識別以及語音合成能力。
最新進(jìn)展中,通義方面發(fā)布了最強(qiáng)開源模型Qwen2.5系列,同時(shí)上架語言、音頻、視覺等100多款全模態(tài)模型。
應(yīng)用層方面,百煉提供開放的Agent構(gòu)建框架,支持靈活的應(yīng)用編排能力。構(gòu)建了豐富的模型應(yīng)用生態(tài),比如智能座艙、智能客服、智能零售、AI數(shù)字人等。
主要支持的開發(fā)范式有三種:
提示詞優(yōu)化:提示詞擴(kuò)寫、案例優(yōu)化、反饋優(yōu)化。
檢索增強(qiáng)生成(RAG):企業(yè)級知識管理、靈活優(yōu)化各組件效果。
模型微調(diào):多模態(tài)模型微調(diào)、多類型微調(diào)方式。
并且提供多款開箱即用的AI原生應(yīng)用。
比如智能客服大模型應(yīng)用曉蜜、多模態(tài)內(nèi)容創(chuàng)作工具全妙、AI原生智能數(shù)據(jù)分析產(chǎn)品析言GBI等。
而且基于阿里云深厚的云計(jì)算基礎(chǔ),百煉可以提供更加高效、穩(wěn)定、極具性價(jià)比的大模型服務(wù)。
沒有AI的應(yīng)用沒有競爭力
最后,回到這場PK賽本身,為啥阿里云想要辦一場智能客服挑戰(zhàn)賽?
其實(shí),早在大模型掀起技術(shù)風(fēng)暴之前,AI客服就是NLP相關(guān)研究的應(yīng)用重點(diǎn):
一方面,客服是信息時(shí)代每個(gè)企業(yè)、每個(gè)人都會(huì)接觸到、有需求的場景。另一方面,這種大量、高重復(fù)度場景,恰恰是AI技術(shù)能最快見效的應(yīng)用領(lǐng)域。
而當(dāng)大模型完全改變了人機(jī)交互的模式和對話生成的質(zhì)量,AI客服也自然而然迎來質(zhì)變時(shí)刻,成為大模型應(yīng)用落地最好的試驗(yàn)田之一。
IDC報(bào)告《中國智能客服市場份額,2023:新舊交替,增長可期》中顯示,2023年智能客服解決方案整體市場規(guī)模達(dá)到了30.8億人民幣,較2022年增長了近36.9%,足見其發(fā)展?jié)摿Α?/p>
但在“駭客松”這種以賽代練文化盛行的科技領(lǐng)域,阿里云百煉杯之前,卻未見真正定位“企業(yè)級”、強(qiáng)調(diào)“落地可用”的AI應(yīng)用開發(fā)挑戰(zhàn)賽。
其中挑戰(zhàn)亦不難理解:
要拉來這么多具有代表性的企業(yè)過過手見見技術(shù)真章,主辦方本身需要具備行業(yè)號召力,并且能夠提供客觀、可靠的基礎(chǔ)平臺。
阿里云作為國內(nèi)云廠商中的頭把交椅,本身過硬的云計(jì)算基礎(chǔ)能力和行業(yè)影響力自不必說。
現(xiàn)在,依托百煉平臺,阿里云進(jìn)一步提供了大模型企業(yè)級應(yīng)用開發(fā)的一站式服務(wù)能力:以模型為中心,依據(jù)大模型真實(shí)業(yè)務(wù)落地需要,提供模型、應(yīng)用、數(shù)據(jù)、運(yùn)營四大核心工具鏈,幫助企業(yè)實(shí)現(xiàn)“小步快跑的業(yè)務(wù)驗(yàn)證”和“規(guī)模業(yè)務(wù)的迭代優(yōu)化”。
從本次挑戰(zhàn)賽中也可以看出,大量難以處理的情緒化、復(fù)雜上下文、邏輯推導(dǎo)、業(yè)務(wù)引導(dǎo)、體系計(jì)算等問題,企業(yè)都能通過結(jié)合模型和百煉平臺的能力解決。
對于參賽企業(yè)而言,參與這樣的比賽,能積累大模型應(yīng)用的落地經(jīng)驗(yàn),驗(yàn)證自身對于業(yè)務(wù)場景與大模型結(jié)合的理解。
而對于阿里云來說,在為參賽企業(yè)提供支持的同時(shí),也進(jìn)一步加深了對實(shí)際業(yè)務(wù)場景的了解,為通過技術(shù)發(fā)展驅(qū)動(dòng)大模型應(yīng)用落地積攢實(shí)踐經(jīng)歷。
事實(shí)上,從“智能客服”一隅,亦可再次窺見大模型時(shí)代各行各業(yè)面臨的一個(gè)新機(jī)遇和新挑戰(zhàn):
隨著技術(shù)變革程度的不斷加深,在未來,沒有AI的應(yīng)用就沒有競爭力。
而這一課題所涉及的,不僅是應(yīng)用層面的創(chuàng)意和技術(shù)創(chuàng)新,更是基礎(chǔ)設(shè)施的迭代升級。
云時(shí)代里走在前列的阿里云,這一次又踏在了潮頭。
以上就是關(guān)于【AI“大姨”現(xiàn)場刁難智能客服!直擊一群AI打PK賽,真能落地的那種】的相關(guān)內(nèi)容,希望對大家有幫助!