全球247億美元豪賭GenAI,瘋狂入局AI成高風(fēng)險(xiǎn)博弈?
相信很多大家對(duì)全球247億美元豪賭GenAI,瘋狂入局AI成高風(fēng)險(xiǎn)博弈?還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
【新智元導(dǎo)讀】面對(duì)GenAI的技術(shù)浪潮,很多人都會(huì)在不斷迭代更新的技術(shù)中逐漸迷失。站在潮頭的Sapphire、Emergence、Menlo等風(fēng)投公司,又會(huì)如何看待這場(chǎng)AI變局的現(xiàn)狀與走向?
根據(jù)Sapphire Ventures的數(shù)據(jù),GenAI領(lǐng)域從2022年到2023年迎來了爆發(fā)式的增長,全球范圍(不含中國)的風(fēng)投資金總量從76億美元陡增到247億。
從今年第一季度的數(shù)據(jù)來看,2023年的市場(chǎng)熱度很有可能延續(xù)下去。
根據(jù)咨詢公司Quid的統(tǒng)計(jì)數(shù)據(jù),最能吸引AI方向投資的三個(gè)細(xì)分領(lǐng)域分別是「AI基礎(chǔ)設(shè)施、研究和治理」、「自然語言處理」和「數(shù)據(jù)管理」。
投資大量涌入,帶來的直觀結(jié)果就是初創(chuàng)公司如雨后春筍般涌現(xiàn)。從美國、中國到英國、以色列,都成為了AI創(chuàng)新的重要源頭。
在投資大潮的催化下,GenAI領(lǐng)域的技術(shù)更新也達(dá)到了前所未有的迅速。
今年1月,Menlo Ventures對(duì)于現(xiàn)代AI技術(shù)棧的定義還是一個(gè)簡潔的四層框架,從算力和基礎(chǔ)模型開始,到數(shù)據(jù)、模型部署,以及最頂層的模型可觀測(cè)性。
而短短幾個(gè)月后的5月底,這個(gè)框架就已經(jīng)迅速過時(shí),取而代之的是Sapphire Ventures發(fā)布的包含200多個(gè)公司、多個(gè)領(lǐng)域交織在一起的復(fù)雜技術(shù)網(wǎng)絡(luò)。
而且,GenAI的發(fā)展路徑不是單純技術(shù)創(chuàng)新問題,商業(yè)戰(zhàn)略、金融、教育、政策等各方面的影響交織在一起。
數(shù)據(jù)隱私問題引起了越來越多立法者的關(guān)注,AI法規(guī)即將出臺(tái)的壓力揮之不去;AI行業(yè)高薪的背后是持續(xù)的人才短缺,迫使科技公司不得不在內(nèi)部開發(fā)和外包工作間取得平衡。
更為重要的是,控制成本、創(chuàng)造盈利的壓力,會(huì)與技術(shù)創(chuàng)新的各種原動(dòng)力相違背。持續(xù)不斷的開源和閉源之爭就是最典型的例子。
相比傳統(tǒng)的軟件公司,推理和訓(xùn)練的算力支出會(huì)耗費(fèi)更多資金。然而,根據(jù)Emergence Capital的統(tǒng)計(jì),只有58%的GenAI公司選擇通過產(chǎn)品營利,這就又疊加了一重商業(yè)風(fēng)險(xiǎn)。
「亂花漸欲迷人眼」,投資熱潮、一夜暴富的表象下,入局GenAI實(shí)質(zhì)是一場(chǎng)高風(fēng)險(xiǎn)的技術(shù)博弈。在這個(gè)瞬息萬變的場(chǎng)域中,今天最先進(jìn)的解決方案,很可能在一夜之間就被新的技術(shù)突破取代。
要面對(duì)GenAI迷宮中的這一切,也許答案只有一個(gè)——適應(yīng)性。
無論是科研、技術(shù)領(lǐng)域的從業(yè)者,還是公司中的決策者,都需要不斷調(diào)整目標(biāo)和愿景,與這個(gè)千變?nèi)f化的環(huán)境一同演進(jìn),才能創(chuàng)造出實(shí)際的價(jià)值。
數(shù)據(jù)的「量」和「質(zhì)」
如果一直上溯到深度學(xué)習(xí)方興未艾時(shí)的ImageNet,可以發(fā)現(xiàn),數(shù)據(jù)始終是AI的核心問題之一。
隨著近年來GenAI和LLM的興起,數(shù)據(jù)也和算力一樣,成為AI基礎(chǔ)設(shè)施的一部分,也是需要盡力發(fā)掘的稀缺資源。
Epoch AI曾經(jīng)預(yù)言,LLM到2028年將耗盡互聯(lián)網(wǎng)上所有的高質(zhì)量文本數(shù)據(jù),阻礙Scaling Law的「數(shù)據(jù)墻」似乎就在眼前。
面對(duì)數(shù)據(jù)短缺的挑戰(zhàn),從GenAI自身給出的解決方案——合成數(shù)據(jù),似乎是一條仍不明朗但頗有前景的道路。
早期研究曾指出,隨著合成數(shù)據(jù)比例的增加,迭代出的連續(xù)幾代模型的質(zhì)量和多樣性都會(huì)逐漸下降。
但另一方面,較少比例的合成數(shù)據(jù)和最新的現(xiàn)實(shí)數(shù)據(jù)混合后訓(xùn)練的模型,如Google最近發(fā)布的Gemma2,卻能表現(xiàn)出顯著的性能提升。
Epoch AI的創(chuàng)始人也曾表示,雖然我們能看到「數(shù)據(jù)耗盡」的前景,但目前還沒有感到恐慌的理由。合成數(shù)據(jù)、
多模態(tài)和遷移學(xué)習(xí)等方法都有望突破「數(shù)據(jù)墻」。
除了數(shù)據(jù)量的焦慮,數(shù)據(jù)質(zhì)量和數(shù)據(jù)治理也已經(jīng)成為關(guān)注的焦點(diǎn)。
上個(gè)月HuggingFace發(fā)布15萬億token的FineWeb數(shù)據(jù)集,就著重強(qiáng)調(diào)了數(shù)據(jù)質(zhì)量的重要性。
微軟Phi-3小模型的技術(shù)報(bào)告中,也提及了一種「數(shù)據(jù)換參數(shù)」的策略。
對(duì)于企業(yè)和產(chǎn)品而言,數(shù)據(jù)質(zhì)量的重要維度也包括語義層和數(shù)據(jù)結(jié)構(gòu)(data fabrics),有望增強(qiáng)AI系統(tǒng)有效理解、使用企業(yè)數(shù)據(jù)的能力,從而帶來創(chuàng)新的功能和用例。
初創(chuàng)公司Illumex就開發(fā)了一種名為「語義數(shù)據(jù)結(jié)構(gòu)」(semantic data fabric)的技術(shù),他們的CEO解釋道,「data fabric有一種自動(dòng)創(chuàng)建出來的紋理,而非預(yù)先定義好的」,可以促進(jìn)更加動(dòng)態(tài)、上下文感知的數(shù)據(jù)交互。
此外,AI監(jiān)管和科技公司也把目光投向了數(shù)據(jù)治理領(lǐng)域——確保數(shù)據(jù)的使用符合倫理、安全并遵守法規(guī)。
DataBricks已經(jīng)將數(shù)據(jù)治理納入其平臺(tái)的核心,被描述為「一個(gè)連續(xù)的治理體系,從數(shù)據(jù)攝取一直到GenAI的提示和響應(yīng)」。
同時(shí),Red Hat副總裁Steven Huels預(yù)測(cè),我們會(huì)看到數(shù)據(jù)治理方面的大力推動(dòng),尤其是隨著AI系統(tǒng)越來越多地影響關(guān)鍵業(yè)務(wù)決策。
端到端vs.專用解決方案
GenAI這種新興事物顯得有些復(fù)雜,有些難以理解,因此許多企業(yè)都都傾向于采用全面的端到端解決方案,這反映了決策者們希望簡化AI基礎(chǔ)設(shè)施、精簡運(yùn)營的愿望。
財(cái)務(wù)軟件公司Intuit決定在原有的龐大生態(tài)系統(tǒng)中整個(gè)GenAI時(shí),他們面臨一個(gè)艱難抉擇——要讓數(shù)千名開發(fā)人員在現(xiàn)有平臺(tái)的基礎(chǔ)上構(gòu)建AI嗎?
最后,Intuit選擇了一條更有雄心的道路:從頭開始,創(chuàng)建一個(gè)全面的生成式AI操作系統(tǒng)GenOS。
公司首席數(shù)據(jù)官Ashok Srivastava這樣解釋這個(gè)決定:為了加速創(chuàng)新并保持一致性,「我們將額外構(gòu)建一層來抽象掉平臺(tái)的復(fù)雜性」。相比之下,讓各個(gè)團(tuán)隊(duì)構(gòu)建定制解決方案,會(huì)導(dǎo)致「高復(fù)雜性、低速和技術(shù)債務(wù)」。
同樣,Databricks最近對(duì)平臺(tái)功能進(jìn)行了擴(kuò)展,新推出的Model Serving和Feature Serving工具,能簡化數(shù)據(jù)科學(xué)家部署模型的流程,代表了他們正在推進(jìn)更集成的AI基礎(chǔ)設(shè)施,提供更全面的解決方案。
《Marvelous MLOps》一書的作者M(jìn)aria Vechtomova指出,整個(gè)行業(yè)都需要這樣的簡化:「機(jī)器學(xué)習(xí)團(tuán)隊(duì)?wèi)?yīng)該努力簡化架構(gòu),并盡量減少使用的工具數(shù)量?!?/p>
推動(dòng)端到端解決方案標(biāo)志著GenAI領(lǐng)域的成熟。企業(yè)不再滿足于零散方法的拼接,而是希望高效地?cái)U(kuò)展其AI項(xiàng)目。
與此同時(shí),我們還見證了一個(gè)有趣的現(xiàn)象——盡管端到端平臺(tái)正在崛起,但專用解決方案仍在不斷涌現(xiàn),
通常來說,它們是對(duì)通用方案的補(bǔ)充,負(fù)責(zé)應(yīng)對(duì)可能被忽略的復(fù)雜挑戰(zhàn),或者增強(qiáng)某些特定的功能。
專用解決方案的不斷涌現(xiàn)表明,在解決特定AI挑戰(zhàn)方面的創(chuàng)新仍然充滿活力。
即使市場(chǎng)正在圍繞少數(shù)幾個(gè)主要平臺(tái)進(jìn)行整合,這一趨勢(shì)仍在持續(xù)。
對(duì)于IT決策者來說,任務(wù)很明確:仔細(xì)評(píng)估專用工具在某些方面是否能提供比更通用解決方案更顯著的優(yōu)勢(shì)。
開源和專有的平衡
在GenAI領(lǐng)域,開源和專有解決方案之間有非常活躍的相互作用。
曾經(jīng)以開源Linux聞名的Red Hat公司最近宣布進(jìn)入Gen AI領(lǐng)域,他們開發(fā)的產(chǎn)品Red Hat Enterprise Linux (RHEL) AI旨在讓更多人能夠使用LLM,并堅(jiān)守自己對(duì)開源準(zhǔn)則的承諾。
然而,開源解決方案通常需要公司內(nèi)部的大量專業(yè)人才,才能有效實(shí)施并維護(hù)。對(duì)于面臨人才短缺或希望快速行動(dòng)的組織來說,這可能是一個(gè)挑戰(zhàn)。
另一方面,專有解決方案通常提供更集成和支持的體驗(yàn)。比如Databricks在支持開源模型的同時(shí),也專注于圍繞其專有平臺(tái)創(chuàng)建一個(gè)連貫的技術(shù)生態(tài),能夠?yàn)榭蛻艏珊凸芾砀鞣NAI模型。
理想的開源和專有解決方案平衡將取決于組織的具體需求、資源和風(fēng)險(xiǎn)承受能力。隨著AI領(lǐng)域的發(fā)展,有效集成和管理這兩種類型的解決方案,可能成為一個(gè)關(guān)鍵的競爭優(yōu)勢(shì)。
平衡好開源和專有方案的「潛力股」也許是最近崛起的AI新星Mistral。
Mistral推出的開源模型既在社區(qū)引起了廣泛影響,得到全球開發(fā)者的支持助力,同時(shí)也吸引到了潛在客戶,可供任何人檢查、定制的代碼加強(qiáng)了企業(yè)用戶對(duì)技術(shù)的信任。
創(chuàng)始人Arthur Mensch曾表示,「在構(gòu)建商業(yè)模式和堅(jiān)持我們的開源價(jià)值觀之間找到一個(gè)平衡點(diǎn)是非常微妙的。我們希望創(chuàng)造新的事物、新的架構(gòu),但是還想向我們的客戶提供一些額外的產(chǎn)品和服務(wù)。」
與現(xiàn)有系統(tǒng)的集成
在企業(yè)轉(zhuǎn)向GenAI的過程中,一個(gè)關(guān)鍵挑戰(zhàn)是如何將新功能集成到現(xiàn)有的業(yè)務(wù)流程與決策框架中,建立兩者之間的良好銜接和互動(dòng)。
這是AI系統(tǒng)落地的最后一步,也直接決定著AI方面的投資能否轉(zhuǎn)化為實(shí)在的商業(yè)價(jià)值。
令人驚訝的是,與頂層的產(chǎn)品功能相比,成功的集成反而更依賴于底層系統(tǒng)。實(shí)時(shí)系統(tǒng)、流處理、批量處理,這些「骨架」是構(gòu)建AI能力不可忽視的基礎(chǔ)。
對(duì)于許多組織來說,數(shù)據(jù)方面也存在挑戰(zhàn),難點(diǎn)在于AI系統(tǒng)需要連接多樣化的,且常常孤立存在的數(shù)據(jù)源。初創(chuàng)公司Illumex就開發(fā)了一種方案,允許企業(yè)利用現(xiàn)有的數(shù)據(jù)資產(chǎn),而無需進(jìn)行大規(guī)模的重組。
安全集成是另一個(gè)關(guān)鍵因素。由于AI系統(tǒng)通常處理敏感數(shù)據(jù)并做出重要決策,它們必須被納入現(xiàn)有的安全框架,并符合組織政策和監(jiān)管要求。
提示工程仍然是關(guān)鍵技能
精確且格式良好的提示,結(jié)合相關(guān)的上下文數(shù)據(jù),能夠顯著影響模型輸出的質(zhì)量,這種效果常常令開發(fā)者和用戶感到驚訝。
盡管最初對(duì)提示的長期前景以及提示工程師這一新興職業(yè)存在懷疑,許多公司仍在積極尋找并高薪聘請(qǐng)具備提示工程技能的員工。
我們相信這一趨勢(shì)將持續(xù),并將得到新興服務(wù)的進(jìn)一步支持,這些服務(wù)可以幫助公司制作、存儲(chǔ)、測(cè)試、管理和更新提示。
智能體已來,但為時(shí)尚早
AI智能體可以使模型(或一系列模型)在用戶幾乎不干預(yù)的情況下完成一個(gè)或一系列動(dòng)作。
智能體工作流程有望擴(kuò)展模型的使用方式,并使開發(fā)者能夠單獨(dú)優(yōu)化每個(gè)步驟,從而可能帶來顯著的生產(chǎn)力提升。
雖然如今真正的自主智能體尚未成為現(xiàn)實(shí),但我們觀察到越來越多的服務(wù)正在幫助用戶構(gòu)建輕量級(jí)的定制助手,比如微軟對(duì)C o p i l o t最近的更新。
這些助手能夠處理更復(fù)雜的工程工作流程(不僅限于代碼輔助)、從多個(gè)來源提取和總結(jié)信息、自動(dòng)標(biāo)記數(shù)據(jù)等任務(wù)。
生成式人工智能的激進(jìn)未來
隨著GenAI快速發(fā)展,對(duì)技術(shù)棧的探索也愈發(fā)深入,從端到端解決方案到專用工具,從數(shù)據(jù)質(zhì)量到治理框架。
可以肯定的是,我們正在見證企業(yè)技術(shù)的變革時(shí)刻,但這還只是個(gè)開始。
最近,AI大牛Andrej Karpathy描繪了一幅更加激進(jìn)的未來圖景。
他設(shè)想了一個(gè)「100%完全軟件2.0計(jì)算機(jī)」,其中單個(gè)神經(jīng)網(wǎng)絡(luò)取代了所有傳統(tǒng)軟件。
其中,設(shè)備輸入如音頻、視頻和觸摸將直接輸入到神經(jīng)網(wǎng)絡(luò)中,輸出則通過揚(yáng)聲器和屏幕顯示為音頻和視頻。
這個(gè)概念遠(yuǎn)超我們當(dāng)前對(duì)操作系統(tǒng)、框架甚至不同類型軟件之間區(qū)別的理解——應(yīng)用程序之間的界限變得模糊,整個(gè)計(jì)算體驗(yàn)將由一個(gè)統(tǒng)一的AI系統(tǒng)來調(diào)控。
雖然這樣的愿景可能顯得遙遠(yuǎn),但它強(qiáng)調(diào)了一點(diǎn):GenAI不僅能重塑單個(gè)應(yīng)用程序或業(yè)務(wù)流程,還能改變計(jì)算的基本性質(zhì)。
今天在構(gòu)建AI基礎(chǔ)設(shè)施時(shí)做出的選擇將為未來的創(chuàng)新奠定基礎(chǔ)。靈活性、可擴(kuò)展性和接受范式轉(zhuǎn)變的意愿將是關(guān)鍵。
不論我們談?wù)摰氖嵌说蕉似脚_(tái),還是AI驅(qū)動(dòng)的計(jì)算環(huán)境,成功的關(guān)鍵在于培養(yǎng)適應(yīng)性。
參考資料:
https://venturebeat.com/ai/ai-stack-attack-navigating-the-generative-tech-maze/
https://menlovc.com/perspective/the-modern-ai-stack-design-principles-for-the-future-of-enterprise-ai-architectures/
https://sapphireventures.com/blog/building-the-future-a-deep-dive-into-the-generative-ai-app-infrastructure-stack/#gallery-4
https://www.emcap.com/thoughts/beyond-benchmarks/
https://www.visualcapitalist.com/mapped-the-number-of-ai-startups-by-country/
以上就是關(guān)于【全球247億美元豪賭GenAI,瘋狂入局AI成高風(fēng)險(xiǎn)博弈?】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!