麻省理工科技評論稱:數(shù)據(jù)是生成式AI的基礎
相信很多大家對麻省理工科技評論稱:數(shù)據(jù)是生成式AI的基礎還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
站長之家(ChinaZ.com)5月31日 消息:預訓練的大型語言模型(LLM)如 GPT-4和 Gemini 備受組織關注,他們渴望利用 LLM 構(gòu)建聊天機器人、副駕駛等應用。根據(jù)麻省理工科技評論的最新報告,名為 “C 級領導人的 AI 準備情況”,該報告是代表 ETL 供應商 Fivetran 進行的調(diào)查發(fā)現(xiàn),將 AI 或 GenAI 擴展是82% 受訪高管的 “首要任務”。
圖源備注:圖片由AI生成,圖片授權(quán)服務商Midjourney
調(diào)查發(fā)現(xiàn),83% 的組織已經(jīng)確定了要用于 AI 或 GenAI 的數(shù)據(jù)來源。但是,組織在實際連接 GenAI 并在需要時、以適當格式、清潔和準備充分地向 GenAI 應用程序提供數(shù)據(jù)方面準備得如何,存在疑問。同時還需要確保不會危及隱私或安全。
報告指出,平均來說,組織需要 “超過十幾種不同的技術(shù)來收集關于其數(shù)據(jù)的所有智能信息,相同數(shù)量的技術(shù)來集成、轉(zhuǎn)換和復制數(shù)據(jù)”,這帶來了巨大的困難。由于過去為中心化數(shù)據(jù)倉庫項目開發(fā)的數(shù)據(jù)集成和 ETL 工具可能不適合新的 GenAI 用例,因此獲取更好的數(shù)據(jù)集成和 ETL / 數(shù)據(jù)管道工具顯然是一項重要任務。
此外,調(diào)查發(fā)現(xiàn),雖然64% 的調(diào)查對象表示數(shù)據(jù)集成和 ETL / 管道工具是其前兩個 GenAI 投資重點之一,但35% 的人將數(shù)據(jù)湖視為優(yōu)先事項,而31% 的人將數(shù)據(jù)轉(zhuǎn)換工具視為優(yōu)先事項。數(shù)據(jù)目錄和 LLM 投資的份額僅為7%,而矢量數(shù)據(jù)庫和計算層位于中間位置。組織在構(gòu)建數(shù)據(jù)基礎時面臨著許多挑戰(zhàn),包括數(shù)據(jù)集成和構(gòu)建數(shù)據(jù)管道、數(shù)據(jù)治理和安全以及數(shù)據(jù)質(zhì)量等問題。
調(diào)查還發(fā)現(xiàn),組織在數(shù)據(jù)治理、合規(guī)和報告方面存在諸多挑戰(zhàn)。大量調(diào)查對象指出,準備數(shù)據(jù)供 AI 使用的最大挑戰(zhàn)是數(shù)據(jù)治理和安全(44% 的受訪者提到),以及數(shù)據(jù)集成或管道(45% 的受訪者提到)。然而,深入調(diào)查數(shù)據(jù)卻顯示了一種明顯的分歧。特別是,調(diào)查顯示,對安全和治理的積極關注主要集中在政府和金融服務機構(gòu),而在制造業(yè)、零售業(yè)和其他行業(yè)的科技高管中,對安全和治理的擔憂并沒有同樣的比例。
“組織可能無法控制某人在業(yè)務應用程序中使用數(shù)據(jù)并將其發(fā)送給生成式 AI 模型。這些都是重要的問題?!?調(diào)查報告引述 IDC 的 Bond 在報告中說道。建立強大的數(shù)據(jù)基礎是 GenAI 成功的前提條件。如果組織不先構(gòu)建堅實的數(shù)據(jù)基礎,他們的數(shù)據(jù)科學家將在基本的數(shù)據(jù)集成和清理工作上浪費時間。
以上就是關于【麻省理工科技評論稱:數(shù)據(jù)是生成式AI的基礎】的相關內(nèi)容,希望對大家有幫助!