日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

<td id="p7kjh"></td>

<td id="p7kjh"></td>

<p id="orsdx"><u id="orsdx"><menuitem id="orsdx"></menuitem></u></p>

<pre id="orsdx"></pre>

<blockquote id="orsdx"><input id="orsdx"></input></blockquote>

OpenAI神秘模型「草莓」兩周內(nèi)上線？數(shù)學(xué)推理暴漲，月收費(fèi)200刀已有人付費(fèi)

發(fā)布時(shí)間：2024-09-11 14:30:35 編輯：來(lái)源：

導(dǎo)讀相信很多大家對(duì)OpenAI神秘模型「草莓」兩周內(nèi)上線？數(shù)學(xué)推理暴漲，月收費(fèi)200刀已有人付費(fèi)還不知道吧，今天菲菲就帶你們一起去了解一下~.~！...

相信很多大家對(duì)OpenAI神秘模型「草莓」兩周內(nèi)上線？數(shù)學(xué)推理暴漲，月收費(fèi)200刀已有人付費(fèi)還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

就在剛剛，The Information曝出:OpenAI的草莓將于兩周內(nèi)上線!收費(fèi)疑似200刀一個(gè)月，最大的特色就是比其他模型多思考10到20秒。然而因?yàn)椤咐莵?lái)了」太多回，網(wǎng)友們?nèi)滩蛔⊥虏?OpenAI現(xiàn)在就是個(gè)炒作公司。

最新消息，「草莓」將在兩周內(nèi)發(fā)布!

這一消息由外媒The Information曝出，據(jù)稱是兩位已經(jīng)測(cè)試過(guò)草莓模型的人士透露的。

發(fā)布時(shí)間比此前報(bào)道的秋季要早。

草莓跟其他模型的最大區(qū)別是啥呢?

答案是，更智能，但更慢、更貴。

而知名爆料人Jimmy Apples的說(shuō)法是，一個(gè)模型（可能被稱為GPT-4.5）預(yù)計(jì)會(huì)在十月發(fā)布。

與此同時(shí)，GPT-5很可能會(huì)在12月發(fā)布，但保險(xiǎn)起見(jiàn)，說(shuō)2025年第一或第二季度發(fā)布，是比較穩(wěn)妥的。

在9月3日，Jimmy Apple還曾經(jīng)艾特Sam Altman，戲謔地問(wèn)道:「我耳邊的低語(yǔ)是真的嗎?我們終于要在十月做一些事了嗎?」

根據(jù)Jimmy Apple的說(shuō)法，需要耐心的時(shí)代已經(jīng)過(guò)去，現(xiàn)在，我們迎來(lái)了發(fā)布的季節(jié)。

而AI大V「數(shù)字生命卡茲克」表示，自己的朋友發(fā)現(xiàn)ChatGPT Pro會(huì)員已經(jīng)上線了，售價(jià)200美元每月。

他們推測(cè)，ChatGPT Pro會(huì)員，或許就是為即將上線的草莓而準(zhǔn)備的。

不過(guò)根據(jù)此前的爆料，草莓本身的目的，似乎是為OpenAI的下一代大模型獵戶座生成更高質(zhì)量數(shù)據(jù)。

因此也有人說(shuō)，我們不必對(duì)草莓抱以過(guò)高期待。

草莓，比我們預(yù)期的更早?

據(jù)悉，兩位已經(jīng)測(cè)試過(guò)草莓模型的人士透露，OpenAI計(jì)劃在兩周內(nèi)將其作為ChatGPT服務(wù)的一部分發(fā)布。

而在原先，The Information報(bào)道的發(fā)布時(shí)間是在秋季。

這一次，報(bào)道中透露了一些新細(xì)節(jié)。

首先，雖然草莓是ChatGPT的一部分，但它是一個(gè)獨(dú)立的產(chǎn)品。

目前還不清楚它將如何推出，一種可能是將其包含這種驅(qū)動(dòng)ChatGPT的AI模型的下拉菜單中，根據(jù)兩位人士的說(shuō)法。

這就會(huì)讓草莓跟常規(guī)的服務(wù)有很大不同。

第二點(diǎn)，草莓和其他對(duì)話式AI最大的區(qū)別，就是它在響應(yīng)之前會(huì)思考10到20秒，然后才回答問(wèn)題。

多個(gè)網(wǎng)友現(xiàn)身說(shuō)法，表示自己上周發(fā)現(xiàn)ChatGPT返回某個(gè)響應(yīng)時(shí)需要10秒才能加載，或許OpenAI已經(jīng)在進(jìn)行a/b測(cè)試了。

第三點(diǎn)，草莓的初始版本目前只能接收和生成文本，而不能處理圖像，這也就意味著，它尚未像OpenAI的其他模型一樣實(shí)現(xiàn)多模態(tài)功能。

因?yàn)槿缃癜l(fā)布的大多數(shù)LLM都是多模態(tài)的，這個(gè)缺陷對(duì)比之下就很顯著。

最后，就是定價(jià)問(wèn)題了。

現(xiàn)在OpenAI的聊天機(jī)器人有免費(fèi)的，也有分等級(jí)的訂閱價(jià)格。

草莓可能會(huì)有低價(jià)位和高價(jià)位的兩檔，前者會(huì)有速率限制，并且限制用戶每小時(shí)的最大消息數(shù)量;而更高價(jià)位的版本，響應(yīng)的速度也會(huì)更快。

這種安排，當(dāng)然也是希望讓更多用戶為新模型付費(fèi)，就像此前OpenAI限制ChatGPT免費(fèi)用戶消息數(shù)量一樣。

草莓會(huì)怎樣收費(fèi)呢?

根據(jù)The Information此前的爆料，每月50、75、200、2000刀似乎都有可能。

一位知情人士稱，在OpenAI早期的內(nèi)部討論中，訂閱價(jià)格曾高達(dá)每月2000美元，但并未最終確定

如今看來(lái)，200美元/月的定價(jià)應(yīng)該是沒(méi)跑了。

來(lái)源:數(shù)字生命卡茲克

The Information還預(yù)測(cè)，目前為ChatGPT付費(fèi)（每月20美元）的客戶，會(huì)比免費(fèi)用戶更早訪問(wèn)首個(gè)草莓模型。

處理復(fù)雜問(wèn)題更拿手

據(jù)悉，草莓會(huì)比GPT-4o更擅長(zhǎng)復(fù)雜的問(wèn)題，或多步驟查詢。

目前，如果用戶想在ChatGPT中得到理想的答案，往往還需要輸入各種格外的prompt。

比如用「連貫思維提示」，讓ChatGPT通過(guò)中間推理步驟來(lái)得出答案。

而草莓可能會(huì)避免這種麻煩，讓用戶一步得到結(jié)果。

這也就意味著，草莓不僅在數(shù)學(xué)和編碼問(wèn)題上會(huì)更好，還會(huì)更擅長(zhǎng)主觀的商業(yè)任務(wù)，比如頭腦風(fēng)暴一個(gè)產(chǎn)品營(yíng)銷(xiāo)策略。

爆料人表示，草莓的思考步驟，會(huì)避免它出錯(cuò)。

而多思考的那十秒到二十秒，會(huì)讓它更可能知道，何時(shí)要向客戶詢問(wèn)后續(xù)問(wèn)題，來(lái)完成對(duì)他們的解答。

多思考20秒是雞肋?

然而兩位人士透露，OpenAI還需要再解決一些問(wèn)題。

比如，理論上講，草莓應(yīng)該能夠在用戶提出簡(jiǎn)單問(wèn)題時(shí)，跳過(guò)其思考步驟。然而在實(shí)際應(yīng)用中，模型并不總是這樣。

它可能會(huì)錯(cuò)誤地花費(fèi)過(guò)多時(shí)間，來(lái)回答那些其他OpenAI模型很快就能回答的問(wèn)題。

用過(guò)草莓模型的人抱怨說(shuō)，跟GPT-4o相比，草莓的回復(fù)只是稍稍更好一些，但并沒(méi)有好到值得用戶去等10到20秒。

另外，OpenAI希望迎合用戶的這一特定偏好:在回答新問(wèn)題前，草莓會(huì)記住并且整合與用戶先前的聊天記錄。

這個(gè)細(xì)節(jié)非常重要，比如如果用戶希望軟件代碼以某種格式書(shū)寫(xiě)的時(shí)候，這種能力就非常有用。

然而令人沮喪的是，草莓并不總是能做到這一點(diǎn)。

網(wǎng)友吐槽:還要擠多久?

冷知識(shí):距離OpenAI發(fā)布GPT-4，已經(jīng)過(guò)去了一年零六個(gè)月。而新模型的影子，至今還沒(méi)看到。

OpenAI的草莓，來(lái)來(lái)回回炒作了好幾遍。狼來(lái)了的故事來(lái)了太多次，網(wǎng)友們都快麻了。

別家都是要發(fā)模型就干脆利落地發(fā)，只有它把同一個(gè)話題來(lái)回來(lái)去地炒，就是不發(fā)真東西。

奧特曼之前曬出花園里的草莓照，就曾一度引起軒然大波，然而最終卻無(wú)事發(fā)生，這種「謎語(yǔ)人」的操作難免令人生厭。

現(xiàn)在提起OpenAI，很多群眾的第一反應(yīng)就是——

沒(méi)錯(cuò)，它已經(jīng)逐漸淪為「炒作」的代名詞。

更有網(wǎng)友做出梗圖，調(diào)侃道:OpenAI發(fā)布新模型的姿勢(shì)是這樣的——

這樣的——

以及這樣的——

本來(lái)在大模型領(lǐng)域，OpenAI是遙遙領(lǐng)先的領(lǐng)導(dǎo)者。但如今，競(jìng)爭(zhēng)者們?cè)缫押髞?lái)居上了。

上個(gè)月，谷歌就推出了AI語(yǔ)音助手，能夠靈活處理用戶的突然中斷和話題變化。

要知道，OpenAI在五月就首發(fā)了「Her」的功能，然而這個(gè)語(yǔ)音助手GPT-4o Voice隨后卻推遲了發(fā)布，原因是OpenAI在提高安全措施，確保模型拒絕不當(dāng)內(nèi)容。

如今正值草莓模型的發(fā)布前期，可能OpenAI也在做類(lèi)似的準(zhǔn)備。

而最令人失望的一點(diǎn)其實(shí)是，跟前兩年的如火如荼相比，今年OpenAI的發(fā)展似乎已經(jīng)停滯了。

與此同時(shí)，模型的計(jì)算量、參數(shù)大小、數(shù)據(jù)集大小，都紛紛遭遇瓶頸，開(kāi)源模型和閉源模型的能力也在逐漸縮小。

是不是因?yàn)闆](méi)有不夠的GPU，所以我們現(xiàn)在依然離AGI如此遙遠(yuǎn)?

如何破局?用RL

打破瓶頸的方法，如今各家都走到了同一路徑——Self-play RL。

在LLM領(lǐng)域，自我博弈理論看起來(lái)就像是AI反饋

Claude3.5就是基于Self-play RL做出的，因此代碼能力強(qiáng)到突出。

而我們都知道，草莓有一個(gè)重要作用，就是給下一代大模型合成數(shù)據(jù)，這里面有個(gè)前提，就是它同樣是基于新范式Self-play做出的。

很多LLM的弱點(diǎn)就在推理能力上，而有些初創(chuàng)公司為了提高它們的推理能力，就采用了一種廉價(jià)的技巧，將問(wèn)題分解為更小的步驟，盡管這些方法速度慢且成本高昂。

AlphaGo就是通過(guò)Self-play學(xué)習(xí)，擊敗了李世石

在草莓中，我們也看到了類(lèi)似的思路。

用Self-play RL去驗(yàn)證，自然就能讓草莓的數(shù)學(xué)和代碼能力上飛速暴漲。

同樣，付出的代價(jià)就是極高的推理成本，導(dǎo)致它又貴、又慢。

但得到的結(jié)果，是極高的智能，或許啟發(fā)我們通往AGI的路線，就靠草莓這種思路了。

說(shuō)起來(lái)，「草莓之父」，其實(shí)就是已經(jīng)離職了的OpenAI的首席科學(xué)家Ilya Sutskever。

據(jù)悉，OpenAI的一些人認(rèn)為Q*可能是OpenAI在AGI上取得的一個(gè)突破

在Ilya離職之前，OpenAI的研究人員Jakub Pachocki和Szymon Sidor，在Ilya的工作基礎(chǔ)上開(kāi)發(fā)了一個(gè)新的數(shù)學(xué)求解模型Q*。

據(jù)稱，Q*解決的此前從未見(jiàn)過(guò)的數(shù)學(xué)題。

Ilya做出的突破，使OpenAI不再受限于獲取足夠的高質(zhì)量數(shù)據(jù)來(lái)訓(xùn)練新模型，而這，正是開(kāi)發(fā)下一代模型的主要障礙。

另外，在去年Q*的前期準(zhǔn)備中，OpenAI研究人員開(kāi)發(fā)了一種被稱為「測(cè)試時(shí)計(jì)算」的概念變體，目的是提升LLM的問(wèn)題解決能力。

這樣，LLM就會(huì)花更多時(shí)間考慮被要求執(zhí)行的命令，或問(wèn)題的各個(gè)部分。

當(dāng)時(shí)，Ilya發(fā)表了一篇與這項(xiàng)工作相關(guān)的博客，展示了模型如何解決了數(shù)個(gè)極有難度的數(shù)學(xué)問(wèn)題。

比如在下面這道題中，GPT-4成功執(zhí)行了一系列復(fù)雜的多項(xiàng)式分解。

基于這類(lèi)技術(shù)做出的草莓，雖然更貴、更慢，但數(shù)學(xué)和推理的進(jìn)步無(wú)疑是驚人的。

或許對(duì)于普通用戶，它未必是一個(gè)更值得付費(fèi)的產(chǎn)品。

但對(duì)于需要高階能力的場(chǎng)景，草莓會(huì)更有發(fā)揮的余地。

大佬猜測(cè):谷歌DeepMind論文疑似揭示方法

有趣的是，Menlo風(fēng)投負(fù)責(zé)人、前谷歌搜索工程師Debarghya Das發(fā)推稱:Google DeepMind在最近一篇論文中提出的方法，可能就是OpenAI在Strawberry上用的。

論文提出，讓LLM進(jìn)行更多的「測(cè)試時(shí)計(jì)算」（test-time computation），對(duì)于構(gòu)建能在開(kāi)放語(yǔ)境下操作、能實(shí)現(xiàn)自我提升的agent，是關(guān)鍵的一步

而這篇論文就重點(diǎn)研究了擴(kuò)展「推理期計(jì)算」（inference-time computation）這個(gè)問(wèn)題。

如果允許LLM使用固定但非平凡量的推理期計(jì)算，它在應(yīng)對(duì)具有挑戰(zhàn)性的提示詞時(shí)，可以有多少性能提升?

這個(gè)問(wèn)題不僅影響LLM的可實(shí)現(xiàn)性能，還關(guān)系到LLM預(yù)訓(xùn)練的未來(lái)，以及如何在推理計(jì)算和預(yù)訓(xùn)練計(jì)算之間進(jìn)行權(quán)衡。

為了回答這個(gè)問(wèn)題，研究團(tuán)隊(duì)分析了擴(kuò)展測(cè)試時(shí)計(jì)算的兩種主要機(jī)制:（1）針對(duì)密集的、基于過(guò)程的驗(yàn)證器獎(jiǎng)勵(lì)模型進(jìn)行搜索;(2)根據(jù)測(cè)試時(shí)得到的提示詞，自適應(yīng)更新模型對(duì)響應(yīng)的分布。

結(jié)果顯示，在這兩種情況下，對(duì)測(cè)試時(shí)計(jì)算的不同擴(kuò)展方法的有效性，很大程度上取決于提示詞的難度。

論文地址:https://arxiv.org/abs/2408.03314

基于此，研究團(tuán)隊(duì)提出了一種「計(jì)算最優(yōu)」擴(kuò)展策略——通過(guò)為每個(gè)提示詞自適應(yīng)地分配測(cè)試時(shí)計(jì)算，使測(cè)試時(shí)計(jì)算的擴(kuò)展的效率提高4倍以上。

另外，在FLOPs一致的評(píng)估中，對(duì)于那些較小的基礎(chǔ)模型已取得一定程度非平凡成功率的問(wèn)題，測(cè)試時(shí)計(jì)算可以使其超越規(guī)模大14倍的模型。

不過(guò)，網(wǎng)友們對(duì)這一猜測(cè)并不認(rèn)可。

Topology首席執(zhí)行官Aidan McLaughlin表示，谷歌DeepMind探討的是最佳N采樣和蒙特卡洛樹(shù)搜索（MCTS）。

而「草莓」可能會(huì)是一個(gè)具有特殊token（回溯、規(guī)劃等）的深度混合模型。它可能會(huì)通過(guò)人類(lèi)數(shù)據(jù)標(biāo)注者和來(lái)自易于驗(yàn)證領(lǐng)域(如數(shù)學(xué)/編程)的強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。

另一位網(wǎng)友也提出疑問(wèn)——「草莓」不是一個(gè)神經(jīng)符號(hào)模型嗎?

對(duì)此，Deedy解釋道:「根據(jù)網(wǎng)上的這些信息和傳聞:『草莓』將通過(guò)在響應(yīng)空間中使用搜索技術(shù)來(lái)改進(jìn)推理，其推理時(shí)間計(jì)算為10到20秒。」

而這，正是這項(xiàng)研究所解釋的內(nèi)容。

參考資料:

https://x.com/apples_jimmy/status/1833595024543781088

https://www.theinformation.com/articles/new-details-on-openais-strawberry-apples-siri-makeover-larry-ellison-doubles-down-on-data-centers?rc=epv9gi

https://x.com/deedydas/status/1833539735853449360

https://mp.weixin.qq.com/s/sc5aMSwU9dKd3X4lzTjkIg

以上就是關(guān)于【OpenAI神秘模型「草莓」兩周內(nèi)上線？數(shù)學(xué)推理暴漲，月收費(fèi)200刀已有人付費(fèi)】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新文章

<em id="oyxyt"><s id="oyxyt"><form id="oyxyt"></form></s></em>

<p id="oyxyt"></p>