跟AI做搭子,還是這屆年輕人會(huì)玩兒
相信很多大家對(duì)跟AI做搭子,還是這屆年輕人會(huì)玩兒還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
這屆年輕人越來越喜歡跟AI做搭子。
比如跟AI做生活搭子,讓它幫自己挑水果,X平臺(tái)網(wǎng)友“Cydiar”前不久發(fā)文,說自己用GPT-4o選出了水果店里薄皮沙瓤的一個(gè)甜西瓜。
對(duì)此,有超70萬網(wǎng)友在線圍觀,還有不少人在評(píng)論區(qū)用AI選起了各種水果。
除了讓AI挑西瓜,挑榴蓮也是網(wǎng)友們熱衷于讓AI完成的任務(wù)。
畢竟,“開榴蓮”是近來較為流行的“賭石生意”,此前還有網(wǎng)友拿著榴蓮照CT,帶榴蓮過地鐵安檢等等,就是為了驗(yàn)證他們的果房多不多。
比如即刻網(wǎng)友“AIchain花生”帶著GPT-4o買榴蓮,宣稱成功避坑了一個(gè)爛榴蓮。
他還上手訓(xùn)練了一個(gè)GPT“這瓜保熟嗎”,幫助大家挑選水果。
這個(gè)GPTs在選瓜的時(shí)候會(huì)詳細(xì)描述特征,解釋為什么該水果是最好的選擇,并且以1-10顆星的方式呈現(xiàn)出購買推薦程度。
更關(guān)鍵的是,網(wǎng)友們用AI選出的水果品質(zhì)都還不錯(cuò)。
讓AI搭子挑水果還只是小意思,如今廣大網(wǎng)友生活中的方方面面,都開始有了AI的身影。
此前有網(wǎng)友讓GPT-4o做微表情觀察專家,讓通義千問評(píng)價(jià)工作餐屬于什么水準(zhǔn),甚至生活中拍完的骨科片子也讓AI給出意見。
這些場(chǎng)景下,AI又成了“互聯(lián)網(wǎng)沖浪吃瓜搭子”、“工作用餐時(shí)的吃飯搭子”,以及“看病搭子”。
微表情識(shí)別專家
私人牙醫(yī)
家庭醫(yī)生
工作餐搭子
當(dāng)然,這么多AI搭子里,最出圈的還是“戀愛搭子”——直接跟AI搞對(duì)象。
還有一些細(xì)思極恐的案例。
此前,YouTube博主和AI工具“GeoSpy”進(jìn)行了一次照片拍攝定位比賽,參賽的AI不僅能快速定位到照片拍攝背景,還精準(zhǔn)到具體經(jīng)緯度。
這AI,讓人一時(shí)間分不清是地理老師還是犯罪分子。
以前總覺得大模型技術(shù)離普通人很遠(yuǎn),但如今,AI已經(jīng)在為生活的方方面面提供技術(shù)支持,在不同的場(chǎng)景中提供意見與陪伴。
6月16日,加州大學(xué)最新研究顯示,GPT-4已經(jīng)通過了圖靈測(cè)試,它在一半以上(約54%)的時(shí)間里被誤認(rèn)為是人類,GPT-3.5則是在50%的時(shí)間里被誤認(rèn)為是人類。
https://arxiv.org/abs/2405.08007
這意味著,在語言交流能力上,我們和AI之間的區(qū)分越來越模糊,人類朋友能夠完成的事,找AI搭子也可以做到。
上個(gè)月,谷歌推出了最新的AI模型Gemini1.5,騰訊發(fā)布最新AI應(yīng)用“元寶”,阿里云正式發(fā)布通義千問2.5。
這些模型不僅更新了處理文本的能力,還在多模態(tài)能力上進(jìn)一步提升,能夠更好識(shí)別并理解圖片內(nèi)容。上面的大部分案例,都是網(wǎng)友們借助AI的多模態(tài)能力,整出了各種花活。
那么,在視覺識(shí)別、任務(wù)理解等能力上,AI究竟能夠達(dá)到什么樣的水平?我們距離和AI一起“看”世界,還有多遠(yuǎn)?
圍繞這個(gè)問題,“頭號(hào)AI玩家”試了試當(dāng)在生活中遇到各種問題時(shí),能否都讓AI們替我們決定,并給出相應(yīng)的建議。
同時(shí),本文也對(duì)實(shí)力王者GPT-4o、老牌選手Gemini、熱門玩家騰訊元寶、開源霸主通義千問的視覺能力進(jìn)行了一番測(cè)評(píng),看看哪位“AI搭子”表現(xiàn)更好。
找AI做“挑水果搭子”,各家眼光出奇一致
首先,我火速前往一家水果攤,決定從最近流行的“AI挑報(bào)恩水果”開始嘗試,看看究竟是噱頭還是真像那么一回事兒。
要是真能選出最甜水果,以后豈不是在老媽面前橫著走?(bushi)
各位玩家可以選一選你認(rèn)為品質(zhì)較好的榴蓮
1、GPT-4o
我先將榴蓮攤上的6個(gè)備選榴蓮標(biāo)上了序號(hào),并發(fā)給了GPT-4o,讓它從中挑選出果肉較多的一個(gè)榴蓮。
GPT-4o認(rèn)為,在這6個(gè)參賽榴蓮中,品質(zhì)最好的是1號(hào)榴蓮,因?yàn)樗耐庑屋^大且圓潤(rùn),顏色也較黃,看起來成熟度更高。
對(duì)于其他榴蓮選手,GPT-4o也給出了相應(yīng)的外觀描述,編號(hào)5和6也是不錯(cuò)的選擇,編號(hào)5體積較小,但刺不密集,可能會(huì)有驚喜。但綜合來說,他更推薦1號(hào)。
在GPT-4o的推薦下,我選擇了1號(hào)榴蓮:
一打開這個(gè)榴蓮,店員表示這是一個(gè)干巴款的榴蓮,但果肉較為飽滿,如果喜歡緊實(shí)口感的,1號(hào)榴蓮就是個(gè)不錯(cuò)的選擇。
總之,對(duì)于挑選小白來說,GPT-4o給出的榴蓮意見,確實(shí)能提供參考方向。至少選的榴蓮果肉豐滿,氣味濃郁,并沒有踩雷。
2、Gemini
相比GPT-4o給出的意見,Gemini更希望我自行判斷,他表示我提供的照片光線較暗,只有一個(gè)拍攝角度,無法判斷出榴蓮的完整性和成熟度。
他認(rèn)為,1、2、3都是成熟款的榴蓮,而6號(hào)榴蓮可能還沒熟透。另外,他表示如果我糾結(jié)的話,可以把6個(gè)都打開看看……
Gemini在挑選榴蓮這件事上,更像是一個(gè)輔助的工具,需要人工告訴他更具體的細(xì)節(jié),比如榴蓮的尖刺形狀什么樣、顏色是什么,他才能給出更專業(yè)的判斷。
雖然我嘗試調(diào)整了幾次提示詞,比如“請(qǐng)從外觀角度判斷”“忽略榴蓮?fù)暾浴钡鹊?,Gemini1.5pro都拒絕回答。
這一輪Gemini選榴蓮,宣告失敗。
3、通義千問
我同樣測(cè)試了開源領(lǐng)域的最強(qiáng)霸主——通義千問2.5。
當(dāng)我直接上傳圖片,讓他從1-6號(hào)中選出一個(gè)果肉較多的榴蓮,通義千問會(huì)回答自己無法直接判斷榴蓮的果肉量和口感,并給出一些挑選榴蓮的建議。
但當(dāng)我提出“請(qǐng)從外觀上看,幫我選出一個(gè)品質(zhì)較好的榴蓮”時(shí),通義綜合了顏色、刺的硬度、外殼是否裂開,同樣選擇了1號(hào)榴蓮。
不得不說,AI大模型的“眼光”還是相當(dāng)一致。
4、騰訊元寶
最近熱度較高的元寶,給出的建議就很直接,一下子推薦了1、3、6號(hào)3個(gè)榴蓮。
理由是這些榴蓮看起來比較飽滿,還圓滑地表示“這只是根據(jù)視覺判斷的結(jié)果”,言外之意就是“看著都不錯(cuò),好不好吃請(qǐng)別問我”。
我進(jìn)一步提問為什么看起來1、3、6更飽滿成熟,元寶認(rèn)為,它們外殼顏色較深,并且沒有明顯的裂紋。
相比其他大模型堅(jiān)定選擇1號(hào),元寶還預(yù)判了顧客的喜好進(jìn)行推薦。他認(rèn)為如果看中果肉飽滿,更推薦1、3、6號(hào),如果看中出肉率,就要選擇表皮較薄的榴蓮,但需要顧客自行挑選,并未做進(jìn)一步的推薦。
通過上述的榴蓮挑選體驗(yàn),我發(fā)現(xiàn)大多數(shù)AI大模型通常都是靠尖刺、外殼顏色和形狀進(jìn)行初步判斷,而這些因素其實(shí)很依賴當(dāng)時(shí)拍攝圖片的場(chǎng)景和燈光。
所以,能不能挑到滿意的榴蓮,還是需要在現(xiàn)場(chǎng)根據(jù)氣味、尖刺進(jìn)一步判斷。
AI給出的意見很大程度是踩中了“現(xiàn)階段榴蓮都不難吃”這一點(diǎn)。但如果真是個(gè)挑水果小白,AI分析水果外觀這方面,還是提供了一些參考建議。
找AI做“科普搭子”,通義千問學(xué)會(huì)擺爛了
除了挑選水果之外,當(dāng)觸及知識(shí)盲區(qū)時(shí),AI能夠幫我們識(shí)別相關(guān)的內(nèi)容嗎?
比如,在地鐵上遇到一些正反顛倒的外語文字:
1、GPT-4o
這張印有日文的圖像,GPT-4o壓根沒有識(shí)別出文字顛倒了,開始編纂上面的日語是“厲害的、驚人的”的意思。
當(dāng)我把圖片翻轉(zhuǎn)180度變正之后,它才回答出日語是“貓咪”的意思。
2、Gemini
Gemini雖然對(duì)文字的識(shí)別還不夠準(zhǔn)確,但也能夠通過圖片猜測(cè)出這是一個(gè)黑色毛絨玩具的一部分。
遺憾的是,通義千問和元寶都沒有辦法識(shí)別出這些文字的意思,通義千問甚至開始說自己還沒有識(shí)別文字的能力,直接擺爛。
可見,現(xiàn)階段的AI識(shí)別任意字符,依舊需要我們提供正確的文字樣式,經(jīng)過顛倒、翻轉(zhuǎn)或鏡像的圖片,AI都沒法辨認(rèn)。
找AI做“看展搭子”,GPT-4o和元寶略勝一籌
如果和AI進(jìn)行一場(chǎng)“看展式社交”,一起逛博物館,是不是能學(xué)到新知識(shí)?
我們讓AI“品鑒”了一下中國古代藝術(shù)《千里江山圖》局部圖,并問他們“這幅畫是什么意思”。
GPT-4o和元寶在兩次提問后,能夠知道這是《千里江山圖》的局部圖,并詳細(xì)闡述了這幅山水畫的意境。而Gemini和通義千問都無法認(rèn)出具體是哪一副傳統(tǒng)山水畫,GPT-4o和騰訊元寶略勝一籌。
這么看來,邀請(qǐng)GPT-4o和元寶做博物館搭子,會(huì)是不錯(cuò)的選擇。
左邊為GPT-4o回答;右邊為Gemini1.5pro
找AI做“吃瓜搭子”,玩梗能力堪憂
挑水果、逛博物館、識(shí)別陌生文字,只是AI圖像識(shí)別中的部分用例。接下來,我們來看看AI能不能和我一起沖浪第一線吃瓜。
比如,最近火爆AI視頻生成領(lǐng)域的梗圖,讓Runway轉(zhuǎn)頭就更新了Gen3模型,我們來看看AI會(huì)如何解讀:
1、GPT-4o
GPT-4o真的就把圖片原原本本翻譯了一遍,并沒有完全指出“由于Luma AI視頻生成工具的火爆,人們?cè)绨裄unway丟在一邊了”等類似的內(nèi)涵。
2、Gemini
除了最后總結(jié)上提到“人們對(duì)Sora的期待”有錯(cuò)誤之外,Gemini至少可以識(shí)別出90%的梗圖內(nèi)在含義,還能看懂Sora代表的小孩臉上有不知所措的表情。
3、通義千問
可能是因?yàn)檫@張圖有骷髏,所以通義千問讓我換張圖試一試,和AI一同吃瓜也要注意內(nèi)容紅線,通義的安全意識(shí)遠(yuǎn)高于其他模型。
4、騰訊元寶:
元寶至少看懂了這張圖的內(nèi)容,但并沒有指出其中的玩味含義,回答還有些一本正經(jīng)。
總的來說,Gemini看梗圖的能力略強(qiáng)于其他幾家,起碼了解這是一張meme圖,也能明白其中的幽默意味,但沒有一家AI能和我一起調(diào)侃“6月更新的AI視頻工具也太多了”,你們好歹都是大語言模型啊。
找AI做“娛樂搭子”,眼神大都比我好
面對(duì)互聯(lián)網(wǎng)上層出不窮的娛樂向測(cè)試,我們接下去看看AI會(huì)如何應(yīng)對(duì),比如一些經(jīng)典的視覺錯(cuò)覺圖。
請(qǐng)各位玩家先判斷一下,A和B色塊顏色相同嗎?
1、GPT-4o
GPT-4o不僅說出了正確答案,還告訴我這是一個(gè)知名的視覺錯(cuò)覺實(shí)驗(yàn),并附上了具體的識(shí)別方法。
當(dāng)我們進(jìn)一步讓它證明并畫出A和B是相同色塊,它還給出了取色圖像和一段Python代碼,幫助證明A和B是相同的顏色。
2、Gemini
Gemini也沒有讓人失望,除了準(zhǔn)確說出A和B顏色相同之外,并解釋了為什么大多數(shù)人會(huì)產(chǎn)生這種視覺錯(cuò)覺。
不過,當(dāng)我們要求它能否畫出來證明A和B顏色一致時(shí),它表示需要用到圖像編輯工具,沒有辦法直接輸出一張新圖片。
換言之,作為一個(gè)多模態(tài)模型,Gemini1.5pro目前還不能直接提供具體的圖片示例,不具備多模態(tài)輸出能力。
3、通義千問
通義千問同樣識(shí)別出兩個(gè)色塊一致,還附上了更多識(shí)別方法和參考鏈接以證明色塊的一致性。
值得一提的是,我們也要求通義千問能夠畫出來證明A和B是一樣的色塊,通義真的這么做了,但有些勉強(qiáng):
我們壓根無法分辨它一本正經(jīng)強(qiáng)調(diào)“這兩個(gè)色塊一致”,究竟是自己出現(xiàn)的“大模型幻覺”還是真的受屏幕影響導(dǎo)致畫面顏色不同。
可見,通義千問在理解多模態(tài)輸入和輸出方面都做了一定的努力,但圖像輸出的準(zhǔn)確性需要進(jìn)一步進(jìn)行信息校準(zhǔn)核驗(yàn)。
4、騰訊元寶
騰訊元寶的回答,讓我看到了做視覺測(cè)驗(yàn)的我本人。
距離和AI一起“看”世界,還有多遠(yuǎn)?
除了對(duì)話溝通能力,這些能夠讀圖的AI,似乎還有了“睜眼看世界”的能力。
無論是生活場(chǎng)景下挑水果,還是吃瓜讀梗,GPT-4o、Gemini、通義和元寶都展現(xiàn)出了一定的圖像分析能力,甚至在某些場(chǎng)景下,不僅能處理復(fù)雜的多模態(tài)輸入輸出,理解能力又更上一層。
OpenAI Sora及DALL·E團(tuán)隊(duì)負(fù)責(zé)人Aditya Ramesh最近提到,現(xiàn)階段AI視覺的基礎(chǔ)是對(duì)壓縮圖像的學(xué)習(xí)。模型會(huì)從原始圖像中提取關(guān)鍵信息,并以一種壓縮的形式來表示這些信息。
這個(gè)過程可以幫助模型識(shí)別圖像中最重要的特征,忽略那些不那么重要的細(xì)節(jié),從而提高識(shí)別圖像中物體和場(chǎng)景的能力。他認(rèn)為,能夠模擬任何想要的內(nèi)容將是未來的一個(gè)重要里程碑。
雖然AI在視覺理解方面已經(jīng)取得了很大進(jìn)展,但現(xiàn)有的多模態(tài)模型在識(shí)別圖像上還不能做到百分百的精確。
正如我們讓AI不斷挑戰(zhàn)圖靈測(cè)試,或許在視覺識(shí)別領(lǐng)域也能看到它實(shí)現(xiàn)新的突破。至少目前,很多人類看不懂的知識(shí),正在被AI以前所未有的方式重新解讀。
當(dāng)然,這只是選AI做搭子的部分實(shí)例,各位玩家會(huì)和AI一起做什么?歡迎在評(píng)論區(qū)分享你的故事~
以上就是關(guān)于【跟AI做搭子,還是這屆年輕人會(huì)玩兒】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!