我用ChatGPT做了一下姜萍的數(shù)學(xué)競(jìng)賽題,它懵了,我也懵了。
相信很多大家對(duì)我用ChatGPT做了一下姜萍的數(shù)學(xué)競(jìng)賽題,它懵了,我也懵了。還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
不僅僅因?yàn)樗M(jìn)入了2024阿里巴巴全球數(shù)學(xué)競(jìng)賽決賽入圍名單,而且,因?yàn)樗?7歲、93分、全球第12名。且是前三十名里唯一的女生。
更炸的一點(diǎn)是,是她的學(xué)校。
江蘇省漣水中等專業(yè)學(xué)校。
嗯,中專。
她的上下左右,是北大、劍橋、清華、MIT、中科院等等等等。
這個(gè)江蘇省漣水中等專業(yè)學(xué)校,就讓人非常的出戲。
而且她讀的還是,服裝設(shè)計(jì)專業(yè)。
這一下子,給我人看的更麻了。
今年是阿里全球數(shù)學(xué)競(jìng)賽的第六屆,而姜萍,也是有史以來(lái),第一個(gè)沖進(jìn)決賽的中專生。
互聯(lián)網(wǎng)上鋪天蓋地,有太多太多關(guān)于她的討論了。無(wú)論如何,在這里,先向小姑娘獻(xiàn)上膝蓋。希望她越走越遠(yuǎn),去攀登自己理想的高峰。
同時(shí)也讓我對(duì)另一個(gè)點(diǎn)很好奇,2024阿里巴巴全球數(shù)學(xué)競(jìng)賽,這是個(gè)啥比賽。
于是我就去查了下資料和題。
才發(fā)現(xiàn)原來(lái)是馬爸爸在2018年就發(fā)起的比賽,然后阿里巴巴公益、達(dá)摩院一起把它打造成為現(xiàn)在世界上規(guī)模最大的在線數(shù)學(xué)競(jìng)賽。
而且最好玩的是,今年的競(jìng)賽,有一個(gè)很創(chuàng)新的點(diǎn),就是,支持AI隊(duì)伍參賽。
然后有563支AI隊(duì)伍沖了進(jìn)去,但是無(wú)一入圍。最高分才34分,跟人類第一113分差的挺遠(yuǎn),跟姜萍的93分也有很大的距離。
看了一下AI組的榜單,第一名又是個(gè)高中生= =第二名還是個(gè)老熟人,特工宇宙。
不過(guò)他們都用了不少的工程化的手法。
我突然就對(duì)這個(gè)數(shù)學(xué)競(jìng)賽的題目感了興趣,我就想看看,他有多難。
于是我就把試題翻了出來(lái)。
第1題:
看完這題,我就感覺(jué),我剛才說(shuō)話稍微是有些大聲了。腦海里就在幻視這個(gè)小同學(xué)勇闖迷蹤陣,有6個(gè)樁,小同學(xué)們迷失在迷蹤中,回過(guò)神來(lái)發(fā)現(xiàn)怎么只有四個(gè)樁。不是問(wèn)樁在哪個(gè)位置,而是問(wèn)到底有幾個(gè)小同學(xué)…
但是沒(méi)關(guān)系,我有AI,于是我沒(méi)有加任何Prompt和Agent,就這么直接把這張圖扔給了ChatGPT。
反正看著很厲害的一頓輸出后,GG了。答案是6,你整個(gè)12,復(fù)制人是吧。
老師告訴我們,考試的時(shí)候不要在第一題浪費(fèi)太多時(shí)間。那先冷靜一下看第二題。
第2題:
我:好啊!這題我會(huì),戰(zhàn)機(jī)游戲!AABB上上下下!完事。
至于ChatGPT,他讓我想起了那首歌,《都選C》。全錯(cuò)。。。答案是B和A。
人類與人工智能選擇看第三題。。。
第3題:
我:這怎么還有立體效果。。。不是,那個(gè)Z,怎么鏤空了?數(shù)學(xué)卷子上都開(kāi)始用windows藝術(shù)字了?通篇我就看到一個(gè)稠密,看的我腦子都稠密了。
ChatGPT:
小字寫挺多,一堆我看不懂的玩意就往上招呼,我雖然看不懂公式,但是我好歹看得懂調(diào)不同,你這里面的公式,一個(gè)都跟答案里長(zhǎng)得不一樣啊我擦= =
第4題:
我:是誰(shuí)?!是誰(shuí)對(duì)我釋放了大腦空空咒…
至于ChatGPT...算了,它認(rèn)慫了。
第5題:
我:多年經(jīng)驗(yàn)告訴我,字少事大。果然,定睛一看,那個(gè)R,又特么是藝術(shù)字!
ChatGPT:
不是,答案里面明明有很多長(zhǎng)這樣的小音符??的。
那問(wèn)題來(lái)了,ChatGPT,你的小音符呢?都沒(méi)小音符,你也敢說(shuō)你對(duì)了?
第6題:
我:好家伙終于有一個(gè)認(rèn)識(shí)的了!五福我熟啊,每年的??ㄎ叶技R了!
ChatGPT:
勉強(qiáng)蒙對(duì)個(gè)1/2,但是過(guò)程全錯(cuò)= =真的純靠蒙。第二題繼續(xù)錯(cuò)。
終于,來(lái)到了最后一題。
第7題:
我:啊?
你特娘的給我出閱讀理解呢?
你不是音樂(lè)嗎,不是小紅和小綠嗎?不是一起去了樹(shù)下嗎,滑稽樹(shù)下滑稽果,滑稽樹(shù)下你和我?
至于ChatGPT。。。
洗洗睡吧。。。
最終ChatGPT得分:0分。
在看完了7道題之后,此時(shí)此刻我的腦海里只有一句話:
我是做啥的來(lái)著?
估計(jì)ChatGPT也很懵,不知道為啥我要這么折磨它。。
不得不說(shuō),能夠參加這樣的競(jìng)賽,能夠在這樣的競(jìng)賽中證明自己的,都是大神。
從上面我和ChatGPT一人一模型相互攙扶著踉踉蹌蹌走過(guò)來(lái)的經(jīng)歷看,現(xiàn)有的AI距離高等數(shù)學(xué)的推理學(xué)習(xí),還有很長(zhǎng)一段路要走。
但是這并不意味著大模型在數(shù)學(xué)領(lǐng)域就會(huì)被限制在中學(xué)水平。作為一種工具,它更多依靠的,是來(lái)自人類的訓(xùn)練。
就像今年1月登上Nature的炸裂級(jí)研究,谷歌DeepMind的AlphaGeometry,在30題的范圍內(nèi),能夠答出25道國(guó)際數(shù)學(xué)奧林匹克幾何題,人類金牌得主平均解決了25.9個(gè)問(wèn)題。
這已經(jīng)是人類的奧數(shù)金牌級(jí)水平了。
而這勝利背后,是AlphaGeometry的團(tuán)隊(duì),構(gòu)建了神經(jīng)語(yǔ)言模型與符號(hào)演繹引擎這兩個(gè)系統(tǒng),嘗試提高模型的推導(dǎo)能力。
這是AlphaGeometry的成就,這更是人類得天獨(dú)厚的成就。
在具備豐富的情感與直覺(jué)感知的同時(shí),去做出理性的決策與判斷。
不過(guò),這種東西,離我們普通人,肯定還是有非常遠(yuǎn)的距離,但是我們也有屬于自己的小期待。
比如,GPT-5。
之前Sam Altman就放出話來(lái),GPT-5會(huì)在高級(jí)推理功能上實(shí)現(xiàn)重大突破。
我很相信OpenAI,至少不會(huì)在GPT這個(gè)最核心的模型上,跟我們打嘴炮。
縱使現(xiàn)在的AI仍然需要成長(zhǎng),但是,攀登者從來(lái)不畏成長(zhǎng)。
就像姜萍對(duì)數(shù)學(xué)的追求,就像之前我分享給大家的那些,因熱愛(ài)而凌云登峰的可敬者們。
所以,最后的問(wèn)題來(lái)了。
GPT-5,到底什么時(shí)候才能出來(lái)?
以上就是關(guān)于【我用ChatGPT做了一下姜萍的數(shù)學(xué)競(jìng)賽題,它懵了,我也懵了?!康南嚓P(guān)內(nèi)容,希望對(duì)大家有幫助!