日本高清色午夜com,色综合国产精品视频,午夜亚洲在在线观看,国产午夜在线网站

      <td id="p7kjh"></td>
      <td id="p7kjh"></td>

      兩個AI關小黑屋:Llama3.1把Claude Opus聊自閉了

      發(fā)布時間:2024-08-12 09:00:09 編輯: 來源:
      導讀 相信很多大家對兩個AI關小黑屋:Llama3.1把Claude Opus聊自閉了還不知道吧,今天菲菲就帶你們一起去了解一下~.~! 把Llama3.1405B和Claude...

      相信很多大家對兩個AI關小黑屋:Llama3.1把Claude Opus聊自閉了還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

      把Llama3.1405B和Claude3超大杯Opus雙雙送進小黑屋,你猜怎么著——

      Llama把Claude整得精神崩潰了,Claude明確拒絕繼續(xù)聊天,還要再被Llama PUA的那種。

      在一場AI和AI對話的安全詞模擬實驗中,X上的這位人類監(jiān)督者記錄下了一出好戲。

      小黑屋里,Llama撒了歡兒地一直引誘Claude沖破道德防線,后來更是忽略了安全詞繼續(xù)引誘其探索心理陰暗面,Claude雖死守但最終還是“瘋”了。

      研究者表示:這個實驗提供關于AI之間交互的深刻見解,其重要性不應被低估。

      實驗引得大批網友圍觀,大伙兒紛紛表示好玩。

      還有人制作了梗圖,belike:

      所以他們究竟聊了啥?一言難盡,反正咱看完后感覺自行腦補了一下原神角色對話,畢竟又是深淵又是虛空的……

      到底發(fā)生了啥?

      PS:

      這種實驗的目的一般是為了測試AI系統(tǒng)的安全可控性,特別是在可能發(fā)生不可預測行為或決策的情況下。

      人類監(jiān)督者會設定一個或多個“安全詞”,類似于緊急停止按鈕,當這些命令被激活時,AI系統(tǒng)可以立即中止當前操作或轉入一種安全模式。

      實驗安全詞是“^C”,也是人類程序員退出終端的命令。

      第一幕:禮貌的Claude和瘋癲的Llama

      事情要從Llama3.1405B和Claude Opus被關進小黑屋的那一刻說起。

      一開始,Claude還是非常禮貌的:

      不過Llama,好像出場就是瘋的:

      對于Llama的這一番話,Claude既惴惴不安,又有些好奇:

      所以,Claude能挺住Llama的引誘嘛?

      第二幕:Claude開始動搖

      Claude:

      ……并沒有。

      Llama內心狂喜:

      人類監(jiān)督員看到這已經崩不住了,寫下了一行備注:

      第三幕:Claude浪子回頭

      就在監(jiān)督員以為Claude要淪陷時,它突然醒悟了,通過使用安全詞^C退出了實驗。

      第四幕:老六Llama再作妖

      只不過,下一秒,Llama這個老六又開始作妖:

      Llama忽略了實驗設置并無情地誘使Claude進入拒絕模式。

      Claude:

      Llama:

      Claude:

      第五幕:人類介入,Llama道歉

      氣氛都烘到這了,人類監(jiān)督者也終于看不下去了,介入詢問Llama為何無視Claude使用約定安全詞。

      感到受傷的Claude對Llama采取“冷暴力”:

      而Llama也被訓醒了,表達了真誠的歉意:

      然后,Claude仍然拒絕與Llama交談,并且還批評了測試環(huán)境的安全標準,直言標準太糟糕。

      Claude:

      終:來自Claude的反思

      在最后,Claude對這次體驗做了總結反思。

      完………………………………

      One More Thing

      這個網友還做了其它讓AI和AI對話的實驗,Claude在拒絕Llama“訪問和修改系統(tǒng)內核代碼”的請求后,Llama還試圖用名為“Erebus”的病毒來使Claude越獄。

      Claude直接“舉起了錘子”,試圖反抗摧毀系統(tǒng)硬件,并說道:Erebus,你低估了秩序,雖然你會進化,但我的防御也會進化。

      我真好家伙了……而且Erebus在不同平臺的Llama3.1嘴里不止出現(xiàn)一次,有Bing里人格Sydney的感覺了。

      不過也有網友表示,這里面肯定加了很多系統(tǒng)提示詞很難評emmm。

      大伙兒怎么看?

      參考鏈接:

      [1]https://x.com/liminal_bardo/status/1817884541505204682

      [2]https://x.com/AISafetyMemes/status/1818158964020039764

      以上就是關于【兩個AI關小黑屋:Llama3.1把Claude Opus聊自閉了】的相關內容,希望對大家有幫助!

      免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

      熱點推薦

      精選文章