AI日?qǐng)?bào):快手上線可靈網(wǎng)頁端并開源可圖Kolors;達(dá)摩院AI視頻平臺(tái)“尋光”炸場(chǎng);月之暗面推Kimi瀏覽器插件
相信很多大家對(duì)AI日?qǐng)?bào):快手上線可靈網(wǎng)頁端并開源可圖Kolors;達(dá)摩院AI視頻平臺(tái)“尋光”炸場(chǎng);月之暗面推Kimi瀏覽器插件還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、可靈AI又放大招:上線Web端,增加首尾幀控制、運(yùn)鏡控制等功能
可靈AI最近發(fā)布了重磅新功能,包括Web端上線、畫質(zhì)提升、首尾幀和鏡頭控制功能加入,文生視頻時(shí)長延長至10秒。更新內(nèi)容涵蓋基礎(chǔ)模型升級(jí)、首尾幀控制、鏡頭控制、文生視頻時(shí)長增加、圖生視頻功能增強(qiáng)和Web端上線。可靈AI能生成高清視頻,支持1080p分辨率,提供個(gè)性化視頻控制選項(xiàng),讓用戶創(chuàng)作更豐富多彩的內(nèi)容。網(wǎng)頁端服務(wù)免費(fèi)上線,未來還將支持語音唇形同步等功能。
2、快手開源圖像生成模型可圖Kolors
快手今天放出了一項(xiàng)重磅消息,開源了自家的圖像生成模型“可圖 Kolors”,這一模型經(jīng)過數(shù)十億的文本圖像對(duì)訓(xùn)練,搭載了通用語言模型(GLM)作為文本編碼器,支持中英雙語提示詞,具有長文本處理能力和海量數(shù)據(jù)訓(xùn)練??蓤D Kolors 還特別優(yōu)化了中國文化元素,支持中文文字生成,展現(xiàn)出強(qiáng)大的技術(shù)支撐和文化傳承。
3、快手推出AIGC微短劇《山海奇鏡之劈波斬浪》
快手推出國內(nèi)首部AIGC原創(chuàng)奇幻微短劇《山海奇鏡之劈波斬浪》,結(jié)合傳統(tǒng)魅力與現(xiàn)代科技,為觀眾帶來震撼的觀看體驗(yàn)。通過大模型技術(shù)支持,呈現(xiàn)升級(jí)后的視覺效果,推動(dòng)微短劇行業(yè)發(fā)展,引領(lǐng)“AIGC+微短劇”新潮流。
4、月之暗面推出 Kimi 瀏覽器插件 支持點(diǎn)問筆、總結(jié)器等功能
Moonshot AI推出的Kimi瀏覽器插件為用戶提供了點(diǎn)問筆和總結(jié)器兩大功能,優(yōu)化了用戶在網(wǎng)頁和應(yīng)用中的體驗(yàn)。插件支持全局浮窗和側(cè)邊欄模式,方便用戶在寫作時(shí)進(jìn)行持續(xù)對(duì)話和搜索。同時(shí),Kimi還進(jìn)行了體驗(yàn)優(yōu)化,包括支持PDF文件打開、搜索引用溯源、內(nèi)容復(fù)制等功能。雙端同步更新還增加了計(jì)算器和問題推薦功能。
5、達(dá)摩院“尋光”炸場(chǎng)!可控編輯,輕松搞定AI視頻工作流
AI視頻創(chuàng)作領(lǐng)域迎來了一場(chǎng)革命性的變革,阿里達(dá)摩院推出的"尋光"平臺(tái)在WAIC上震撼亮相,為創(chuàng)作者提供一站式AI視頻創(chuàng)作解決方案,極大提高創(chuàng)作效率,重塑視頻創(chuàng)作工作流。
6、書?·浦語2.5——InternLM2.5-7B模型宣布開源
2024年7月3日,上海人工智能實(shí)驗(yàn)室與商湯科技聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)正式發(fā)布新一代大語言模型InternLM2.5-7B。該模型在推理能力、長文本支持和自主規(guī)劃與工具調(diào)用方面有顯著提升。
7、阿里通義音頻生成大模型 FunAudioLLM 開源 支持情緒語音對(duì)話、有聲讀物等場(chǎng)景
阿里通義實(shí)驗(yàn)室最近開源了名為FunAudioLLM的音頻生成大模型項(xiàng)目,旨在提升人類與大型語言模型(LLMs)間的自然語音交互體驗(yàn)。該項(xiàng)目包括兩個(gè)核心模型: SenseVoice和CosyVoice,分別致力于語音生成和語音識(shí)別。FunAudioLLM支持多種人機(jī)交互應(yīng)用場(chǎng)景,如多語言翻譯、情緒語音對(duì)話、互動(dòng)播客和有聲讀物等。
8、清華大學(xué)開源CodeGeeX4-ALL-9B:多語言代碼生成模型 超越主要競(jìng)爭(zhēng)對(duì)手
清華大學(xué)知識(shí)工程組和數(shù)據(jù)挖掘團(tuán)隊(duì)推出的CodeGeeX4-ALL-9B標(biāo)志著代碼生成模型發(fā)展的里程碑,具有無與倫比的性能、全面的功能和用戶友好的集成,將推動(dòng)軟件開發(fā)的效率和創(chuàng)新。
9、反AI圖像盜竊工具Glaze需求量劇增 吸引大批藝術(shù)家
Glaze工具應(yīng)運(yùn)而生,旨在保護(hù)藝術(shù)家的風(fēng)格不被AI圖像生成器抄襲。隨著Meta計(jì)劃利用用戶數(shù)據(jù)進(jìn)行AI訓(xùn)練,Glaze需求量急劇上升。然而,安全研究人員發(fā)現(xiàn)了繞過Glaze保護(hù)的方法,引發(fā)了對(duì)其有效性的質(zhì)疑。
10、科幻照進(jìn)現(xiàn)實(shí)?Open-TeleVision支持遠(yuǎn)程操控機(jī)器人
這篇文章介紹了加州大學(xué)圣地亞哥分校和麻省理工學(xué)院研究員們開發(fā)的Open-TeleVision項(xiàng)目,該項(xiàng)目實(shí)現(xiàn)了遠(yuǎn)程操控機(jī)器人的高科技場(chǎng)景,讓人仿佛置身于電影《阿凡達(dá)》中。系統(tǒng)支持多種設(shè)備,提供沉浸式體驗(yàn),通過VR頭顯實(shí)現(xiàn)隔空操控,極大地提升了操作的便捷性和真實(shí)感。
11、中國AI論文數(shù)量全球第一,清華成論文發(fā)表熱門之地
中國在全球人工智能研究領(lǐng)域以驚人速度崛起,論文數(shù)量占全球總量25%,位居世界第一,展現(xiàn)出在AI科技人才素質(zhì)和技術(shù)創(chuàng)新能力上的重大突破。學(xué)術(shù)機(jī)構(gòu)如中國科學(xué)院和清華大學(xué)超越世界頂尖學(xué)府,企業(yè)如谷歌、微軟、騰訊、阿里巴巴在AI研究領(lǐng)域貢獻(xiàn)突出,彰顯中國AI研究的多元化和活力。
12、AI 模型訓(xùn)練成本暴漲,2027 年或達(dá) 1000 億美元!
據(jù)Anthropic首席執(zhí)行官表示,當(dāng)前AI模型訓(xùn)練成本高達(dá)10億美元,未來三年有可能上升到100億美元甚至1000億美元。這一預(yù)測(cè)引發(fā)了人們對(duì)AI泡沫是否即將破裂的擔(dān)憂。硬件和能源消耗成為訓(xùn)練成本的主要驅(qū)動(dòng)因素,隨著AI模型的發(fā)展,這兩方面的支出將急劇增加。人力資源、數(shù)據(jù)采集和運(yùn)行維護(hù)等方面也將耗費(fèi)大量成本,如果這些問題不得到解決,2027年的AI訓(xùn)練成本有可能達(dá)到1000億美元。
以上就是關(guān)于【AI日?qǐng)?bào):快手上線可靈網(wǎng)頁端并開源可圖Kolors;達(dá)摩院AI視頻平臺(tái)“尋光”炸場(chǎng);月之暗面推Kimi瀏覽器插件】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!