音樂(lè)ChatGPT時(shí)刻來(lái)臨！「天工SkyMusic」音樂(lè)大模型今日啟動(dòng)邀測(cè)

來(lái)源：投資界時(shí)間：2024-04-02 11:21:22

4月2日,昆侖萬(wàn)維AI音樂(lè)生成大模型「天工SkyMusic」即日起面向社會(huì)開啟免費(fèi)邀測(cè)。

本輪邀測(cè)將開放1000個(gè)免費(fèi)名額,面向行業(yè)媒體、專家、以及感興趣的音樂(lè)從業(yè)者開放,用戶可掃描文后二維碼或通過(guò)網(wǎng)頁(yè)填寫申請(qǐng),收到申請(qǐng)表后工作人員將第一時(shí)間聯(lián)絡(luò)回復(fù)?！柑旃kyMusic」正式版也將在4月17日隨「天工3.0」面向全社會(huì)免費(fèi)開放。

申請(qǐng)網(wǎng)頁(yè):https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

「天工SkyMusic」基于昆侖萬(wàn)維「天工3.0」超級(jí)大模型打造,是目前國(guó)內(nèi)唯一公開可用的AI音樂(lè)生成大模型。

在通往 AGI 的道路上,多數(shù)團(tuán)隊(duì)都專注于模型智力的擴(kuò)展和增強(qiáng),幾乎沒(méi)有人關(guān)注AI如何幫助人們理解和更好地表達(dá)情感。智力固然重要,但情感是我們能夠被稱之為人的關(guān)鍵,于是,情感 AGI 成為昆侖天工探索研究的一個(gè)重要方向。

我們發(fā)現(xiàn)相比文本和圖片,音頻內(nèi)容是理解人類情感最好的方式,而音樂(lè)又是人類情感表達(dá)最充沛、最不受地域和文化限制的內(nèi)容載體,不論時(shí)代變幻,不論是戰(zhàn)爭(zhēng)還是災(zāi)禍,人們總是能通過(guò)音樂(lè)傳遞自己的感受并獲得情感的慰藉。于是我們創(chuàng)造了音樂(lè)音頻大模型「天工SkyMusic」,并在公司內(nèi)部測(cè)試中已經(jīng)獲得了非常好的反饋和表現(xiàn),很高興跟大家宣布:即日起天工音樂(lè)開放媒體與行業(yè)專家內(nèi)測(cè),來(lái)體驗(yàn)人聲情感表達(dá) SOTA 的音樂(lè)大模型產(chǎn)品。生成作品效果如下:

采用自研類Sora模型架構(gòu) 擁有五大優(yōu)勢(shì)

「天工SkyMusic」采用音樂(lè)音頻領(lǐng)域類Sora模型架構(gòu),Large-scale Transformer 負(fù)責(zé)譜曲,來(lái)學(xué)習(xí) Music Patches 的上下文依賴關(guān)系,同時(shí)完成音樂(lè)可控性;Diffusion Transformer 負(fù)責(zé)演唱,通過(guò)LDM讓Music Patches被還原成高質(zhì)量音頻,使得「天工SkyMusic」能夠支持生成80秒44100Hz 采樣率雙聲道立體聲歌曲。這套模型架構(gòu)在處理視頻、音頻和音樂(lè)領(lǐng)域效果極佳。昆侖萬(wàn)維團(tuán)隊(duì)也將在后續(xù)逐步迭代和添加新的能力,讓模型具備多模態(tài)的情感理解與表達(dá)能力。

「天工SkyMusic」具有以下五大特點(diǎn):

1. 高質(zhì)量AI音樂(lè)

「天工SkyMusic」能夠生成80秒44100Hz采樣率雙聲道立體聲AI歌曲,并可根據(jù)用戶輸入的歌詞風(fēng)格生成對(duì)應(yīng)歌曲風(fēng)格。

2. 人聲“以假亂真”

人聲合成是AI音樂(lè)生成中最重要、最能體現(xiàn)生成效果和品質(zhì)的維度?！柑旃kyMusic」的AI人聲合成能夠達(dá)到業(yè)內(nèi)頂尖的SOTA水平,中文水平極為優(yōu)秀,發(fā)音清晰、無(wú)異響。其中文演唱效果更是顯著好于國(guó)外產(chǎn)品,領(lǐng)先世界水平。

3. 歌詞段落控制

「天工SkyMusic」能夠通過(guò)歌詞來(lái)控制歌曲,讓生成的歌曲可以明確分辨出不同歌詞段落的情緒變化,體現(xiàn)出主歌和副歌、前奏和主歌的段落差異。

4. 多種音樂(lè)風(fēng)格

「天工SkyMusic」支持說(shuō)唱、民謠、放克、古風(fēng)、電子等多種音樂(lè)風(fēng)格,用戶在創(chuàng)作音樂(lè)時(shí),可以通過(guò)參考音頻制定想要的音樂(lè)風(fēng)格。

5. 音樂(lè)智能表達(dá)- 歌唱技巧學(xué)習(xí)

「天工SkyMusic」同時(shí)能夠?qū)W習(xí)如顫音、歌劇、吟唱、男女對(duì)唱,自動(dòng)和聲等多種歌唱技巧,讓用戶創(chuàng)作的歌曲得到更恰當(dāng)?shù)那楦斜磉_(dá)。

一直以來(lái),AI音樂(lè)生成大模型都是AI大模型行業(yè)最受關(guān)注的落地應(yīng)用之一。早在2022年12月,昆侖萬(wàn)維就發(fā)布了「昆侖天工」AIGC全系列開源算法與模型,其中就包括多模態(tài)音樂(lè)內(nèi)容生成大模型。此后,昆侖萬(wàn)維更是通過(guò)AI音樂(lè)生成大模型為北京市東城區(qū)域文商旅融合品牌“故宮以東”打造了年度數(shù)字主題曲,將AI音樂(lè)前沿科技與東城區(qū)歷史文化深度融合。

今天面向社會(huì)開啟免費(fèi)邀測(cè)的「天工SkyMusic」更是國(guó)內(nèi)首款、同時(shí)也是目前國(guó)內(nèi)唯一公開可用的AI音樂(lè)生成大模型。

2023 年,昆侖萬(wàn)維在 “All in AGI 和 AIGC” 的戰(zhàn)略推動(dòng)下,在人工智能領(lǐng)域取得了許多進(jìn)展,逐步形成了AI大模型、AI搜索、AI音樂(lè)、AI 漫畫、AI社交、AI游戲等AI業(yè)務(wù)矩陣。

昆侖萬(wàn)維創(chuàng)始人周亞輝表示:“未來(lái)三十年,人類社會(huì)將從感知線,變成表達(dá)線,整個(gè)人類社會(huì)在自我表達(dá)側(cè)要翻1000倍;創(chuàng)作和自我表達(dá)是未來(lái)30年在整個(gè)社交和文化領(lǐng)域增長(zhǎng)最快的曲線,會(huì)有越來(lái)越多人表達(dá)自我,表達(dá)對(duì)世界的理解、對(duì)社會(huì)事物的態(tài)度,表達(dá)越來(lái)越藝術(shù)化和趣味化;這種表達(dá)在過(guò)去很困難,因?yàn)楣ぞ唛T檻高,而未來(lái)30年是自我表達(dá)的30年,我們要用AI把人類創(chuàng)作的門檻降得足夠低,讓人們更充分地實(shí)現(xiàn)自我表達(dá)?！?/p>

2024年,昆侖萬(wàn)維發(fā)布全新公司使命:“實(shí)現(xiàn)通用人工智能,讓每個(gè)人更好地塑造和表達(dá)自我”。

這一使命體現(xiàn)了技術(shù)創(chuàng)新與人文關(guān)懷的結(jié)合,旨在創(chuàng)造一個(gè)每個(gè)人都能夠自由地發(fā)揮自己最大潛力的未來(lái)。通過(guò)通用人工智能,昆侖萬(wàn)維希望構(gòu)建一個(gè)更加智能、更加互聯(lián)、更加理解和尊重每個(gè)人個(gè)性的世界。

音樂(lè),將會(huì)是其中的重要環(huán)節(jié)。

通過(guò)「天工SkyMusic」,昆侖萬(wàn)維希望幫助每一個(gè)人更好地創(chuàng)作音樂(lè),表達(dá)情感。

當(dāng)前,昆侖萬(wàn)維已打造了集AI搜索、AI寫作、AI長(zhǎng)文本閱讀、AI對(duì)話、AI語(yǔ)音合成、AI圖片生成、AI漫畫創(chuàng)作、AI圖片識(shí)別、AI音樂(lè)生成、AI代碼寫作、AI表格生成等多項(xiàng)能力于一體的「天工3.0」多模態(tài)“超級(jí)模型”(Super Model),成為AI行業(yè)全新里程碑。

本輪「天工SkyMusic」邀測(cè)將開放1000個(gè)免費(fèi)名額,面向行業(yè)媒體、專家、以及感興趣的音樂(lè)從業(yè)者開放。

免責(zé)聲明：市場(chǎng)有風(fēng)險(xiǎn)，選擇需謹(jǐn)慎！此文僅供參考，不作買賣依據(jù)。

關(guān)鍵詞：