音樂ChatGPT時(shí)刻來臨!“天工SkyMusic”音樂大模型今日啟動(dòng)邀測(cè)

4月2日,昆侖萬維AI音樂生成大模型“天工SkyMusic”即日起面向社會(huì)開啟免費(fèi)邀測(cè)。
本輪邀測(cè)將開放1000個(gè)免費(fèi)名額,面向行業(yè)媒體、專家、以及感興趣的音樂從業(yè)者開放,用戶可掃描文后二維碼或通過網(wǎng)頁填寫申請(qǐng),收到申請(qǐng)表后工作人員將第一時(shí)間聯(lián)絡(luò)回復(fù)。“天工SkyMusic”正式版也將在4月17日隨“天工3.0”面向全社會(huì)免費(fèi)開放。
申請(qǐng)網(wǎng)頁:
https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md
未申請(qǐng)邀測(cè)的用戶也可在4月17日免費(fèi)下載最新版“天工AI智能助手”APP,感受“天工3.0”與“SkyMusic”帶來的顛覆性AI體驗(yàn)。

“天工SkyMusic”基于昆侖萬維“天工3.0”超級(jí)大模型打造,是目前國內(nèi)唯一公開可用的AI音樂生成大模型。
在通往AGI的道路上,多數(shù)團(tuán)隊(duì)都專注于模型智力的擴(kuò)展和增強(qiáng),幾乎沒有人關(guān)注AI如何幫助人們理解和更好地表達(dá)情感。智力固然重要,但情感是我們能夠被稱之為人的關(guān)鍵,于是,情感AGI成為昆侖天工探索研究的一個(gè)重要方向。
我們發(fā)現(xiàn)相比文本和圖片,音頻內(nèi)容是理解人類情感最好的方式,而音樂又是人類情感表達(dá)最充沛、最不受地域和文化限制的內(nèi)容載體,不論時(shí)代變幻,不論是戰(zhàn)爭(zhēng)還是災(zāi)禍,人們總是能通過音樂傳遞自己的感受并獲得情感的慰藉。于是我們創(chuàng)造了音樂音頻大模型“天工SkyMusic”,并在公司內(nèi)部測(cè)試中已經(jīng)獲得了非常好的反饋和表現(xiàn),很高興跟大家宣布:即日起天工音樂開放媒體與行業(yè)專家內(nèi)測(cè),來體驗(yàn)人聲情感表達(dá)SOTA的音樂大模型產(chǎn)品。生成作品效果如下:




采用自研類Sora模型架構(gòu) 擁有五大優(yōu)勢(shì)
“天工SkyMusic”采用音樂音頻領(lǐng)域類Sora模型架構(gòu),Large-scale Transformer 負(fù)責(zé)譜曲,來學(xué)習(xí)Music Patches的上下文依賴關(guān)系,同時(shí)完成音樂可控性;Diffusion Transformer負(fù)責(zé)演唱,通過LDM讓Music Patches被還原成高質(zhì)量音頻,使得“天工SkyMusic”能夠支持生成80秒44100Hz采樣率雙聲道立體聲歌曲。這套模型架構(gòu)在處理視頻、音頻和音樂領(lǐng)域效果極佳。昆侖萬維團(tuán)隊(duì)也將在后續(xù)逐步迭代和添加新的能力,讓模型具備多模態(tài)的情感理解與表達(dá)能力。

“天工SkyMusic”具有以下五大特點(diǎn):
1. 高質(zhì)量AI音樂
“天工SkyMusic”能夠生成80秒44100Hz采樣率雙聲道立體聲AI歌曲,并可根據(jù)用戶輸入的歌詞風(fēng)格生成對(duì)應(yīng)歌曲風(fēng)格。
2. 人聲“以假亂真”
人聲合成是AI音樂生成中最重要、最能體現(xiàn)生成效果和品質(zhì)的維度。“天工SkyMusic”的AI人聲合成能夠達(dá)到業(yè)內(nèi)頂尖的SOTA水平,中文水平極為優(yōu)秀,發(fā)音清晰、無異響。其中文演唱效果更是顯著好于國外產(chǎn)品,領(lǐng)先世界水平。
3. 歌詞段落控制
“天工SkyMusic”@sohu.com”能夠通過歌詞來控制歌曲,讓生成的歌曲可以明確分辨出不同歌詞段落的情緒變化,體現(xiàn)出主歌和副歌、前奏和主歌的段落差異。
4. 多種音樂風(fēng)格
“天工SkyMusic”支持說唱、民謠、放克、古風(fēng)、電子等多種音樂風(fēng)格,用戶在創(chuàng)作音樂時(shí),可以通過參考音頻制定想要的音樂風(fēng)格。

說唱

EDM
5. 音樂智能表達(dá)- 歌唱技巧學(xué)習(xí)
“天工SkyMusic”同時(shí)能夠?qū)W習(xí)如顫音、歌劇、吟唱、男女對(duì)唱,自動(dòng)和聲等多種歌唱技巧,讓用戶創(chuàng)作的歌曲得到更恰當(dāng)?shù)那楦斜磉_(dá)。

歌劇

吟唱

自動(dòng)和聲
一直以來,AI音樂生成大模型都是AI大模型行業(yè)最受關(guān)注的落地應(yīng)用之一。早在2022年12月,昆侖萬維就發(fā)布了“昆侖天工”AIGC全系列開源算法與模型,其中就包括多模態(tài)音樂內(nèi)容生成大模型。此后,昆侖萬維更是通過AI音樂生成大模型為北京市東城區(qū)域文商旅融合品牌“故宮以東”打造了年度數(shù)字主題曲,將AI音樂前沿科技與東城區(qū)歷史文化深度融合。
今天面向社會(huì)開啟免費(fèi)邀測(cè)的“天工SkyMusic”更是國內(nèi)首款、同時(shí)也是目前國內(nèi)唯一公開可用的AI音樂生成大模型。
2023 年,昆侖萬維在 “All in AGI 和 AIGC” 的戰(zhàn)略推動(dòng)下,在人工智能領(lǐng)域取得了許多進(jìn)展,逐步形成了AI大模型、AI搜索、AI音樂、AI動(dòng)漫、AI 社交、AI游戲等AI業(yè)務(wù)矩陣。
昆侖萬維創(chuàng)始人周亞輝表示:“未來三十年,人類社會(huì)將從感知線,變成表達(dá)線,整個(gè)人類社會(huì)在自我表達(dá)側(cè)要翻1000倍;創(chuàng)作和自我表達(dá)是未來30年在整個(gè)社交和文化領(lǐng)域增長(zhǎng)最快的曲線,會(huì)有越來越多人表達(dá)自我,表達(dá)對(duì)世界的理解、對(duì)社會(huì)事物的態(tài)度,表達(dá)越來越藝術(shù)化和趣味化;這種表達(dá)在過去很困難,因?yàn)楣ぞ唛T檻高,而未來30年是自我表達(dá)的30年,我們要用AI把人類創(chuàng)作的門檻降得足夠低,讓人們更充分地實(shí)現(xiàn)自我表達(dá)。”
2024年,昆侖萬維發(fā)布全新公司使命:“實(shí)現(xiàn)通用人工智能,讓每個(gè)人更好地塑造和表達(dá)自我”。
這一使命體現(xiàn)了技術(shù)創(chuàng)新與人文關(guān)懷的結(jié)合,旨在創(chuàng)造一個(gè)每個(gè)人都能夠自由地發(fā)揮自己最大潛力的未來。通過通用人工智能,昆侖萬維希望構(gòu)建一個(gè)更加智能、更加互聯(lián)、更加理解和尊重每個(gè)人個(gè)性的世界。
音樂,將會(huì)是其中的重要環(huán)節(jié)。
通過“天工SkyMusic”,昆侖萬維希望幫助每一個(gè)人更好地創(chuàng)作音樂,表達(dá)情感。
當(dāng)前,昆侖萬維已打造了集AI搜索、AI寫作、AI長(zhǎng)文本閱讀、AI對(duì)話、AI語音合成、AI圖片生成、AI漫畫創(chuàng)作、AI圖片識(shí)別、AI音樂生成、AI代碼寫作、AI表格生成等多項(xiàng)能力于一體的“天工3.0”多模態(tài)“超級(jí)模型”(Super Model),成為AI行業(yè)全新里程碑。
- 免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
- 版權(quán)聲明:凡文章來源為“大眾證券報(bào)”的稿件,均為大眾證券報(bào)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為“大眾證券報(bào)”。
- 廣告/合作熱線:025-86256149
- 舉報(bào)/服務(wù)熱線:025-86256144
