AI交互水平再升級(jí) 關(guān)注端側(cè)應(yīng)用落地帶來(lái)的投資機(jī)會(huì)
近日,豆包實(shí)時(shí)語(yǔ)音大模型正式推出,并在豆包App全量開(kāi)放。作為一款語(yǔ)音理解和生成一體化的模型,豆包實(shí)時(shí)語(yǔ)音大模型實(shí)現(xiàn)了端到端語(yǔ)音對(duì)話。相比傳統(tǒng)級(jí)聯(lián)模式,該模型在語(yǔ)音表現(xiàn)力、控制力、情緒承接上有顯著提升,并具備低時(shí)延、對(duì)話中可隨時(shí)打斷等特性,語(yǔ)音表達(dá)接近真人水準(zhǔn)。
業(yè)內(nèi)人士表示,豆包實(shí)時(shí)語(yǔ)音大模型的發(fā)布,進(jìn)一步豐富了字節(jié)AI生態(tài),看好字節(jié)AI在國(guó)內(nèi)的領(lǐng)先地位,未來(lái)發(fā)展?jié)摿善凇M瑫r(shí),情感陪伴和AI玩具產(chǎn)品有望伴隨語(yǔ)音類模型能力的強(qiáng)化,提升用戶交互體驗(yàn)。
事件驅(qū)動(dòng) 豆包實(shí)時(shí)語(yǔ)音大模型上線
1月20日,豆包實(shí)時(shí)語(yǔ)音大模型正式推出,并在豆包APP全量開(kāi)放。模型實(shí)現(xiàn)了語(yǔ)音理解和生成一體化、端到端語(yǔ)音對(duì)話,主要面向中文語(yǔ)境和場(chǎng)景。根據(jù)豆包大模型團(tuán)隊(duì)公眾號(hào),經(jīng)外部眾測(cè),模型整體滿意度較GPT-4o有明顯優(yōu)勢(shì),語(yǔ)音語(yǔ)氣自然度和情緒飽滿度高于GPT-4o。
該模型可理解輸入語(yǔ)言情緒、實(shí)時(shí)聯(lián)網(wǎng),在輸出時(shí)具備強(qiáng)大聲音控制能力,且高度近似人類、有超低延遲、可隨時(shí)打斷。其真人級(jí)語(yǔ)音對(duì)話能力具體表現(xiàn)在以下方面:擬人化的情感承接,能夠理解用戶的內(nèi)容及情緒,并用恰當(dāng)?shù)恼Z(yǔ)氣做出回應(yīng);強(qiáng)大的聲音控制和豐富的情感演繹能力,能夠遵循豐富的復(fù)雜指令,配合不同的音色、情緒及狀態(tài)輸出,可以講故事、講方言和口音,甚至可以唱歌;智商與表現(xiàn)力之間的平衡,該模型的表現(xiàn)力高度接近真人,包括類人的語(yǔ)氣詞、停頓思考等,模型也有實(shí)時(shí)聯(lián)網(wǎng)功能,使其能夠根據(jù)問(wèn)題,動(dòng)態(tài)獲取最新信息,對(duì)時(shí)效問(wèn)題給到精準(zhǔn)、及時(shí)的回應(yīng);絲滑的交互體驗(yàn)和超低延遲,實(shí)現(xiàn)在更低系統(tǒng)時(shí)延情況下的生成準(zhǔn)確性、自然度,并且具有敏銳的語(yǔ)音打斷與用戶對(duì)話判停能力。
豆包團(tuán)隊(duì)圍繞擬人度、有用性、情商、通話穩(wěn)定性、對(duì)話流暢度等多個(gè)維度選取數(shù)十名外部測(cè)試者進(jìn)行考評(píng),豆包實(shí)時(shí)語(yǔ)音大模型整體滿意度(以5分為滿分)得分為4.36,GPT-4o為3.18,超過(guò)半數(shù)的測(cè)試者對(duì)豆包模型表現(xiàn)打出滿分,且豆包模型在情緒理解和情感表達(dá)方面優(yōu)勢(shì)明顯,尤其在“一聽(tīng)就是AI與否”的評(píng)測(cè)中被認(rèn)為AI的概率極低。
行業(yè)現(xiàn)狀 實(shí)時(shí)語(yǔ)音大模型豐富人工智能生態(tài)
目前,字節(jié)運(yùn)營(yíng)約20款A(yù)I應(yīng)用,在對(duì)話、助手、虛擬社交、圖像、視頻、智能體、辦公、社區(qū)、音樂(lè)、編程、教育、電商、硬件等幾乎全領(lǐng)域都有布局。根據(jù)AI產(chǎn)品榜數(shù)據(jù),2024年12月,豆包MAU為7116萬(wàn),環(huán)比增長(zhǎng)18.64%。其海外版Cici的MAU達(dá)到1133萬(wàn),位列第26位。虛擬角色APP貓箱MAU為688萬(wàn),環(huán)比增速達(dá)50.18%。豆包實(shí)時(shí)語(yǔ)音大模型的推出有望進(jìn)一步賦能AI產(chǎn)品,推動(dòng)用戶增長(zhǎng)。豆包實(shí)時(shí)語(yǔ)音大模型可提供涵蓋從個(gè)人助手到行業(yè)解決方案的服務(wù),并覆蓋家居、醫(yī)療、教育、金融等多個(gè)領(lǐng)域。
此外,AI情感陪伴能力提升,或?yàn)槎藗?cè)AI落地提供新的思路。據(jù)OpenAICEO奧特曼指出,通用人工智能(AGI)是指AI能夠像人一樣熟練完成重要工作的階段。OpenAI定義了AGI五個(gè)層級(jí),依次為語(yǔ)言對(duì)話、邏輯推理、代理行動(dòng)、輔助創(chuàng)新、組織工作。豆包實(shí)時(shí)語(yǔ)音大模型更加 “人性化”,模型模擬人類情感、意識(shí)與價(jià)值觀,或意味著在通用人工智能(AGI)上取得了重要進(jìn)展。
除字節(jié)跳動(dòng)外,科大訊飛、百度、中國(guó)電信、趣丸科技等紛紛開(kāi)發(fā)語(yǔ)音大模型,并在語(yǔ)音同傳、方言識(shí)別、語(yǔ)音合成等領(lǐng)域取得了豐富成果。在當(dāng)前及未來(lái)一段時(shí)間內(nèi),高質(zhì)量語(yǔ)料,端到端架構(gòu),跨領(lǐng)域識(shí)別,以及情感個(gè)性化等仍是語(yǔ)音大模型廠商發(fā)力的重要方向。
根據(jù)IDC數(shù)據(jù),2024年全球人工智能資本開(kāi)支有望達(dá)2350億美元,并預(yù)計(jì)2028年增長(zhǎng)至6320億美元,復(fù)合增速達(dá)29%。此外,生成式人工智能資本開(kāi)支2024—2028年年均復(fù)合增長(zhǎng)率有望達(dá)59%,顯著高于其他人工智能技術(shù)的22%。
投資思路 關(guān)注端側(cè)應(yīng)用落地帶來(lái)的投資機(jī)會(huì)
廣發(fā)證券表示,豆包實(shí)時(shí)語(yǔ)音大模型的發(fā)布,進(jìn)一步豐富了字節(jié)AI生態(tài),看好字節(jié)AI在國(guó)內(nèi)的領(lǐng)先地位,未來(lái)發(fā)展?jié)摿善凇M瑫r(shí),情感陪伴和AI玩具產(chǎn)品有望伴隨語(yǔ)音類模型能力的強(qiáng)化,提升用戶交互體驗(yàn)。建議關(guān)注與字節(jié)在AI領(lǐng)域具有合作基礎(chǔ)的公司,如易點(diǎn)天下、藍(lán)色光標(biāo)等;布局AI語(yǔ)音相關(guān)業(yè)務(wù)的公司,如盛天網(wǎng)絡(luò)(音樂(lè)社交類平臺(tái)“給麥”等)、昆侖萬(wàn)維(AI音樂(lè)產(chǎn)品Melodio和Mureka)等;布局AI玩具的公司,如上海電影、奧飛娛樂(lè)等;行業(yè)層面來(lái)看,AI大模型能力提升、成本邊際下降,持續(xù)完善的AI基礎(chǔ)設(shè)施有望更好地賦能AI游戲、AI影視、AI營(yíng)銷、AI情感陪伴、AI教育、AIagent等場(chǎng)景。
華創(chuàng)證券認(rèn)為,大模型升級(jí)迭代與端側(cè)應(yīng)用落地將帶來(lái)投資機(jī)會(huì)。芯片關(guān)注海光信息、寒武紀(jì)、芯原股份、景嘉微;服務(wù)器關(guān)注中科曙光、浪潮信息、沃爾核材、歐陸通;數(shù)據(jù)中心關(guān)注潤(rùn)澤科技、寶信軟件、金山云、光環(huán)新網(wǎng);交換機(jī)關(guān)注銳捷網(wǎng)絡(luò)、紫光股份、光訊科技、華工科技等;數(shù)據(jù)關(guān)注海天瑞聲等;應(yīng)用關(guān)注科大訊飛、金山辦公、第四范式、同花順等;硬件關(guān)注恒玄科技、瑞芯微、移遠(yuǎn)通信、樂(lè)鑫科技、中科創(chuàng)達(dá)等。
浙商證券表示,AI有望用于陪伴老人兒童、可用于游戲公司為虛擬人物配音等。建議關(guān)注AI硬件相關(guān)公司中興通訊、潤(rùn)欣科技、樂(lè)鑫科技、兆易創(chuàng)新、移遠(yuǎn)通信、恒玄科技、國(guó)光電器;AI算力相關(guān)公司寒武紀(jì)、海光信息、潤(rùn)澤科技、光環(huán)新網(wǎng)、光迅股份、高瀾股份、英維克、歐陸通、云賽智聯(lián)、亞康股份、中科曙光、浪潮信息;AI應(yīng)用相關(guān)公司海天瑞聲、東軟集團(tuán)、慧博云通、視覺(jué)中國(guó)、漢得信息、中科創(chuàng)達(dá)。 宗禾
- 免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
- 版權(quán)聲明:凡文章來(lái)源為“大眾證券報(bào)”的稿件,均為大眾證券報(bào)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為“大眾證券報(bào)”。
- 廣告/合作熱線:025-86256149
- 舉報(bào)/服務(wù)熱線:025-86256144
