AI交互水平再升級 關注端側應用落地帶來的投資機會
近日,豆包實時語音大模型正式推出,并在豆包App全量開放。作為一款語音理解和生成一體化的模型,豆包實時語音大模型實現了端到端語音對話。相比傳統級聯模式,該模型在語音表現力、控制力、情緒承接上有顯著提升,并具備低時延、對話中可隨時打斷等特性,語音表達接近真人水準。
業內人士表示,豆包實時語音大模型的發布,進一步豐富了字節AI生態,看好字節AI在國內的領先地位,未來發展潛力可期。同時,情感陪伴和AI玩具產品有望伴隨語音類模型能力的強化,提升用戶交互體驗。
事件驅動 豆包實時語音大模型上線
1月20日,豆包實時語音大模型正式推出,并在豆包APP全量開放。模型實現了語音理解和生成一體化、端到端語音對話,主要面向中文語境和場景。根據豆包大模型團隊公眾號,經外部眾測,模型整體滿意度較GPT-4o有明顯優勢,語音語氣自然度和情緒飽滿度高于GPT-4o。
該模型可理解輸入語言情緒、實時聯網,在輸出時具備強大聲音控制能力,且高度近似人類、有超低延遲、可隨時打斷。其真人級語音對話能力具體表現在以下方面:擬人化的情感承接,能夠理解用戶的內容及情緒,并用恰當的語氣做出回應;強大的聲音控制和豐富的情感演繹能力,能夠遵循豐富的復雜指令,配合不同的音色、情緒及狀態輸出,可以講故事、講方言和口音,甚至可以唱歌;智商與表現力之間的平衡,該模型的表現力高度接近真人,包括類人的語氣詞、停頓思考等,模型也有實時聯網功能,使其能夠根據問題,動態獲取最新信息,對時效問題給到精準、及時的回應;絲滑的交互體驗和超低延遲,實現在更低系統時延情況下的生成準確性、自然度,并且具有敏銳的語音打斷與用戶對話判停能力。
豆包團隊圍繞擬人度、有用性、情商、通話穩定性、對話流暢度等多個維度選取數十名外部測試者進行考評,豆包實時語音大模型整體滿意度(以5分為滿分)得分為4.36,GPT-4o為3.18,超過半數的測試者對豆包模型表現打出滿分,且豆包模型在情緒理解和情感表達方面優勢明顯,尤其在“一聽就是AI與否”的評測中被認為AI的概率極低。
行業現狀 實時語音大模型豐富人工智能生態
目前,字節運營約20款AI應用,在對話、助手、虛擬社交、圖像、視頻、智能體、辦公、社區、音樂、編程、教育、電商、硬件等幾乎全領域都有布局。根據AI產品榜數據,2024年12月,豆包MAU為7116萬,環比增長18.64%。其海外版Cici的MAU達到1133萬,位列第26位。虛擬角色APP貓箱MAU為688萬,環比增速達50.18%。豆包實時語音大模型的推出有望進一步賦能AI產品,推動用戶增長。豆包實時語音大模型可提供涵蓋從個人助手到行業解決方案的服務,并覆蓋家居、醫療、教育、金融等多個領域。
此外,AI情感陪伴能力提升,或為端側AI落地提供新的思路。據OpenAICEO奧特曼指出,通用人工智能(AGI)是指AI能夠像人一樣熟練完成重要工作的階段。OpenAI定義了AGI五個層級,依次為語言對話、邏輯推理、代理行動、輔助創新、組織工作。豆包實時語音大模型更加 “人性化”,模型模擬人類情感、意識與價值觀,或意味著在通用人工智能(AGI)上取得了重要進展。
除字節跳動外,科大訊飛、百度、中國電信、趣丸科技等紛紛開發語音大模型,并在語音同傳、方言識別、語音合成等領域取得了豐富成果。在當前及未來一段時間內,高質量語料,端到端架構,跨領域識別,以及情感個性化等仍是語音大模型廠商發力的重要方向。
根據IDC數據,2024年全球人工智能資本開支有望達2350億美元,并預計2028年增長至6320億美元,復合增速達29%。此外,生成式人工智能資本開支2024—2028年年均復合增長率有望達59%,顯著高于其他人工智能技術的22%。
投資思路 關注端側應用落地帶來的投資機會
廣發證券表示,豆包實時語音大模型的發布,進一步豐富了字節AI生態,看好字節AI在國內的領先地位,未來發展潛力可期。同時,情感陪伴和AI玩具產品有望伴隨語音類模型能力的強化,提升用戶交互體驗。建議關注與字節在AI領域具有合作基礎的公司,如易點天下、藍色光標等;布局AI語音相關業務的公司,如盛天網絡(音樂社交類平臺“給麥”等)、昆侖萬維(AI音樂產品Melodio和Mureka)等;布局AI玩具的公司,如上海電影、奧飛娛樂等;行業層面來看,AI大模型能力提升、成本邊際下降,持續完善的AI基礎設施有望更好地賦能AI游戲、AI影視、AI營銷、AI情感陪伴、AI教育、AIagent等場景。
華創證券認為,大模型升級迭代與端側應用落地將帶來投資機會。芯片關注海光信息、寒武紀、芯原股份、景嘉微;服務器關注中科曙光、浪潮信息、沃爾核材、歐陸通;數據中心關注潤澤科技、寶信軟件、金山云、光環新網;交換機關注銳捷網絡、紫光股份、光訊科技、華工科技等;數據關注海天瑞聲等;應用關注科大訊飛、金山辦公、第四范式、同花順等;硬件關注恒玄科技、瑞芯微、移遠通信、樂鑫科技、中科創達等。
浙商證券表示,AI有望用于陪伴老人兒童、可用于游戲公司為虛擬人物配音等。建議關注AI硬件相關公司中興通訊、潤欣科技、樂鑫科技、兆易創新、移遠通信、恒玄科技、國光電器;AI算力相關公司寒武紀、海光信息、潤澤科技、光環新網、光迅股份、高瀾股份、英維克、歐陸通、云賽智聯、亞康股份、中科曙光、浪潮信息;AI應用相關公司海天瑞聲、東軟集團、慧博云通、視覺中國、漢得信息、中科創達。 宗禾
- 免責聲明:本文內容與數據僅供參考,不構成投資建議。據此操作,風險自擔。
- 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
