多模態(tài)AI應用持續(xù)突破
北京時間5月14日凌晨,OpenAI在春季發(fā)布會上重磅推出首個原生多模態(tài)模型GPT-4o,模型可以實時對音頻、視覺以及文本進行推理,同時在響應速度和生成質量方面取得顯著進步,模型易用性的大幅提升也標志著AI大模型應用向更自然的人機交互持續(xù)邁進。
業(yè)內人士表示,國內外大模型有望在未來一段時間實現(xiàn)模型性能以及用戶交互體驗方面的雙重迭代,隨著模型輸出質量、響應時間等維度的不斷優(yōu)化,AI應用有望真正實現(xiàn)用戶體驗和效率提升的賦能,AI有望在各細分行業(yè)中持續(xù)加速商業(yè)化落地。
事件驅動 OpenAI發(fā)布GPT-4o模型
近日,人工智能大模型和應用又迎新進展,OpenAI于春季發(fā)布會上公布了多項與ChatGPT相關的更新,包括發(fā)布GPT-4o多模態(tài)大模型。
GPT-4o模型可在音頻、視覺和文本中進行實時推理,可輸入或輸出文本、音頻和圖像的任何組合。模型可以最短在232ms內響應音頻輸入(平均為320ms),響應速度與人類對話接近,相比GPT-3.5(平均延遲2.8s)和GPT-4(平均延遲5.4s)實現(xiàn)大幅迭代。在模型基準能力方面,GPT-4o在文本、推理以及代碼理解方面達到GPT-4Turbo級別的能力,而在多語種、音頻以及視頻理解能力方面相比于業(yè)界其他模型表現(xiàn)優(yōu)異。
在OpenAI春季發(fā)布會的現(xiàn)場演示環(huán)節(jié),工作人員操作ChatGPT并用語音模式VoiceMode演示,GPT-4o可以察覺到說話者的情緒并給出實時反饋,同時,模型能夠識別實時視頻內容指導用戶解方程,以及完成口譯、代碼分析、圖表理解等任務。
相比于GPT-4Turbo,此次發(fā)布的GPT-4o實現(xiàn)了2倍以上的推理速度,同時,API價格降低50%,并且消息限制提升5倍。GPT-4o對于多種語言采用更高效的token表達(以中文為例,表達同一語句需要的token數(shù)減少到原來的約70%),結合模型在多模態(tài)實時交互方面的顛覆式提升,模型易用性的大幅提升有望推動AI在各類應用場景中的加速滲透。
行業(yè)現(xiàn)狀 國內外AI多模態(tài)模型及工具持續(xù)突破
年初以來,海內外大模型特別是多模態(tài)大模型持續(xù)迭代,應用底層支持能力不斷提升。海外方面,OpenAI在2023年發(fā)布GPT4.0Turbo之后,年初發(fā)布文生視頻大模型SoraGoogle上線Gemini1.5,長文本、情景學習等能力大幅提升;Meta開源Lla-ma3,多模態(tài)版本隨后將上線;SunoAI引發(fā)產(chǎn)業(yè)界對音樂GPT時刻到來的暢想。
國內方面,Kimi為代表的國產(chǎn)大模型長文本能力提升顯著,階躍星辰、商湯科技、昆侖萬維等國內廠商紛紛發(fā)布全新能力的多模態(tài)大模型;此外,國內大模型能力快速提升,在以Kimi、階躍星辰、秘塔等為代表的新勢力鲇魚效應帶動之下,國產(chǎn)大模型從能力到應用進展均有望超預期推進。
另外,垂直領域落地豐富應用。比如,商湯科技通過集成大模型,賦能產(chǎn)業(yè)升級,并在金融、編碼、醫(yī)療保健和政府服務等關鍵領域實現(xiàn)豐富應用。其大模型以低CPU利用率和高效率降低推理成本,與金山辦公合作提供智能辦公平臺,與海通證券合作推動金融行業(yè)數(shù)智化轉型。同時,應用于小米汽車SU7的智能車艙,提升智能化交互體驗。商湯科技還發(fā)布了基于昇騰原生的行業(yè)大模型,打造大模型產(chǎn)業(yè)生態(tài)。這些舉措展示了商湯科技在垂直領域的深厚實力和應用前景,為企業(yè)和行業(yè)提供智能化解決方案,推動產(chǎn)業(yè)升級和發(fā)展。
投資思路 AI持續(xù)賦能游戲、教育、影視等行業(yè)
廣發(fā)證券認為,GPT-4o突破了此前大模型在人機交互中的諸多瓶頸,大幅提升了大模型的易用性,為AI應用帶來了更多可能性,成本進一步降低,或將加速AI應用的繁榮。GPT-4o的能力提升對效率向和娛樂向產(chǎn)品都有望帶來產(chǎn)品功能和形態(tài)的突破。效率向方面,關注AI辦公產(chǎn)品的能力升級、端側AI智能助手的突破;娛樂向方面,關注AI情感陪伴、AI社交等,產(chǎn)品的“人格化”和情感屬性增強后,用戶體驗的大幅提升。持續(xù)關注AI對游戲、營銷、教育、影視等行業(yè)的賦能。
對于具體投資標的,廣發(fā)證券表示,游戲行業(yè)有望進一步將游戲內容精品化,提升優(yōu)質游戲產(chǎn)能,關注三七互娛、愷英網(wǎng)絡、完美世界、神州泰岳、巨人網(wǎng)絡、盛天網(wǎng)絡、姚記科技、吉比特、電魂網(wǎng)絡、游族網(wǎng)絡等。營銷行業(yè)提升廣告內容的生成效率和效果,關注有AI工具產(chǎn)品布局的藍色光標、易點天下、分眾傳媒等。GPT-4o在知識理解與問答上展現(xiàn)出優(yōu)異能力,可以通過視覺能力識別并理解代碼、數(shù)學題等,在教育領域有諸多應用可能,關注佳發(fā)教育、視源股份、世紀天鴻、南方傳媒等。此外,AI有望助力影視行業(yè)工業(yè)化、精品化,關注華策影視、博納影業(yè)、光線傳媒等。
浙商證券指出,以GPT-4o為代表,國內外大模型有望在未來一段時間實現(xiàn)模型性能以及用戶交互體驗方面的雙重迭代,隨著模型輸出質量、響應時間等維度的不斷優(yōu)化,AI應用有望真正實現(xiàn)用戶體驗和效率提升的賦能,AI有望在各細分行業(yè)中持續(xù)加速商業(yè)化落地,并成為用戶的智能助理。建議關注科大訊飛、金山辦公、萬興科技、星環(huán)科技、中科創(chuàng)達、拓爾思、焦點科技、潤達醫(yī)療、虹軟科技等。
華福證券則建議關注AI手機、AIPC和AI智能音箱的漫步者、國光電器;應用端關注AI陪伴、AI陪聊、AI教育、AI游戲的湯姆貓、昆侖萬維、世紀天鴻、寶通科技;多模態(tài)視頻語料企業(yè)關注華策影視、中廣天擇。
- 免責聲明:本文內容與數(shù)據(jù)僅供參考,不構成投資建議。據(jù)此操作,風險自擔。
- 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經(jīng)許可不得轉載或鏡像;授權轉載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
