多模態AI應用持續突破
北京時間5月14日凌晨,OpenAI在春季發布會上重磅推出首個原生多模態模型GPT-4o,模型可以實時對音頻、視覺以及文本進行推理,同時在響應速度和生成質量方面取得顯著進步,模型易用性的大幅提升也標志著AI大模型應用向更自然的人機交互持續邁進。
業內人士表示,國內外大模型有望在未來一段時間實現模型性能以及用戶交互體驗方面的雙重迭代,隨著模型輸出質量、響應時間等維度的不斷優化,AI應用有望真正實現用戶體驗和效率提升的賦能,AI有望在各細分行業中持續加速商業化落地。
事件驅動 OpenAI發布GPT-4o模型
近日,人工智能大模型和應用又迎新進展,OpenAI于春季發布會上公布了多項與ChatGPT相關的更新,包括發布GPT-4o多模態大模型。
GPT-4o模型可在音頻、視覺和文本中進行實時推理,可輸入或輸出文本、音頻和圖像的任何組合。模型可以最短在232ms內響應音頻輸入(平均為320ms),響應速度與人類對話接近,相比GPT-3.5(平均延遲2.8s)和GPT-4(平均延遲5.4s)實現大幅迭代。在模型基準能力方面,GPT-4o在文本、推理以及代碼理解方面達到GPT-4Turbo級別的能力,而在多語種、音頻以及視頻理解能力方面相比于業界其他模型表現優異。
在OpenAI春季發布會的現場演示環節,工作人員操作ChatGPT并用語音模式VoiceMode演示,GPT-4o可以察覺到說話者的情緒并給出實時反饋,同時,模型能夠識別實時視頻內容指導用戶解方程,以及完成口譯、代碼分析、圖表理解等任務。
相比于GPT-4Turbo,此次發布的GPT-4o實現了2倍以上的推理速度,同時,API價格降低50%,并且消息限制提升5倍。GPT-4o對于多種語言采用更高效的token表達(以中文為例,表達同一語句需要的token數減少到原來的約70%),結合模型在多模態實時交互方面的顛覆式提升,模型易用性的大幅提升有望推動AI在各類應用場景中的加速滲透。
行業現狀 國內外AI多模態模型及工具持續突破
年初以來,海內外大模型特別是多模態大模型持續迭代,應用底層支持能力不斷提升。海外方面,OpenAI在2023年發布GPT4.0Turbo之后,年初發布文生視頻大模型SoraGoogle上線Gemini1.5,長文本、情景學習等能力大幅提升;Meta開源Lla-ma3,多模態版本隨后將上線;SunoAI引發產業界對音樂GPT時刻到來的暢想。
國內方面,Kimi為代表的國產大模型長文本能力提升顯著,階躍星辰、商湯科技、昆侖萬維等國內廠商紛紛發布全新能力的多模態大模型;此外,國內大模型能力快速提升,在以Kimi、階躍星辰、秘塔等為代表的新勢力鲇魚效應帶動之下,國產大模型從能力到應用進展均有望超預期推進。
另外,垂直領域落地豐富應用。比如,商湯科技通過集成大模型,賦能產業升級,并在金融、編碼、醫療保健和政府服務等關鍵領域實現豐富應用。其大模型以低CPU利用率和高效率降低推理成本,與金山辦公合作提供智能辦公平臺,與海通證券合作推動金融行業數智化轉型。同時,應用于小米汽車SU7的智能車艙,提升智能化交互體驗。商湯科技還發布了基于昇騰原生的行業大模型,打造大模型產業生態。這些舉措展示了商湯科技在垂直領域的深厚實力和應用前景,為企業和行業提供智能化解決方案,推動產業升級和發展。
投資思路 AI持續賦能游戲、教育、影視等行業
廣發證券認為,GPT-4o突破了此前大模型在人機交互中的諸多瓶頸,大幅提升了大模型的易用性,為AI應用帶來了更多可能性,成本進一步降低,或將加速AI應用的繁榮。GPT-4o的能力提升對效率向和娛樂向產品都有望帶來產品功能和形態的突破。效率向方面,關注AI辦公產品的能力升級、端側AI智能助手的突破;娛樂向方面,關注AI情感陪伴、AI社交等,產品的“人格化”和情感屬性增強后,用戶體驗的大幅提升。持續關注AI對游戲、營銷、教育、影視等行業的賦能。
對于具體投資標的,廣發證券表示,游戲行業有望進一步將游戲內容精品化,提升優質游戲產能,關注三七互娛、愷英網絡、完美世界、神州泰岳、巨人網絡、盛天網絡、姚記科技、吉比特、電魂網絡、游族網絡等。營銷行業提升廣告內容的生成效率和效果,關注有AI工具產品布局的藍色光標、易點天下、分眾傳媒等。GPT-4o在知識理解與問答上展現出優異能力,可以通過視覺能力識別并理解代碼、數學題等,在教育領域有諸多應用可能,關注佳發教育、視源股份、世紀天鴻、南方傳媒等。此外,AI有望助力影視行業工業化、精品化,關注華策影視、博納影業、光線傳媒等。
浙商證券指出,以GPT-4o為代表,國內外大模型有望在未來一段時間實現模型性能以及用戶交互體驗方面的雙重迭代,隨著模型輸出質量、響應時間等維度的不斷優化,AI應用有望真正實現用戶體驗和效率提升的賦能,AI有望在各細分行業中持續加速商業化落地,并成為用戶的智能助理。建議關注科大訊飛、金山辦公、萬興科技、星環科技、中科創達、拓爾思、焦點科技、潤達醫療、虹軟科技等。
華福證券則建議關注AI手機、AIPC和AI智能音箱的漫步者、國光電器;應用端關注AI陪伴、AI陪聊、AI教育、AI游戲的湯姆貓、昆侖萬維、世紀天鴻、寶通科技;多模態視頻語料企業關注華策影視、中廣天擇。
- 免責聲明:本文內容與數據僅供參考,不構成投資建議。據此操作,風險自擔。
 - 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為“大眾證券報”。
 - 廣告/合作熱線:025-86256149
 - 舉報/服務熱線:025-86256144
 
