多模態(tài)大模型應(yīng)用前景廣闊 三條主線把握人工智能落地機(jī)會
近期,谷歌公司宣布推出其規(guī)模最大、功能最強(qiáng)的多模態(tài)大模型Gemini,其最強(qiáng)大的TPU(張 量 處 理 單 元 ) 系
統(tǒng)“CloudTPUv5p”,以及來自谷歌云的人工智能超級計(jì)算機(jī)。
業(yè)內(nèi)人士表示,谷歌發(fā)布多模態(tài)大模型Gemini,可以同時(shí)理解文本、圖像、音頻、視頻和代碼五種信息,成為首個(gè)MMLU測評上超過人類專家的模型,在性能上幾乎全方位超越GPT-4V,進(jìn)一步升級了多模態(tài)大模型 的 能 力 。 隨 著 Gen-2、Pika1.0、Gemini等多模態(tài)模型的快速涌現(xiàn),全球大模型多模態(tài)化趨勢日益顯著,有望帶動(dòng)AIGC應(yīng)用加速落地。
事件驅(qū)動(dòng) 谷歌發(fā)布多模態(tài)大模型Gemini
近期,美國科技巨頭谷歌宣布推出其認(rèn)為規(guī)模最大、功能最強(qiáng)大的AI智能模型Gemini1.0。Gemini1.0將有三種不同 的 尺 寸 :GeminiNano、GeminiPro和GeminiUltra。其中,GeminiUltra適用于高度復(fù)雜的任務(wù),目前還處于測試和完善階段,谷歌將向部分客戶、開發(fā)者、合作伙伴以及安全和責(zé)任專家提供使用,用以進(jìn)行早期試驗(yàn)并獲得反饋;GeminiPro適用于各種任務(wù)的最佳模型,用于Bard的升級;GeminiNano則是端側(cè)設(shè)備上最高效的模型,能夠用以支持錄音軟件的“總結(jié)”和Gboard的“智能回復(fù)”等功能。
據(jù)谷歌稱,Gemini為史上第一款原生支持多模態(tài)能力的AI模型。所謂原生多模態(tài),即從一開始就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練,而無需分別訓(xùn)練不同模態(tài)對應(yīng)的組件。在原生多模態(tài)的基礎(chǔ)上,Gemini還會利用額外的多模態(tài)數(shù)據(jù)對其進(jìn)行微調(diào),以進(jìn)一步提高其有效性。在此框架下,Gemini具有多樣化的功能。
Gemini1.0具有復(fù)雜的多模態(tài)推理能力,可幫助理解復(fù)雜的書面和視覺信息。這使得它具有獨(dú)特的技能,可以在海量的數(shù)據(jù)中發(fā)掘難以辨別的知識內(nèi)容,從而擁有強(qiáng)大的推理能力。此外,Gem-ini1.0經(jīng)過訓(xùn)練,可以同時(shí)識別并理解文本、圖像、音頻等,因此它能更好地理解具有細(xì)微差別的信息,回答與復(fù)雜主題相關(guān)的問題。同時(shí),Gemini可以理解、解釋和生成世界上最流行的編程語言 (如Python、Java、C++和Go)的高質(zhì)量代碼。它能夠跨語言工作并對復(fù)雜信息進(jìn)行推理,這些能力使其成為世界領(lǐng)先的編碼基礎(chǔ)模型之一。
依托原生多模態(tài)框架,Gemini擁有強(qiáng)大的性能。谷歌一直在對Gemini模型進(jìn)行嚴(yán)格的測試并評估其在各種任務(wù)中的性能,其在很多方面有著突出的表現(xiàn)。
行業(yè)前瞻 AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊
近期,AI視頻生成領(lǐng)域進(jìn)展不斷,海外多家企業(yè)先后推出相關(guān)AI視頻生成工具或?qū)υ械漠a(chǎn)品進(jìn)行及時(shí)更新。11月20日,Runway更新其視頻生成模型Gen-2,上線“運(yùn)動(dòng)畫筆”功能。11月22日,此前發(fā)布標(biāo)志性文生圖模型StableD-iffusion的公司StabilityAI推出最新AI模型StableVideoDiffusion,實(shí)現(xiàn)圖片生成視頻。11月28日,美國AI初創(chuàng)公司Pika發(fā)布的AI生成視頻工具Pika1.0火熱出圈,其主要功能包括文本/圖片生成視頻、內(nèi)容編輯、風(fēng)格轉(zhuǎn)化、尺寸調(diào)整等。
此外,近日谷歌發(fā)布多模態(tài)大模型Gemini,可以同時(shí)理解文本、圖像、音頻、視頻和代碼五種信息,成為首個(gè)MMLU測評上超過人類專家的模型,在性能上幾乎全方位超越GPT-4V,進(jìn)一步升級了多模態(tài)大模型的能力。隨著Gen-2、Pika1.0、Gemini等多模態(tài)模型的快速涌現(xiàn),全球大模型多模態(tài)化趨勢日益顯著,有望帶動(dòng)AIGC應(yīng)用加速落地。
從大模型應(yīng)用端來看,相較OpenAI,谷歌的商業(yè)版圖更為廣闊,Gemini系列規(guī)模和功能強(qiáng)大,預(yù)計(jì)將快速融入谷歌生態(tài),未來商業(yè)模式擁有極大的想象空間。內(nèi)部生態(tài)融合計(jì)劃來看,谷歌表示,從發(fā)布日起,Gemini可開始應(yīng)用于Bard和Pixel8Pro智能手機(jī),并將很快與谷歌服務(wù)中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。外部用戶開放情況來看,谷歌計(jì)劃通過谷歌云將Gemini授權(quán)給客戶,12月13日開始,開發(fā)者和企業(yè)客戶可以訪問GeminiPro,安卓開發(fā)人員可以使用GeminiNano完成構(gòu)建。
谷歌作為全球人工智能龍頭之一,無論在算力、算法還是商業(yè)化各個(gè)方面都積蓄了優(yōu)勢,Gemini系列大模型的如期推出,打破此前市場關(guān)于延期發(fā)布的傳聞,同時(shí)Gemini系列在傳統(tǒng)文本領(lǐng)域以及多模態(tài)領(lǐng)域能力均對標(biāo)GPT-4,總體超出市場預(yù)期。我們可以看到人工智能巨頭在大模型領(lǐng)域的競爭依然白熱化,在此背景下繼續(xù)看好AI算力需求的增長,同時(shí),當(dāng)下對于多模態(tài)AI的激烈角逐也將持續(xù)拔升大模型的整體能力水平,有助于不斷拓展大模型的應(yīng)用場景和邊界,想象空間廣闊。
當(dāng)前,我國通用人工智能產(chǎn)業(yè)政策逐步完善,國產(chǎn)大模型能力持續(xù)升級,我國國產(chǎn)AI芯片產(chǎn)業(yè)鏈加快成熟。隨著國產(chǎn)大模型廠商和AI芯片廠商的持續(xù)發(fā)力,我國AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊。
投資思路 三條主線把握人工智能落地機(jī)會
太平洋證券表示,谷歌Gemini1.0發(fā)布標(biāo)志著多模態(tài)領(lǐng)域取得里程碑式進(jìn)展,產(chǎn)業(yè)趨勢確定性進(jìn)一步明確。在商業(yè)化方面,過往由于AI應(yīng)用主要集中于B端,商業(yè)化發(fā)展受到限制。隨著多模態(tài)新產(chǎn)品和新技術(shù)的持續(xù)迭代,Pika在多模態(tài)領(lǐng)域取得突破,AIGC有望在文娛行業(yè)拓展應(yīng)用,進(jìn)一步打開C端市場,提升商業(yè)化價(jià)值。今年是AI應(yīng)用落地的元年,建議重視場景和用戶的價(jià)值。
對于具體投資標(biāo)的,太平洋證券推薦關(guān)注三條主線。第一,大模型和AIAgents:昆侖萬維;第二,多模態(tài):文字IP:中文在線、掌閱科技;形象IP:上海電影、奧飛娛樂;多模態(tài)賦能視頻:華策影視,光線傳媒;第三,AI應(yīng)用:AI社交產(chǎn)品:盛天網(wǎng)絡(luò);AI教育:皖新傳媒、佳發(fā)教育;AI校對:果麥文化;AI游戲:愷英網(wǎng)絡(luò)、三七互娛、吉比特、巨人網(wǎng)絡(luò)、電魂網(wǎng)絡(luò)、掌趣科技。
中泰證券指出,人工智能新一輪十年級的技術(shù)和產(chǎn)業(yè)革命大幕已經(jīng)拉開。
對于具體投資標(biāo)的,中泰證券表示,算力服務(wù)器建議關(guān)注浪潮信息、中科曙光、紫光股份等,芯片建議關(guān)注英偉達(dá)、寒武紀(jì)、海光信息、龍芯中科等;模型方面,國內(nèi)建議關(guān)注科大訊飛、三六零、格靈深瞳、云從科技、云天勵(lì)飛等;數(shù)據(jù)建議關(guān)注星環(huán)科技、海天瑞聲等,安全建議關(guān)注深信服、啟明星辰、安恒信息、天融信、綠盟科技、迪普科技、安博通、奇安信、永信至誠、美亞柏科等;生產(chǎn)力工具建議關(guān)注金山辦公、萬興科技、廣聯(lián)達(dá)、中望軟件、彩訊股份、福昕軟件等;ERP等辦公場景建議關(guān)注金蝶國際、明源云、鼎捷軟件、用友網(wǎng)絡(luò)、致遠(yuǎn)互聯(lián)等;金融場景建議關(guān)注恒生電子、同花順、中科軟、宇信科技等;汽車場景建議關(guān)注中科創(chuàng)達(dá)、德賽西威、經(jīng)緯恒潤、萬集科技等;醫(yī)療場景建議關(guān)注衛(wèi)寧健康、創(chuàng)業(yè)慧康、嘉和美康、醫(yī)渡科技、鷹瞳科技等;其他建議關(guān)注焦點(diǎn)科技、中科星圖、航天宏圖、拓爾思、佳發(fā)教育、神思電子等。
- 免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
- 版權(quán)聲明:凡文章來源為“大眾證券報(bào)”的稿件,均為大眾證券報(bào)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為“大眾證券報(bào)”。
- 廣告/合作熱線:025-86256149
- 舉報(bào)/服務(wù)熱線:025-86256144
