計算機視覺開啟GPT時代
近日,Meta官方博客宣布,推 出 新 AI模 型 SegmentAnythingModel(SAM)分割一切模型,提出能夠?qū)θ魏螆D像或視頻中的任何物體進行識別、圖像分割和一鍵摳圖。此外,華為云AI領域首席科學家田奇在中國人工智能大模型技術高峰論壇上提出,未來隨著盤古系列大模型落地,AI視覺在下游應用中會加速滲透。
業(yè)內(nèi)人士表示,目前SAM模型及數(shù)據(jù)集均為開源,可以靈活集成于更大的AI系統(tǒng),隨著SAM的演進與發(fā)展,該技術可能會成為工業(yè)質(zhì)檢、AR/VR、自動駕駛、衛(wèi)星遙感等多領域的強大的輔助工具,看好SAM等圖像分割模型在機器視覺中的應用。
事件驅(qū)動 Meta推出SAM模型
4月6日,Meta宣布推出Segmen-tAnything工具,SAM可準確識別圖像中的對象,可以識別圖像和視頻中的單個物體,甚至是訓練中沒有遇到的物體。除此之外,Meta還發(fā)布了SegmentAnything1-Bilionmask數(shù)據(jù)集(SA-1B),這更是有史以來發(fā)布的最大分割數(shù)據(jù)集。開發(fā)者可以在SAM模型技術上,開發(fā)出功能更強大、影響范圍更廣的人工智能,應用于各種領域。
目前為特定用例創(chuàng)建準確的分割模型是大多數(shù)AI無法完成的任務,因為它需要技術專家進行高度專業(yè)化的工作,并需要獲得極其強大的AI訓練基礎設施和大量有注釋和特定領域的數(shù)據(jù)集,而Meta表示,上述難題都是SAM和SA-1B能夠克服的問題,通過減少對特定任務的建模專業(yè)知識、訓練計算和定制數(shù)據(jù)注釋的需求來幫助研究人員。
英偉達人工智能科學家JimFan表示,此次SAM最大的一點突破是它已經(jīng)基本能夠理解“物品”的一般概念,即使對于未知對象、不熟悉的場景都能比較準確的理解,因此他表示,相信SAM的出現(xiàn)會是在計算機視覺領域里的GPT-3時刻。
MetaSAM模型的推出引發(fā)市場對計算機視覺的關注,而機器視覺和計算機視覺關系緊密。機器視覺技術,是一門涉及人工智能、神經(jīng)生物學、心理物理學、計算機科學、圖像處理、模式識別等諸多領域的交叉學科。機器視覺主要用計算機來模擬人的視覺功能,從客觀事物的圖像中提取信息,進行處理并加以理解,最終用于實際檢測、測量和控制。
繼Meta發(fā)布SAM后,智源研究院視覺團隊推出通用分割模型SegGPT(Seg-mentEverythingInContext)。與SAM的精細標注能力相比,SegGPT模型更偏重于批量化標注分割能力,無論是在圖像還是視頻環(huán)境,用戶在畫面上標注識別一類物體,即可批量化識別分割出其他所有同類物體。從測試結(jié)果看,研究人員在廣泛的任務上對SegGPT進行了評估,包括少樣本語義分割、視頻對象分割、語義分割和全景分割,結(jié)果顯示SegGPT模型同樣展現(xiàn)出強大的零樣本場景遷移能力,并在COCO和PASCAL等經(jīng)典CV數(shù)據(jù)集上取得最優(yōu)性能。
行業(yè)前景 國產(chǎn)機器視覺成長提速
計算機視覺是指用攝像機和計算機代替人眼對目標進行識別、跟蹤和測量等,通過計算機實現(xiàn)人的視覺功能,對客觀世界的三維場景的感知、識別和理解,通常有仿生學和工程兩類方法。計算機視覺自20世紀40年代萌芽,歷經(jīng)三次浪潮,自2006年Hinton在神經(jīng)網(wǎng)絡的深度學習領域取得突破后,實現(xiàn)飛速發(fā)展。計算機視覺下游應用廣泛,可通過人臉識別、視頻監(jiān)控處理、網(wǎng)絡圖像分析、測溫通行、人機交互等功能垂直賦能各行各業(yè),使用場景包括智慧城市、智慧零售、智慧醫(yī)療、智能駕駛、智能家居、工業(yè)制造等。
機器視覺可以被認為是工業(yè)化的計算機視覺,在工業(yè)領域,計算機視覺為機器視覺提供軟件算法,而機器視覺提供傳感器模型,系統(tǒng)構(gòu)造等,可廣泛應用于3C電子制造、鋰電池、光伏、半導體等行業(yè)。
根據(jù)咨詢機構(gòu)弗若斯特沙利文數(shù)據(jù),我國計算機視覺市場規(guī)模一直保持逐年增長,從2018年的79億元增長至2020年的167億元,年均復合增長率達45.39%,預計2022年我國機器視覺市場規(guī)模將進一步增長至351億元。根據(jù)高工機器人產(chǎn)業(yè)研究所(GGII)統(tǒng)計數(shù)據(jù),我國機器視覺市場國模有望從2021年的107.8億元增長至2025年的311.57億元,CAGR高達30.4%。
值得一提的事,政策支持疊加應用端拓展,國產(chǎn)機器視覺成長提速。一方面,我國《“十四五”智能制造發(fā)展規(guī)劃》中提到,要大力發(fā)展智能制造裝備,推動先進工藝、信息技術與制造裝備深度融合,產(chǎn)業(yè)鏈自主可控需求推動本土機器視覺廠商持續(xù)自主創(chuàng)新、縮小與海外龍頭的實力差距;另一方面,全球人工智能經(jīng)濟持續(xù)發(fā)酵,AI應用端市場多點開花并加速落地,在“AI+”、“工業(yè)4.0”和“中國制造2025”背景下,智能工廠、智能制造成為工業(yè)發(fā)展大趨勢,在機器視覺方面率先實現(xiàn)自主技術創(chuàng)新突破的國產(chǎn)廠商有望充分受益。
投資機會 七大應用領域有望受益
招商證券表示,我國機器視覺研發(fā)起步較晚,早期本土廠商以代理海外龍頭產(chǎn)品為主,后逐步開始自主研發(fā)進程。目前本土企業(yè)中,凌云光已涉足視覺器件、可配置視覺系統(tǒng)與智能視覺裝備等領域,奧普特產(chǎn)品涵蓋視覺控制系統(tǒng)、鏡頭等機器視覺核心部件,大恒科技子公司專注機器視覺系統(tǒng)與部件業(yè)務;天準科技已推出視覺測量裝備、視覺檢測裝備等產(chǎn)品服務,矩子科技涉足機器視覺設備。此外,大華股份、韋爾股份、斯特威、奧比中光等也是本土機器視覺產(chǎn)業(yè)鏈重要參與者。
華西證券指出,SAM對機器視覺會產(chǎn)生革命性的影響,原因是從機器視覺的角度來說,感知永遠是處于智能模塊的流程前期,且感知在AI機器視覺領域占據(jù)絕大部分的功耗,原因是感知需要將數(shù)據(jù)轉(zhuǎn)換成特征向量。就智能駕駛而言,圖像分割是深度神經(jīng)網(wǎng)絡架構(gòu),在智能駕駛極為重要,SAM出世后,此神經(jīng)網(wǎng)絡有望直接被SAM大模型代替,效率大幅提升,模型預訓練所需的時間、人力成本有望大幅降低,同理,其他領域機器視覺同樣受益,例如智慧安防領域、家用攝像頭領域等。
SAM的橫空出世有望對機器視覺產(chǎn)生革命性的影響,華西證券認為以下應用領域有望受益。
第一,智能駕駛,受益標的為中科創(chuàng)達、虹軟科技、光庭信息、四維圖新、東軟集團等;第二,安防領域,受益標的為海康威視、當虹科技、大華股份等;第三,家用攝像頭與機器人領域,受益標的為科沃斯、石頭科技等;第四,工業(yè)質(zhì)檢領域,受益標的為凌云光、用友網(wǎng)絡、奧比中光等;第五,MR、XR領域,受益標的為歌爾股份、立訊精密、微導納米、長盈精密等;第六,地理信息化領域,受益標的為航天宏圖、中科星圖、超圖軟件等;第七,3D建模仿真領域,受益標的為華如科技、霍萊沃等。
中郵證券則表示,目前SAM模型及數(shù)據(jù)集均為開源,可以靈活集成于更大的AI系統(tǒng),隨著SAM的演進與發(fā)展,該技術可能會成為工業(yè)質(zhì)檢、AR/VR、自動駕駛、衛(wèi)星遙感等多領域的強大的輔助工具,看好SAM等圖像分割模型在機器視覺中的應用,建議關注奧普特、凌云光、奧比中光、千方科技、聲迅股份。
- 免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風險自擔。
- 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權轉(zhuǎn)載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
