計(jì)算機(jī)視覺開啟GPT時(shí)代
近日,Meta官方博客宣布,推 出 新 AI模 型 SegmentAnythingModel(SAM)分割一切模型,提出能夠?qū)θ魏螆D像或視頻中的任何物體進(jìn)行識(shí)別、圖像分割和一鍵摳圖。此外,華為云AI領(lǐng)域首席科學(xué)家田奇在中國(guó)人工智能大模型技術(shù)高峰論壇上提出,未來(lái)隨著盤古系列大模型落地,AI視覺在下游應(yīng)用中會(huì)加速滲透。
業(yè)內(nèi)人士表示,目前SAM模型及數(shù)據(jù)集均為開源,可以靈活集成于更大的AI系統(tǒng),隨著SAM的演進(jìn)與發(fā)展,該技術(shù)可能會(huì)成為工業(yè)質(zhì)檢、AR/VR、自動(dòng)駕駛、衛(wèi)星遙感等多領(lǐng)域的強(qiáng)大的輔助工具,看好SAM等圖像分割模型在機(jī)器視覺中的應(yīng)用。
事件驅(qū)動(dòng) Meta推出SAM模型
4月6日,Meta宣布推出Segmen-tAnything工具,SAM可準(zhǔn)確識(shí)別圖像中的對(duì)象,可以識(shí)別圖像和視頻中的單個(gè)物體,甚至是訓(xùn)練中沒有遇到的物體。除此之外,Meta還發(fā)布了SegmentAnything1-Bilionmask數(shù)據(jù)集(SA-1B),這更是有史以來(lái)發(fā)布的最大分割數(shù)據(jù)集。開發(fā)者可以在SAM模型技術(shù)上,開發(fā)出功能更強(qiáng)大、影響范圍更廣的人工智能,應(yīng)用于各種領(lǐng)域。
目前為特定用例創(chuàng)建準(zhǔn)確的分割模型是大多數(shù)AI無(wú)法完成的任務(wù),因?yàn)樗枰夹g(shù)專家進(jìn)行高度專業(yè)化的工作,并需要獲得極其強(qiáng)大的AI訓(xùn)練基礎(chǔ)設(shè)施和大量有注釋和特定領(lǐng)域的數(shù)據(jù)集,而Meta表示,上述難題都是SAM和SA-1B能夠克服的問(wèn)題,通過(guò)減少對(duì)特定任務(wù)的建模專業(yè)知識(shí)、訓(xùn)練計(jì)算和定制數(shù)據(jù)注釋的需求來(lái)幫助研究人員。
英偉達(dá)人工智能科學(xué)家JimFan表示,此次SAM最大的一點(diǎn)突破是它已經(jīng)基本能夠理解“物品”的一般概念,即使對(duì)于未知對(duì)象、不熟悉的場(chǎng)景都能比較準(zhǔn)確的理解,因此他表示,相信SAM的出現(xiàn)會(huì)是在計(jì)算機(jī)視覺領(lǐng)域里的GPT-3時(shí)刻。
MetaSAM模型的推出引發(fā)市場(chǎng)對(duì)計(jì)算機(jī)視覺的關(guān)注,而機(jī)器視覺和計(jì)算機(jī)視覺關(guān)系緊密。機(jī)器視覺技術(shù),是一門涉及人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識(shí)別等諸多領(lǐng)域的交叉學(xué)科。機(jī)器視覺主要用計(jì)算機(jī)來(lái)模擬人的視覺功能,從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測(cè)、測(cè)量和控制。
繼Meta發(fā)布SAM后,智源研究院視覺團(tuán)隊(duì)推出通用分割模型SegGPT(Seg-mentEverythingInContext)。與SAM的精細(xì)標(biāo)注能力相比,SegGPT模型更偏重于批量化標(biāo)注分割能力,無(wú)論是在圖像還是視頻環(huán)境,用戶在畫面上標(biāo)注識(shí)別一類物體,即可批量化識(shí)別分割出其他所有同類物體。從測(cè)試結(jié)果看,研究人員在廣泛的任務(wù)上對(duì)SegGPT進(jìn)行了評(píng)估,包括少樣本語(yǔ)義分割、視頻對(duì)象分割、語(yǔ)義分割和全景分割,結(jié)果顯示SegGPT模型同樣展現(xiàn)出強(qiáng)大的零樣本場(chǎng)景遷移能力,并在COCO和PASCAL等經(jīng)典CV數(shù)據(jù)集上取得最優(yōu)性能。
行業(yè)前景 國(guó)產(chǎn)機(jī)器視覺成長(zhǎng)提速
計(jì)算機(jī)視覺是指用攝像機(jī)和計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等,通過(guò)計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能,對(duì)客觀世界的三維場(chǎng)景的感知、識(shí)別和理解,通常有仿生學(xué)和工程兩類方法。計(jì)算機(jī)視覺自20世紀(jì)40年代萌芽,歷經(jīng)三次浪潮,自2006年Hinton在神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)領(lǐng)域取得突破后,實(shí)現(xiàn)飛速發(fā)展。計(jì)算機(jī)視覺下游應(yīng)用廣泛,可通過(guò)人臉識(shí)別、視頻監(jiān)控處理、網(wǎng)絡(luò)圖像分析、測(cè)溫通行、人機(jī)交互等功能垂直賦能各行各業(yè),使用場(chǎng)景包括智慧城市、智慧零售、智慧醫(yī)療、智能駕駛、智能家居、工業(yè)制造等。
機(jī)器視覺可以被認(rèn)為是工業(yè)化的計(jì)算機(jī)視覺,在工業(yè)領(lǐng)域,計(jì)算機(jī)視覺為機(jī)器視覺提供軟件算法,而機(jī)器視覺提供傳感器模型,系統(tǒng)構(gòu)造等,可廣泛應(yīng)用于3C電子制造、鋰電池、光伏、半導(dǎo)體等行業(yè)。
根據(jù)咨詢機(jī)構(gòu)弗若斯特沙利文數(shù)據(jù),我國(guó)計(jì)算機(jī)視覺市場(chǎng)規(guī)模一直保持逐年增長(zhǎng),從2018年的79億元增長(zhǎng)至2020年的167億元,年均復(fù)合增長(zhǎng)率達(dá)45.39%,預(yù)計(jì)2022年我國(guó)機(jī)器視覺市場(chǎng)規(guī)模將進(jìn)一步增長(zhǎng)至351億元。根據(jù)高工機(jī)器人產(chǎn)業(yè)研究所(GGII)統(tǒng)計(jì)數(shù)據(jù),我國(guó)機(jī)器視覺市場(chǎng)國(guó)模有望從2021年的107.8億元增長(zhǎng)至2025年的311.57億元,CAGR高達(dá)30.4%。
值得一提的事,政策支持疊加應(yīng)用端拓展,國(guó)產(chǎn)機(jī)器視覺成長(zhǎng)提速。一方面,我國(guó)《“十四五”智能制造發(fā)展規(guī)劃》中提到,要大力發(fā)展智能制造裝備,推動(dòng)先進(jìn)工藝、信息技術(shù)與制造裝備深度融合,產(chǎn)業(yè)鏈自主可控需求推動(dòng)本土機(jī)器視覺廠商持續(xù)自主創(chuàng)新、縮小與海外龍頭的實(shí)力差距;另一方面,全球人工智能經(jīng)濟(jì)持續(xù)發(fā)酵,AI應(yīng)用端市場(chǎng)多點(diǎn)開花并加速落地,在“AI+”、“工業(yè)4.0”和“中國(guó)制造2025”背景下,智能工廠、智能制造成為工業(yè)發(fā)展大趨勢(shì),在機(jī)器視覺方面率先實(shí)現(xiàn)自主技術(shù)創(chuàng)新突破的國(guó)產(chǎn)廠商有望充分受益。
投資機(jī)會(huì) 七大應(yīng)用領(lǐng)域有望受益
招商證券表示,我國(guó)機(jī)器視覺研發(fā)起步較晚,早期本土廠商以代理海外龍頭產(chǎn)品為主,后逐步開始自主研發(fā)進(jìn)程。目前本土企業(yè)中,凌云光已涉足視覺器件、可配置視覺系統(tǒng)與智能視覺裝備等領(lǐng)域,奧普特產(chǎn)品涵蓋視覺控制系統(tǒng)、鏡頭等機(jī)器視覺核心部件,大恒科技子公司專注機(jī)器視覺系統(tǒng)與部件業(yè)務(wù);天準(zhǔn)科技已推出視覺測(cè)量裝備、視覺檢測(cè)裝備等產(chǎn)品服務(wù),矩子科技涉足機(jī)器視覺設(shè)備。此外,大華股份、韋爾股份、斯特威、奧比中光等也是本土機(jī)器視覺產(chǎn)業(yè)鏈重要參與者。
華西證券指出,SAM對(duì)機(jī)器視覺會(huì)產(chǎn)生革命性的影響,原因是從機(jī)器視覺的角度來(lái)說(shuō),感知永遠(yuǎn)是處于智能模塊的流程前期,且感知在AI機(jī)器視覺領(lǐng)域占據(jù)絕大部分的功耗,原因是感知需要將數(shù)據(jù)轉(zhuǎn)換成特征向量。就智能駕駛而言,圖像分割是深度神經(jīng)網(wǎng)絡(luò)架構(gòu),在智能駕駛極為重要,SAM出世后,此神經(jīng)網(wǎng)絡(luò)有望直接被SAM大模型代替,效率大幅提升,模型預(yù)訓(xùn)練所需的時(shí)間、人力成本有望大幅降低,同理,其他領(lǐng)域機(jī)器視覺同樣受益,例如智慧安防領(lǐng)域、家用攝像頭領(lǐng)域等。
SAM的橫空出世有望對(duì)機(jī)器視覺產(chǎn)生革命性的影響,華西證券認(rèn)為以下應(yīng)用領(lǐng)域有望受益。
第一,智能駕駛,受益標(biāo)的為中科創(chuàng)達(dá)、虹軟科技、光庭信息、四維圖新、東軟集團(tuán)等;第二,安防領(lǐng)域,受益標(biāo)的為海康威視、當(dāng)虹科技、大華股份等;第三,家用攝像頭與機(jī)器人領(lǐng)域,受益標(biāo)的為科沃斯、石頭科技等;第四,工業(yè)質(zhì)檢領(lǐng)域,受益標(biāo)的為凌云光、用友網(wǎng)絡(luò)、奧比中光等;第五,MR、XR領(lǐng)域,受益標(biāo)的為歌爾股份、立訊精密、微導(dǎo)納米、長(zhǎng)盈精密等;第六,地理信息化領(lǐng)域,受益標(biāo)的為航天宏圖、中科星圖、超圖軟件等;第七,3D建模仿真領(lǐng)域,受益標(biāo)的為華如科技、霍萊沃等。
中郵證券則表示,目前SAM模型及數(shù)據(jù)集均為開源,可以靈活集成于更大的AI系統(tǒng),隨著SAM的演進(jìn)與發(fā)展,該技術(shù)可能會(huì)成為工業(yè)質(zhì)檢、AR/VR、自動(dòng)駕駛、衛(wèi)星遙感等多領(lǐng)域的強(qiáng)大的輔助工具,看好SAM等圖像分割模型在機(jī)器視覺中的應(yīng)用,建議關(guān)注奧普特、凌云光、奧比中光、千方科技、聲迅股份。
- 免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
- 版權(quán)聲明:凡文章來(lái)源為“大眾證券報(bào)”的稿件,均為大眾證券報(bào)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為“大眾證券報(bào)”。
- 廣告/合作熱線:025-86256149
- 舉報(bào)/服務(wù)熱線:025-86256144
