計(jì)算機(jī)視覺(jué)知識(shí)體系
點(diǎn)擊下方卡片,關(guān)注“新機(jī)器視覺(jué)”公眾號(hào)
重磅干貨,第一時(shí)間送達(dá)

一、計(jì)算機(jī)視覺(jué):
三個(gè)層次:系統(tǒng)工程方案層、領(lǐng)域任務(wù)模塊層、基礎(chǔ)算法層。
三方面知識(shí)點(diǎn):圖像處理、機(jī)器學(xué)習(xí)、基礎(chǔ)數(shù)學(xué)與模型。
視頻的三個(gè)場(chǎng)景:近距離(手機(jī)、智能硬件、PC等),室內(nèi)中距離(室內(nèi),如辦公室、商場(chǎng)、家內(nèi);卡口,門(mén)口等),室外遠(yuǎn)距離(道路、公共場(chǎng)所等)
二、系統(tǒng)工程方案層:WEB圖像結(jié)構(gòu)化;離線SDK圖像結(jié)構(gòu)化;視頻關(guān)鍵幀獲取、結(jié)構(gòu)化、序列化行為分析、結(jié)果圖流媒體;
性能上,高并發(fā);高可用;單張時(shí)間,盡量在200ms以內(nèi),尤其是視頻;準(zhǔn)確度。
三、領(lǐng)域任務(wù)模塊層:五大領(lǐng)域(人、車(chē)、文、物、事)
人:人體(檢測(cè)、關(guān)鍵點(diǎn)、屬性分類(lèi)、行為、識(shí)別或者以圖搜人);人臉(檢測(cè)、關(guān)鍵點(diǎn)、屬性分類(lèi)、活體行為、識(shí)別);
車(chē):車(chē)輛(檢測(cè)、關(guān)鍵點(diǎn)、品牌細(xì)分類(lèi)、屬性分類(lèi)、行為,識(shí)別或者以圖搜車(chē));車(chē)牌(檢測(cè)、樣式分類(lèi)、文字識(shí)別);
文:OCR(圖像預(yù)處理、基于圖像分類(lèi)、全部文字檢測(cè)、指定字段定位、文字識(shí)別、基于文字內(nèi)容分類(lèi)),領(lǐng)域:票據(jù)、證件(個(gè)人、企業(yè))、證書(shū)、車(chē)牌、自然場(chǎng)景(內(nèi)部系統(tǒng)圖像、門(mén)牌、站牌、物體等)
物:動(dòng)物(檢測(cè)、關(guān)鍵點(diǎn)、品種細(xì)分類(lèi)、屬性分類(lèi)、行為、識(shí)別或以圖搜動(dòng)物);物體(檢測(cè)、關(guān)鍵點(diǎn)、品牌細(xì)分類(lèi)、屬性分類(lèi)、識(shí)別或以圖搜物)
事:特定場(chǎng)景檢測(cè),如煙火、物體遺留、工業(yè)視覺(jué)等。
四、基礎(chǔ)算法層:三個(gè)方面(檢測(cè)分割、分類(lèi)識(shí)別、圖像預(yù)處理)
檢測(cè)分割:定位目標(biāo)位置、分出目標(biāo)類(lèi)別、提取目標(biāo)關(guān)鍵點(diǎn)、從畫(huà)面中分割出目標(biāo)的像素。
分類(lèi)識(shí)別:分類(lèi)包含三層,大類(lèi)、屬類(lèi)、細(xì)類(lèi),檢測(cè)到目標(biāo)后,目標(biāo)品牌或者品種細(xì)分類(lèi)、目標(biāo)屬性分類(lèi)(顏色、形狀、屬類(lèi)等)、靜態(tài)行為分類(lèi)、序列行為分類(lèi);提取目標(biāo)特征,結(jié)合類(lèi)別進(jìn)行以圖搜圖識(shí)別。
圖像預(yù)處理:圖像增強(qiáng)、去霧、亮度調(diào)整、傾斜校正等。
五、深入領(lǐng)域體會(huì):
人臉領(lǐng)域,檢測(cè)敏感度(人臉傾斜檢測(cè))、誤檢測(cè)率,人臉特征提取速度,人臉識(shí)別準(zhǔn)確度。
車(chē)輛領(lǐng)域,車(chē)牌準(zhǔn)確度、敏感度;顏色、類(lèi)型、品牌準(zhǔn)確度;車(chē)輛整體特征與內(nèi)部局部特征的提?。卉?chē)輛行為分析。
文字領(lǐng)域,圖像質(zhì)量對(duì)文字檢測(cè)與識(shí)別的影響,圖像預(yù)處理,文字檢測(cè)的準(zhǔn)確度與漏檢率,文字識(shí)別,文字語(yǔ)義的分析。
視頻領(lǐng)域,三大難題:(1)誤檢較多。(2)漏檢問(wèn)題,例如遮擋、逆光條件、傾斜姿態(tài)較大等情況無(wú)法檢測(cè)到。(3)速度問(wèn)題,檢測(cè)算法速度無(wú)法完全達(dá)到實(shí)時(shí)性,在100ms以內(nèi)就不錯(cuò)。解決速度問(wèn)題方法:a.視頻關(guān)鍵幀或間隔幀;b.圖像壓縮,坐標(biāo)還原;c.耗時(shí)模塊在關(guān)鍵時(shí)刻運(yùn)行,其他時(shí)刻做數(shù)據(jù)關(guān)聯(lián)。






轉(zhuǎn)自:CSDN博客,作者:shaoshuai_AI_DATA
本文僅做學(xué)術(shù)分享,如有侵權(quán),請(qǐng)聯(lián)系刪文。
