計算機視覺的優(yōu)點和局限性
點擊上方“小白學視覺”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
計算機視覺是計算機科學的一個分支,它允許機器系統(tǒng)實時地查看、處理和解釋視覺信息。
20世紀初,計算機視覺對于學者和工程師來說是一個不切實際的夢想。早在20世紀60年代,分配給本科生的“夏季視覺項目”(Summer Vision Project)就首次談到要開發(fā)一種計算機系統(tǒng),能夠解讀周圍環(huán)境的刺激,并做出相應的反應。計算機視覺歷史上的另一個線索是由拉里·羅伯茨提供的。他的論文《三維立體的機器感知》概述了如何“從二維圖像或物體中提取三維信息”。20世紀80年代末,大衛(wèi)·馬爾(David Marr)發(fā)表了《愿景》(Vision)一書。對人類視覺信息表達和處理的計算機研究”,這也是計算機視覺歷史上的一項發(fā)現(xiàn)。從那時起,該領域的許多科學家和工程師進行了嚴格的研究。最后,在20世紀90年代,由于廉價、高性能的超級計算機,致力于計算機視覺的工程師們將他們的注意力轉(zhuǎn)向了數(shù)學模型。隨著不斷的研究和完善,計算機視覺從一個不現(xiàn)實的想法或期望變成了現(xiàn)實。但是,計算機視覺究竟是關于什么的呢?

計算機視覺只是一個科學領域,它允許計算機捕捉、解釋、理解和處理視覺上可感知的對象。在人工智能(AI)和深度學習模型的幫助下,計算機視覺系統(tǒng)能夠理解捕獲的數(shù)字圖像并做出適當?shù)姆磻?。今天,一些行業(yè)正從計算機視覺技術(shù)中受益。計算機視覺系統(tǒng)有多種用途,從預測維護到質(zhì)量控制和現(xiàn)場安全。
現(xiàn)在讓我們繼續(xù)了解計算機視覺系統(tǒng)如何使業(yè)務用戶受益。計算機視覺系統(tǒng)具有觀看和解釋的能力,無需人工干預就能自動完成多項任務。因此,業(yè)務用戶可以享受以下好處:
更快和更簡單的過程——計算機視覺系統(tǒng)可以以更快的速度執(zhí)行單調(diào)、重復的任務,使整個過程更簡單。準確的結(jié)果——機器從不出錯,這不是什么秘密。同樣,與人類不同,具有圖像處理能力的計算機視覺系統(tǒng)也不會出錯。最終,所提供的產(chǎn)品或服務不僅速度快,而且質(zhì)量高。降低成本——隨著機器承擔起執(zhí)行繁瑣任務的責任,錯誤將被最小化,不給有缺陷的產(chǎn)品或服務留下任何空間。因此,公司可以節(jié)省大量的錢,否則這些錢將花在修復有缺陷的流程和產(chǎn)品上。
沒有一項技術(shù)是完美無缺的。同樣的道理也適用于計算機視覺系統(tǒng)。現(xiàn)在讓我們來看看這項技術(shù)固有的一些局限性:缺乏專家——計算機視覺技術(shù)涉及到使用AI和ML。為了訓練一個由AI和ML提供動力的計算機視覺系統(tǒng),公司需要有一個具有技術(shù)專長的專業(yè)團隊。沒有它們,構(gòu)建一個能夠分析和處理可能的周圍細節(jié)的系統(tǒng)是不可能的。需要定期監(jiān)測-如果電腦視覺系統(tǒng)出現(xiàn)故障或技術(shù)故障怎么辦?為了確保這種情況不會發(fā)生,公司必須有一個專門的團隊進行定期的監(jiān)測和評估。
盡管計算機視覺系統(tǒng)目前存在局限性,但它能給公司帶來巨大的機會,增加收入來源,實現(xiàn)生產(chǎn)率目標,并簡化工作流程。然而,我們僅僅觸及了計算機視覺能力的皮毛。未來還有待觀察。
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

