視覺(jué)是人類(lèi)在(不斷)變化的環(huán)境中行動(dòng)(和交互)的主要感官之一,而成像是我們以適合計(jì)算處理的形式記錄視覺(jué)信息的手段。成像和計(jì)算機(jī)視覺(jué)在從先進(jìn)顯微鏡技術(shù)到自動(dòng)駕駛汽車(chē)的各種智能系統(tǒng)中共同發(fā)揮著重要作用。計(jì)算機(jī)視覺(jué)和成像課程將重點(diǎn)關(guān)注基本計(jì)算原理,這些原理使通過(guò)多種成像技術(shù)之一獲取的一系列圖像元素能夠轉(zhuǎn)換為理解圖像內(nèi)容和完成各種感知任務(wù)所需的結(jié)構(gòu)和語(yǔ)義實(shí)體。我們將研究圖像形成、低級(jí)圖像處理、對(duì)象識(shí)別、分類(lèi)、分割、配準(zhǔn)、立體視覺(jué)、運(yùn)動(dòng)分析、跟蹤和主動(dòng)視覺(jué)。講座將伴隨一系列練習(xí),這些計(jì)算模型將在現(xiàn)實(shí)場(chǎng)景中設(shè)計(jì)、實(shí)現(xiàn)和測(cè)試。

一、課程預(yù)習(xí)成果
在本模塊結(jié)束時(shí),學(xué)生應(yīng)該能夠:
a.了解主要的計(jì)算機(jī)視覺(jué)和成像方法以及計(jì)算模型
b.設(shè)計(jì)、實(shí)現(xiàn)和測(cè)試計(jì)算機(jī)視覺(jué)和成像算法
c.了解如何綜合成像和視覺(jué)技術(shù)的組合來(lái)解決現(xiàn)實(shí)世界的問(wèn)題
d.學(xué)生應(yīng)表現(xiàn)出獨(dú)立學(xué)習(xí)、理解和批判性評(píng)估本模塊所涵蓋主題領(lǐng)域的先進(jìn)材料或研究文章的能力。
二、增進(jìn)計(jì)算機(jī)視覺(jué)的了解
1.什么是計(jì)算機(jī)視覺(jué)?
計(jì)算機(jī)視覺(jué)是人工智能(AI)的一個(gè)領(lǐng)域,它允許計(jì)算機(jī)和系統(tǒng)從數(shù)字圖像、視頻和其他視覺(jué)數(shù)據(jù)中提取有意義的信息,并根據(jù)這些信息采取行動(dòng)或提出建議。如果說(shuō)人工智能讓計(jì)算機(jī)能夠思考,那么計(jì)算機(jī)視覺(jué)則讓計(jì)算機(jī)能夠觀(guān)察、觀(guān)察和理解。
計(jì)算機(jī)視覺(jué)的工作方式與人類(lèi)視覺(jué)相同,只是人類(lèi)更具優(yōu)勢(shì)。人類(lèi)視覺(jué)的優(yōu)勢(shì)在于終生訓(xùn)練如何分辨物體、物體的距離、物體是否移動(dòng)以及圖像是否有問(wèn)題。
計(jì)算機(jī)視覺(jué)可以訓(xùn)練機(jī)器執(zhí)行這些功能,但它必須在更短的時(shí)間內(nèi)利用攝像頭、數(shù)據(jù)和算法,而不是視網(wǎng)膜、視神經(jīng)和視覺(jué)皮層。由于經(jīng)過(guò)訓(xùn)練的系統(tǒng)可以在每分鐘內(nèi)分析數(shù)千種產(chǎn)品或流程,發(fā)現(xiàn)難以察覺(jué)的缺陷或問(wèn)題,從而迅速超越人類(lèi)的能力。
2.計(jì)算機(jī)視覺(jué)如何工作?
計(jì)算機(jī)視覺(jué)需要大量數(shù)據(jù)。它反復(fù)分析數(shù)據(jù),直到識(shí)別出差異并最終識(shí)別圖像。例如,要訓(xùn)練計(jì)算機(jī)識(shí)別汽車(chē)輪胎,就需要給計(jì)算機(jī)提供大量輪胎和相關(guān)物品的圖像,讓它學(xué)會(huì)區(qū)別并識(shí)別輪胎,尤其是沒(méi)有缺陷的輪胎。
為此,需要使用兩種主要技術(shù):一種是稱(chēng)為深度學(xué)習(xí)的機(jī)器學(xué)習(xí),另一種是卷積神經(jīng)網(wǎng)絡(luò)(CNN)。
機(jī)器學(xué)習(xí)使用算法模型,使計(jì)算機(jī)能夠自我學(xué)習(xí)視覺(jué)數(shù)據(jù)的上下文。如果通過(guò)模型輸入足夠多的數(shù)據(jù),計(jì)算機(jī)就會(huì) "觀(guān)察 "這些數(shù)據(jù),并學(xué)會(huì)區(qū)分不同的圖像。算法可以讓機(jī)器自主學(xué)習(xí),而不是由人編程來(lái)識(shí)別圖像。
CNN 通過(guò)將圖像分離成像素來(lái)幫助機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型進(jìn)行 "搜索",這些像素被分配了標(biāo)簽或標(biāo)記。它使用這些標(biāo)簽進(jìn)行卷積(對(duì)兩個(gè)特征進(jìn)行數(shù)學(xué)運(yùn)算以產(chǎn)生第三個(gè)特征),并對(duì)它 "看到 "的內(nèi)容進(jìn)行預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)執(zhí)行卷積,并在一系列迭代中檢查其預(yù)測(cè)的準(zhǔn)確性,直到預(yù)測(cè)開(kāi)始成真。然后,它就能以類(lèi)似人類(lèi)的方式識(shí)別或看到圖像。
就像人類(lèi)從遠(yuǎn)處辨別圖像一樣,CNN 首先識(shí)別硬邊緣和簡(jiǎn)單形狀,然后在執(zhí)行迭代預(yù)測(cè)時(shí)填充信息。CNN 用于理解單個(gè)圖像。遞歸神經(jīng)網(wǎng)絡(luò) (RNN) 也同樣用于視頻應(yīng)用,幫助計(jì)算機(jī)理解幀序列中圖像之間的關(guān)系。
海馬課堂專(zhuān)業(yè)課程輔導(dǎo),2300+嚴(yán)選碩博學(xué)霸師資,針對(duì)學(xué)生的薄弱科目和學(xué)校教學(xué)進(jìn)度,匹配背景相符的導(dǎo)師,根據(jù)學(xué)生情況進(jìn)行1V1專(zhuān)屬備課,上課時(shí)間靈活安排,中英雙語(yǔ)詳細(xì)講解課程中的考點(diǎn)、難點(diǎn)問(wèn)題,并提供多方位的課后輔導(dǎo),輔助學(xué)生掌握全部課程知識(shí),補(bǔ)足短板。
相關(guān)熱詞搜索: