日本免费精品视频,男人的天堂在线免费视频,成人久久久精品乱码一区二区三区,高清成人爽a毛片免费网站

在線客服

計算機視覺論文

引論:我們為您整理了1篇計算機視覺論文范文,供您借鑒以豐富您的創作。它們是您寫作時的寶貴資源,期望它們能夠激發您的創作靈感,讓您的文章更具深度。

計算機視覺論文

計算機視覺論文:計算機視覺下食品工業論文

1計算機視覺技術概述

1.1自動化程度高

計算機視覺可以實現對農產品的多個外形和內在品質指標進行同時檢測分析,可以進行整體識別、增強對目標識別的性。

1.2實現無損檢測

由于計算機視覺技術對農產品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。

1.3穩定的檢測精度

設計的運行程序確定后,計算機視覺技術的識別功能就會具有統一的識別標準,具有穩定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。

2計算機視覺技術在食品檢測中的應用

20世紀70年代初,學者開始研究計算機視覺技術在食品工業中的應用,近幾十年電子技術得到快速發展,計算機視覺技術也越來越成熟。國內外學者在研究計算機視覺技術在食品工業中的應用方面主要集中在該技術對果蔬的外部形態(如形狀、重量、外觀損傷、色澤等)的識別、內部無損檢測等方面。國內有關計算機視覺技術在食品業中的應用研究起始于90年代,比國外發達國家晚20多年,但是發展很快。

2.1計算機視覺技術在果蔬分級中的應用研究

計算機視覺技術在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的較大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規定的5mm分類標準差,可在工業生產中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術在蘋果檢測與分級中的應用,結果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規律為理論基礎,結合模糊聚類知識利用計算機視覺技術來檢測蘋果缺陷域,檢測不僅快速而且結果。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術進行檢測,計算機視覺技術還可以將蘋果按照檢測結果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術、圖象處理技術、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術、遺傳算法、多層前饋神經網絡系統,實現了具有度高、靈活性強和速度快等優點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術、計算機視覺技術和圖像分析技術相結合的方法檢測蘋果表面的機械損傷和果實內部的腐爛情況,初步驗證了計算機視覺技術檢測蘋果表面的損傷和內部腐爛是可行的。馮斌等[11]通過計算機視覺技術對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統的檢測方法速度快、率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結果顯示率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關性,然而根據相關性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數據,對蘋果的外徑、體積、以及圓形度等參數進行處理,與人工檢測相比,計算機視覺技術具有檢測效率高,檢測標準統一性好等優點。Blasco.J[15]通過計算機視覺技術分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統、輸送轉換系統、輸送翻轉系統、差速勻果系統和分選系統,研制出一款適于實時監測、品質動態的智能分級系統,能夠很好地實現蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關系,應用計算機視覺技術檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其率均為92%,按果面損傷分級的率分別為76%和80%。

2.2計算機視覺技術在禽蛋檢測中的應用研究

禽蛋企業在生產過程中,產品的分級、品質檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術可以很好的解決這類產品工業生產中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態濾波和BET算法等優化后的圖像處理技術,獲得裂紋形狀并判斷,試驗結果表明,計算機視覺技術對雞蛋蛋殼裂紋的檢測率高達98%。汪俊德等[19]以計算機視覺技術為基礎,設計出一套雙黃雞蛋檢測系統。該系統獲取蛋黃指數、蛋黃特征和蛋形尺寸等特征,和設計的數學模型對比來實現雙黃雞蛋的檢測和識別,檢測率高達95%。鄭麗敏等[20]人通過高分辨率的數字攝像頭獲取雞蛋圖像,根據圖像特征建立數學模型來預測雞蛋的新鮮度和貯藏期,結果表明,計算機視覺技術對雞蛋的新鮮度、貯藏期進行預測的結果率為94%。潘磊慶等[21]通過計算機視覺技術和聲學響應信息技術相結合的方法檢測裂紋雞蛋,其檢測率達到98%。MertensK等[22]人基于計算機視覺技術研發了雞蛋的分級檢測系統,該系統識別帶污漬雞蛋的正確率高達99%。

2.3計算機視覺技術在檢測食品中微生物含量的應用研究

計算機技術和圖像處理技術在綜合學科中的應用得到快速發展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業中計算機視覺技術在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術為基礎,設計了一套應用計算機視覺技術快速定量檢測食品中大腸桿菌的系統,該系統檢測結果與傳統方法的檢測結果具有很好的相關性,但與傳統方法相比,可以節省5d時間,檢測時間在18h以內,并且能夠有效提高產品品質。Lawless等[24]人等時間段測定培養基上的細胞密度,然后通過計算機技術建立時間和細胞密度之間的動態關聯,利用該關聯可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態,根據菌落的邊緣形態計算機可以顯示被檢測菌落的具體位置,并且根據動態關聯計算機視覺系統可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術用于豬肉的分級進行了研究,結果顯示計算機視覺技術在識別豬肉表面微生物數量上與國標方法檢測的結果顯著相關,該技術可以有效地計算微生物的數量。Bayraktar.B等[26]人采用計算機視覺技術、光散射技術(BARDOT)和模式識別技術相結合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態特征有,對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經網絡、圖像處理等技術,用分辨率為520萬像素的數字攝像機拍攝細菌內部的染色效果,并結合新的圖像處理算法,對細菌形態學的8個特征參數進行檢測,檢測結果與傳統檢測結果顯著相關(相關系數R=0.9987),和傳統檢測方法相比該方法具有操作簡單、快速、結果、適合現場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數量進行識別,并以此作為衡量乳制品質量是否達標的依據,并對產品進行分級。

2.4計算機視覺技術在其他食品產業中的應用研究

里紅杰等[30]通過提取貝類和蝦類等海產品的形狀、尺寸、紋理、顏色等外形特征,對照數學模型,采用數字圖像處理技術、計算機識別技術實現了對貝類和蝦類等海產品的無損檢測和自動化分類、分級和質量評估,并通過實例詳細闡述了該技術的實現方法,證實了此項技術的有效性。計算機視覺技術還可以檢驗玉米粒形和玉米種子質量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術對圖像進行分析評估,毛葉棗可食率的評估結果與運用物理方法測得的結果平均誤差僅為1.47%,因此得出結論:計算機視覺技術可以應用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數來研究薯片中丙烯酰胺的含量和褐變率的關系,結果顯示兩項參數相關性為0.989,從而可以應用計算機視覺技術來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業中得到廣泛應用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術對花生內部和外部采集圖像,并通過圖像對其外在品質和內在品質進行分析,并建立相應的數學模型,該技術在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等[36]人以國家標準為依據,通過數字攝像技術獲取豬肉的細菌菌斑面積、脂肪細胞數、顏色特征值以及氨氣等品質指標來實現豬肉新鮮程度的分級辨認。

3展望

新技術的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術在食品工業中進行應用開始,就遇到了很多問題。計算機視覺技術在食品工業中的研究及應用主要存在以下幾方面的問題。

3.1檢測指標有限

計算機視覺技術在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結果顯示,系統會把花萼和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。

3.2兼容性差

計算機視覺技術針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統和設備很難用于其它種類的果蔬,甚至同一種類不同品種的農產品也很難公用一套計算機視覺設備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發現其檢測桃子的率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術區分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。

3.3檢測性能受環境制約

現階段的計算機視覺技術和配套的數學模型適用于簡單的環境,在復雜環境下工作時會產生較大的誤差。Plebe等[43]利用計算機視覺技術對果樹上的水果進行識別定位,但研究發現由于光照條件以及周邊環境的影響,水果的識別和定位精度不高,不能滿足實際生產的需要。綜上所述,可看出國內外學者對計算機視覺技術在食品工業中的應用進行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學科,在研究和應用的過程中,取得了較大的經濟效益,也遇到了很多問題,在新的形勢下,計算機視覺技術和數碼拍攝、圖像處理、人工神經網絡,數學模型建設、微生物快速計量等高新技術相融合的綜合技術逐漸成為了各個領域學者的研究熱點,以計算機視覺為基礎的綜合技術也將在食品工業中發揮更加重要的作用。

作者:姚瑞玲 單位:四川工商職業技術學院

計算機視覺論文:雙目計算機視覺的自適應識別算法及其監控應用

摘要:雙目計算機視覺是利用仿生學原理,通過標定后的雙攝像頭來得到同步曝光圖像,然后計算獲取的2維圖像像素點的第3維深度信息。為了對不同環境場景進行監控提出了一種新的基于雙目計算機視覺的自適應識別算法。該算法首先利用像素點的深度信息對場景進行識別判斷,然后采用統計的方法為場景建模,并通過時間濾波克服光照漸變,以及通過深度算法特性克服光照突變。與單攝像頭監控系統相比,利用該算法實現的視頻監控原型系統,可應用于更多場合,并利用深度信息設置報警級別,來降低誤檢率。

關鍵詞:雙目計算機視覺 深度信息 自適應 光照變化 視頻監控

1、引 言

面對日益復雜的社會和政治環境,國家安全、社會安全、個人人生安全和財產安全等都面臨著不同程度的威脅,都需要各種安全保護措施,在眾多場所建立切實有效的安保措施,成為一個迫切的課題。本文提出了一種基于雙目計算機視覺的自適應識別算法,將該算法應用于現有的監控系統,并賦予監控終端智能性,不僅使其脫離人而具有獨立智能、自主判斷的能力,而且使得視頻監控系統在安防方面的作用大大提高。

在現有的背景建模方法中,大多對于背景象素點的亮度值,例如最小亮度值、較大亮度值和較大亮度差值[ 1 ] ,或是對顏色信息進行建模[ 2 ] 。對于背景的更新,一般使用自適應濾波器對像素的統計特性進行遞歸更新,為了考慮到噪聲的影響,文獻[ 3 ]提出了Kalman濾波器的方法,該文認為系統的信息可通過估計獲得??紤]到環境的動態緩慢改變,文獻[ 4 ]利用統計模型給背景建模,即由一個時域濾波器保留著一個序列均值和一個標準偏差,并通過濾波過程統計值隨時間改變來反映環境的動態特性。另外有一些方法解決了光照漸變等影響[ 5~7 ] ,但計算較復雜。

2、雙目計算機視覺深度算法

基于實際應用考慮,攝像頭的數量關系著成本和計算量,所以選擇支持雙攝像頭(雙目視覺)的算法是最合適的。在支持雙目視覺的算法中,Princeton NEC research institute 基于較大流算法(maximum2flow)的計算機視覺算法( Stereo2MF)在深度效果平滑性上做得較好[ 8, 9 ] ,適用于監控區域深度計算的應用背景。但原有算法所需的計算量和計算過程中的暫存數據量是較大的,雖然支持計算量的削減,但只是機械地在一塊區域中選擇中心點來進行計算,這樣計算的結果會因選擇的機械性,而出現大量的“偽點”,這些偽點錯誤地表現了該區域的平均深度信息。本文采用統計平均值選取計算點,通過距離因子的Gauss分布將塊內其他點的值融合計算,從而使得計算出的值較的代表了這一塊內的大致深度分布。

m, n分別是圖像的長和寬所包含的像素點個數,M、N 表示像素點的橫縱坐標, .d 是塊內深度統計平均值, dM, N為計算點的深度值, q為距離因子, dB是計算所得的塊深度代表值。圖1為改進后雙目視覺深度算法與原算法識別效果比較。由圖1可以明顯看出,修改后的算法效果在細節表現、平滑性、偽點減少上均有明顯改善,而且深度計算度能夠滿足視頻

圖1 改進后雙目視覺深度算法與原算法識別效果比較Fig. 1Effect comparison after algorithm modification

度計算度能夠滿足視頻監控應用的需要。

3、自適應識別算法

對于一個固定的場景,場景各像素點的深度值是符合一個隨機概率分布。以某一均值為基線,在其附近做不超過某一偏差的隨機振蕩,這種情況下的場景稱之為背景。而場景環境往往是動態變化的,如環境自然光的緩變,燈光的突然熄滅或點亮,以及運動對象的出現、運動和消失等。如果能識別出場景中的動態變化,就能自適應的更新背景值,將光照的改變融合到背景值中。本文采取了用統計模型的方式給每個像素點建模,而以像素點變化的分布情況來確定光照突變引起的深度突變,并結合深度計算本身特性,解決光照緩變突變引起的誤判問題,以及判別場景中對象的主次性。

3. 1 背景象素點的深度值建模

由于雙目計算機視覺算法得到的深度值,已經是塊融合的,可以根據精度要求,來加大塊面積, 減少數據量。本文獲得的數據量只有原像素點的( k, l分別是塊的長和寬所包含的像素點個數) 。以統計的方法給每個像素點的深度值建模, 設為第u幀圖像的某個像素點的深度值, 其中u代表第u幀圖像, i, j分別代表像素點的橫坐標和縱坐標。由一個時間濾波器來保持該像素點深度值的序列均值和時間偏差

其中,α是一個可調增益參數, 其與采樣頻率有關。通過濾波過程,來得到每個像素點的深度值基于時間的統計特性,由于這些統計特性反映了環境的動態特性,據此可以了解到是環境的光照發生了突變,還是有運動對象的運動。

3. 2 背景更新與場景識別

通過上述濾波過程,就可以將光照緩變融入到背景中去,實現背景的自適應更新。而對于光照突變,此時幾乎所有的象素點的亮度值會同時增大或減小,但根據較大流算法的特性,同方向的變化對流量差不會引起太大變化, 而對深度計算結果只會引起較小的同方向變化。這種全局的等量變化, 可以認為是光照突變引起的。

其中, a、b和c是3個可調節系數,他們的取值可依據場景的情況及檢測光照突變的速度與誤差來進行選取。s, t分別是深度圖像的長和寬所包含的像素點個數。Q是符合式( 9)的像素點個數。一旦檢測到環境光照發生了突變, 就把背景點像素的深度序列均值,全部以當前幀像素點的深度值的測量

值代替,而j以0取代,從而實現背景的及時更新。

如果式(10)式(12)中任意一個不成立的話,則認為像素塊深度值的變化并非由光照突變引起, 而是場景中有運動對象出現。

4、算法分析與實驗

4. 1 算法復雜度

對于光照突變檢測,若有突變的話,則會立即檢測出來,當有運動對象出現時, 并且式( 10)式( 12)都接近滿足時,處理會較慢,因為需要處理突變檢測和運動對象兩個過程。當b取25% s ×t時的處理速度與變化點比例關系如圖2所示。

相對于一般的光強、灰度的識別檢測算法,本算法的優勢在于不僅可以利用深度特性更容易地檢測到光照的漸變與突變, 而且可以判斷出現的多個運動對象的主次性。

4. 2 算法誤檢率

由于光照直接對于像素點的光強、灰度等產生影響,所以深度算法的噪聲容限更大,這樣可降低了誤檢率,多組實驗后得到的誤檢率對比圖如圖3所示。但是由于深度算法本身對于反光或者陰暗面會產生偽點,所以,某些時候由于光照突變中光源的位置變化而會誤檢為運動對象,為此算法還需進一步改進能判別偽點的出現, 除去它在光照突變檢測中的影響。另外,公式中可調系數a, b, c的選取也會對不同場景產生影響。

筆者在實驗室環境下做了不同光照角度、不同環境光強度、不同運動物體的多組實驗,發現在反光面或是陰暗面較多的情況下,光照突變檢測不是很靈敏,而且會出錯,但是在增加系數a, c的值后, 誤檢率有所降低(如圖3所示) 。

5、基于算法的監控系統

我們利用該算法實現了視頻監控原型系統。計算機視覺算法對于攝像頭的同步曝光要求很高,所以本系統終端用一塊單獨的MCU (micro control unit)控制同步曝光。核心算法用DSP處理。系統結構如圖4所示。實際系統原型圖如圖5所示。

6、結 論

利用深度信息做智能場景識別,是一種新的嘗試,有其優勢。將這種方法應用到智能視頻監控中,能起到很好的效果,克服了其他方法較難處理的光照漸變和突變等問題。對比單攝像頭監控系統,該系統可應用于更多場合。后續研發準備在系統上加上更多功能,以適用于更多的環境,并與其他 保安類監控系統互聯,以組成一整套功能強大、達到國內外水平的安防系統。

計算機視覺論文:基于計算機視覺的虛實場景合成方法研究與應用

論文關鍵詞:虛擬現實 混合現實 計算機視覺

論文摘要 :開發了一種虛擬場景與實時視頻之間的合成技術,成功地將該技術應用于虛擬規 劃系統中,詳細介紹了系統所采用的基于計算機視覺的標識識別和實時、自動攝像機位置、姿態跟蹤算法,并給出了系統運行結果。

0 引 言

虛擬現實技術 的最終目的是使用戶沉浸在一個 由計算機生成的虛擬環境中,該技術已經被成功地應用到軍事、教育、娛樂等眾多領域。隨著應用 的增多 ,虛擬現實技術 的缺陷也逐漸暴露出來,主要表現在如下兩個方面:(1)虛擬現實 中的場景由計算機生成,隨著繪制場景真實程度的提高,對系統硬件配置的要求也相應提高,從而形成了繪制效果和實時性兩個同等重要又難以同時解決 的問題 。(2)交互方式受限.鼠標、鍵盤等傳統輸入設備并沒有提供給用戶一種直觀 自然的交互方式,而數據手套等較為昂貴的外圍設備不僅使用起來不方便,而且對工作范圍也有一定的限制。

混合現實 技術的出現很大程度上解決了以上兩個問題,它將計算機生成的虛擬場景、提示信息實時疊加到用戶所能觀察到的真實世界當中,并以此來增強用戶視覺感受 。在混合現實環境中用戶所能觀察到的主體是來源于真實世界的圖像信息,虛擬場景只起到輔助、提示作用,因此不需要真實感圖形繪制所需的高端的硬件配置。另一方面,由于圖像信息來源于真實世界,這就使得用戶本身能夠很自然地融合到整個系統中,并且能夠 以一種 自然 、直觀的方式與系統交互,而不必添加額外的硬件設備。正是由于以上特性,混合現實技術已經被應用到眾多領域當中,而且能夠比虛擬現實更好地完成某些任務,如交互式規劃、動態虛擬展示等。

一個實用的混合現實系統所必須具備的特性之一是幾何一致性,即系統必須實時地判斷攝像機相對于真實世界的位置和姿態.以便將虛擬場景正確地疊加到真實世界的具體位置上,使得用戶從感官上認為虛擬場景確實是真實世界的一部分。傳統的方法是利用硬件設備(電磁式、機械式跟蹤系統)來獲取攝像頭位置信息,但這些方法不僅工作范圍受限,而且求得的結果也不夠。本文采用當前流行的基于計算機視覺的方法來獲取位置信息,事實證明該方法是有效、可行的。

系統結構及工作流程

筆者構建 了一個如圖 1所示的混合現實原型系統,主要由如下幾個部分組成:(1)平面標識塊:一個帶有黑色邊框的正方形.尺寸、內部圖案由用戶定義,主要功能是使系統能夠根據實際圖像中標識的變形來計算虛實配準所需的位置、姿態信息,同時還可以用不同的內部圖案代表不同的虛擬場景,以增強系統的實用性。(2)圖像采集設備(攝像機):主要完成實時視頻采集功能。(3)圖形渲染系統:生成與視頻合成所需的虛擬場景。(4)虛實合成:利用攝像機位置、姿態信息將視頻與虛擬場景相融合。(5)顯示設備 :包括頭盔式顯示器以及桌面臺式顯示器,用以將虛實合成的影像展現給使用者。

系統運行過程中,首先將采集到的一幀彩色圖像轉換成一幅二值(黑 白)圖像,然后對該二值圖像進行連通域分析,找出其中所有的四邊形區域作為候選匹配區域,將每一候選區域與模板庫中的模板進行匹配,如果產生匹配,則認為找到了一個標識,在生成與該標識對應的虛擬場景的同時利用該標識區域的變形來計算攝像機相對于已知標識的位置和姿態,根據得到的變換矩陣實現虛實之間的無縫融合。

2 標識識別與攝像機位置、姿態跟蹤算法

由上一節可知,構建該系統有兩個關鍵問題需要解決 ,即如何識別標識內部的不同圖案以生成與之對應的虛擬場景 以及如何利用標識的變形計算虛實配準所需的坐標變換關系。以下分別介紹以上兩個問題的解決方法。

2.1標識識別

本系統 所采用的標識識別方法可 以分為以下幾步。

2.1.1圖像二值化

首先對采集到的彩色圖像進行二值化,處理成黑白(0,1)圖像,如圖 2(b)。具體方法為:設定一個 閾值,對圖像進行遍歷 ,根據該閾值,對圖像重新賦值。為了克服光照對識別結果造成的影響,同時采用 了自適應閾值法 來提高系統穩定性,設定當前 閾值 為上一幀圖像中標識投影區域像素灰度的平均值,實驗證明該方法對改善系統性能有較為明顯的效果。

2.1.2連通域分析

連通域分析的 目的是從復雜背景中提取標識的投影區域。分析過程為:查找所有像素值為 1的連通區域,首先根據大小約束對區域進行預篩選,然后利用最小二乘直線擬合法篩選出所有四邊形區域 ,結果見圖 2(c)。

2.1.3 區域規則化與模板匹配

區域規則化是將圖像中經過投影變換的標識區域變換到標準模板空間,本文利用仿射變換 將標識經過投影變形后 的區域直接映射到一個 64×64大小的正方形模板,效果見圖2(d)。接下來的工作是將規則化圖像與模板庫中的模板進行匹配,以返回代表不同虛擬場景的 id值。本文采用相關系數法來完成匹配工作,方法如下:

首先利用以下四式計算規則化圖像 i和標準模板圖像 p各自的均值和方差。

然后計算兩幅圖像的相關系數 p,本文選擇所有模板中與規則化圖像具有較大相關系數 p且 p>0.5的模板作為當前匹配結果,并返回與之對應的 id值

2.2攝像機位置、姿態估計

首先給出系統的坐標變換關系如圖 3所示。規定平面標識在世界坐標系中的位置為已知,攝像機位置、姿態計算問題轉化為攝像機坐標系與世界坐標系之間三維變換矩陣的求解。

世界坐標 系與攝像機坐標系間的變換關系可以用式(5)表示。其中 w為世界坐標系下某點坐標,c為該點在攝像機坐標系中的位置,t :[r r r:t] 為待求三維變換矩陣,包含三個旋轉分量和一個平移分量。

c=t w (5)

由于規定平面標識與世界坐標系下的z:0平面重合 ,則由式 (5)可得 ,平面標識上的某點在世界坐標系下的坐標 wi=(x ,y wi,0,1) 與其在攝像機坐標系下坐標 c;:(x y z i,1) 之間的關系可以表示為式(6)。

有 8個待定系數,由標識的 四個角點可得 如下 方程組 ,則可以求取以上 8個未知數。

通過上述計算可以確定變換矩陣中的 r ,r ,t,三個分量,由變換矩陣旋轉分量的正交性可以求得r :r ×r ,需要對所求得的結果作歸一化操作以消除比例因子 t 對計算結果的影響,方法是將(1 r l+l r 1)/2去除以上各分量。

事實上由于不可能避免成像畸變以及圖像處理過程中的誤差,上述方法求得的變換矩陣 t 是不夠的。解決方法是利用上述方法求取及時幀圖像對應的 t ,在后續計算過程中采用非線性最小二乘法求取后續幀的對應的變換矩陣。誤差逼近計算公式見式 (1 1)。

式中(文 i)(i=0,1,2,3)為根據上一幀t 求得的標識四個角點在像平面坐標系下的位置,(x i,y ;)(i=0,1,2,3)為實時檢測到的標識角點在圖像中的位置。本 文利用勒溫伯格一馬闊特方法求解式(11)。

3 應用實例——基于混合現實的小區規劃系統

傳統的住宅小區規劃方法之一是制作規劃方案模型,但是制作實體模型不僅費時費力,而且修改起來也極為不便。近年來,基于虛擬現實技術的小區規劃方法已經逐漸為設計者所接受,它一定程度上解決了實體模型規劃方法的缺點,但是由于缺乏高效、自然的人機交互方式,使得規劃效果大打折扣?;旌犀F實技術的出現為小區規劃提供了新的契機,它既繼承了虛擬現實技術的三維表現能力,又具有虛實結合的特點,能夠在真實的規劃場景中整合設計要素,給設計者和方案評估者以直觀的感受。

筆者利用本文方法開發了一套基于混合現實技術的虛擬小區規劃系統。系統中不同的標識對應不同的虛擬建筑模型,用戶可以在視線范圍內隨意移動模型.從而實現不 同的規劃 方案 。運行效果 如圖4該系統滿足了小區規劃對虛實交互、人機交互的要求,充分體現出混合現實技術在小區規劃應用中的優勢。

4 結束語

本文設計 了一種基于計算機視覺的虛實場景合成方法,具有實時性好、可用性高等特點,當前系統中存在的主要問題是虛擬場景與真實場景之間還沒有遮擋和碰撞關系 ,從 而影響 了系統 的真實感 ,下一步的工作是對虛實之問的遮擋和碰撞檢測問題展開研究。

計算機視覺論文:計算機視覺技術在科學教育的作用

摘要近年來,人們對技術科學教育問題產生了很大的困擾,因為正確的科學技術的傳承影響著祖國下一代科技的發展。正在此時,一種類似研究如何使系統從圖像或多維數據中“感知”的科學,即計算機視覺技術迅速崛起,并被廣泛地應用于各個領域。其中最重要的是一個基于BSD許可(開源)發行的跨平臺計算機視覺庫OpenCV,本文主要介紹的就是通過利用OpenCV中的相關算法,能夠帶來的巨大價值以及此項技術在現代科學教育方面所發揮的重要作用。

關鍵詞OpenCV;科學教育;推廣價值

1、OpenCV庫簡介

OpenCV是由Intel微處理器研究實驗室的視覺交互組開發的一個跨平臺計算機視覺庫,它的代碼都是開源的而且都經過非常好的優化,并且具有很好的移植性,可以根據需求導入到合適的環境中使用。它可以實現有關圖像識別與處理和計算機視覺技術方面的很多通用算法。它的優勢是可以運行在當代社會使用熱門的各大操作系統上,適用性強,還可以脫離外部庫而獨立運行。OpenCV的C和C++都是經過優化的開源代碼,采用靈活的接口,提升計算機的運行速度。其中包含的函數就有500多個,包括的種類有C和C++等。OpenCV因為免費面向市場,已經被社會各界廣泛使用?,F已應用于人機互動、圖像識別、圖像分割、目標追蹤、3D重建、機器視覺、結構分析等數個領域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數,運用于各種數據類型的計算。②cv:圖像處理和計算機視覺功能。③ml:機器學習模塊,主要內容是分類器。④cvaux:包括大部分實驗性的函數,例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持攝像頭的讀取和轉換。

2、OpenCV處理圖像的功能

OpenCV中有很多的函數,可以實現很多不同的功能,其中具有學習價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。

2.1加載圖像

不同類型的圖像有著不同的內部結構。我們需要根據圖像的結構采用合適的方法將圖像文件中的數據讀入內存。OpenCV中的cvLoadImage()函數,可以加載圖像數據。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結構體的指針形式返回,大大方便了后續處理的過程。2.2顯示圖像加載圖像后需要通過函數使其顯示。cvNamedWindow()函數由HighGUI庫提供,它可以在屏幕上創建一個窗口,將圖像顯示出來。cvShowImage()函數的作用是在這個創建的窗口中顯示出加載過后的圖像。觀察圖像時經常用到的重要函數還有可以使程序暫停的函數cvWaitKey(),以及用于釋放內存的函數cvReleaseImage()和cvDestoryWindow(),掌握并運用這些函數,就可以輕松的實現觀察圖像的功能。

2.3處理圖像

OpenCV中包含的多種函數,可以達到圖像處理技術方面的很多效果,包括圖像灰度化函數cvtColor(),邊緣檢測函數Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數addWeighted(),放大縮小函數resize(),閾值化操作函數imshow()等等。適當選用合適的函數并加以運用即可達到目標所需。

3、OpenCV的推廣價值體現

OpenCV可以應用在社會的各個領域,價值就體現在每個科學的產物當中。舉個近在身邊的例子,隨著社會的發展,生活質量的提高,人們的居住環境也在逐漸改善,樓層越蓋越高,無數摩天大樓,商業大廈群起而立,電梯已經成為了我們日常生活中必不可少的工具。盡管現在電梯的功能、質量不斷地提升,但是仍然存在些許不足,當我們在學校的教學樓內等電梯時發現了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運行或是閑置??墒谴藭r這一臺電梯只能容納有限數量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導致了有部分人無法及時地坐上電梯,需要繼續等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補這個不足,首先通過硬件設備連接拍照捕獲候梯人像,后臺運行判斷出候梯人數,然后運用語言編程來確定調動電梯的個數,從而來達到實現自動控制每個電梯的運行的目的,使所有人都能在及時時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務。我們將OpenCV導入編程環境,其次修改電梯工作系統的運行程序,將軟件與硬件設備相連通,這樣通過調度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節約人們的候梯時間,方便學生、老師上課,而且可以合理有效地調度電梯,使電梯的價值得到較大化。見微知著,OpenCV可以應用在每個領域,對各界的發展起到推動作用,造福社會的科技發展,方便人們的生活。

4、科學教育存在的問題

在歷年的教學模式中,老師們往往會強調理論知識的重要性,但卻忽略了對學生使用動手能力的培養,學生不能獨立完成實踐性的技術操作,也就是說教學模式缺乏實踐性。只有將理論與實踐相結合,才能實現知識價值的較大化,因此,應當在教學中配合著實踐課程,舉一反三,讓學生們更加深刻地學習和了解所學到的知識。而如今雖然一部分學校也開設了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機技術實踐方面的知識,學生們也沒有真正擁有動手實踐能力,這使學生們的技術知識十分受限。雖然現在多數學生對計算機略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術要求較高的一些軟件及工具卻全然不知,甚至對自己所學過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機學習更多的技能,這對青少年的發展實在是利大于弊的,而且這樣也失去了計算機的正向價值。因此,我們應該改變現有的教學模式,一邊教授理論知識,一邊配合指導學生動手操作,將理論與實踐相結合,也能讓學生更好地消化和吸收所學到的知識,并且引導學生正確使用計算機,發揮計算機的價值,讓學生們都能夠在計算機中獲得更多的知識。

5OpenCV開源算法庫在各個領域的實例化體現

OpenCV在醫學領域、軍事領域、安全防護領域等都有很大的重要意義。在醫學領域中,由于有了這個開源算法庫,我們可以盡可能地調用它,從而來進行圖像處理、對象檢測,讓醫生更好更快速觀測人體結構,及時發現病癥。在軍事領域中,大多數無人操作的機器運作,比如無人機飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進行處理,并進行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進步。在安全防護領域中,我們現實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監視報警系統等等,正是由于這些技術,讓我們的環境更加安全,這都是我們生活中息息相關不可缺少的?,F如今,國家的科學技術飛速發展,日益強盛,OpenCV的成績有目共睹,未來的發展需要科學技術的不斷推進,才能為祖國未來的其他事業提供強有力的后盾。

6OpenCV在科學教育中的作用

在文化改革的大背景下,文盲的概念早已從沒有文化轉變成了不會使用計算機。因為隨著科技的進步,計算機的使用已經越來越廣泛,計算機已經逐步取代了以往人工可以完成的許多工作,比如在超市生成的結賬單、用計算機控制動力系統的運行、人造衛星軌跡的計算等等,這些都依賴于計算機強大的功能。計算機的推廣證明著我國科技的發展和人類文明的進步,由此可見,計算機技術知識的掌握對現代人來說是十分重要的。如果想要成為一個真正有技術、有能力的人才,就務必要熟練掌握計算機技術的使用。但是目前當代社會的教育在計算機技術方面的內容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術知識的傳輸也相應減少,學生們的能力也因此日益下降。而科學教育,顧名思義,是使科學技術在教育過程中得以傳承。想要科學地教育學生,就必須要多多講授科學技術方面有關的知識。說到科學技術,它的重點自然是計算機技術,而OpenCV作為計算機視覺技術的核心,可以說也是計算機技術甚至科學教育中的一個重要部分。在教育中普及并傳承這個技術無疑可以提高學生們的技術水平。但是,相信有大多數的人在此之前從未聽說過計算機視覺技術,也并不了解OpenCV庫,更加不會學習到與之有關的技術知識。在這樣嚴峻的形勢下,我們更應該將類似OpenCV方面技術有關的知識通過教育傳遞下去。各大高校應積極開展有關計算機的活動,開設與計算機技術有關的課程。這樣才能根據社會的需求來培養更多的綜合性人才。如果可以將其投入到現代教育當中,定會使現在的教育事業更加輝煌,也能使祖國的未來更加璀璨。

計算機視覺論文:計算機視覺藝術在數字媒體的應用

摘要:現階段,隨著社會經濟水平的快速穩定發展,人們不能夠滿足物質方面的一些滿足,開始追求精神層面的追求。當生活與科技緊密的聯系時,設計以及藝術應該發展成為一個主流的趨勢,屬于有效滿足精神追求的一個關鍵環節。在本文中,簡單分析了計算機視覺原理,主要分析了數字媒體當中視覺藝術的實際應用,更好的讓人們感受到科技以及藝術所具有的魅力。

關鍵詞:視覺原理;計算機視覺藝術;數字媒體;應用

利用計算機所具有的視覺藝術,大眾僅僅利用需要實施身體動作來直接性的操作以及控制,根本就不需要學習就能夠啟動以及進行一定的操作,這樣更加方便老年人以及兒童的實際操作。在數字媒體當中,應該對計算機視覺藝術進行充分利用,更加方便人們的實際操作,同時還能夠保障其更好的感受藝術方面所具有的魅力,讓群眾在足夠放松的時刻能夠對創作者的實際思想以及意圖進行充分的了解以及掌握,對藝術價值進行充分發揮,進而來有效提升藝術人文的實際價值。

1對計算機視覺原理進行分析

通常來講,計算機視覺還稱為機械視覺,屬于是機械來對人類視覺進行一定的模仿的光學識別系統,利用光學系統、感應器、光源等來實現物體定位、動作的追蹤以及視線的判斷等相關的功能。一般情況下,工程技術所運用的基本都是計算機視覺,當有著一定的環境以及模式時,計算機視覺在進行持續性的工作時,能夠有效保障持續工作有著非常高的正確性以及性,還能夠對人工不可以完成的任務進行很好的完成。當計算機視覺在進行實際的工作過程中,最為基本的條件是先對映像進行處理,之后輸入模擬訊號,對數字影像進行一定的處理以及分析。實際的工作流程是:影像在攝入之后,應該對其進行一定的強化,除去噪聲,之后對圖像特征進行一定的壓縮以及獲取。在對數據庫樣本進行一定的對比之后,對程序進行有效的分析以及判斷,做出有效的指令。

2對數字媒體當中計算機視覺藝術的實際應用進行分析

2.1藝術與計算機進行一定的融合時,應該對動畫、聲音以及圖像等因素進行有效結合,在對藝術語言表現形式進行豐富的同時,應該提高作品的感染力

在有些結合視覺藝術以及數字媒體時,應該保障在對畫面進行觀看時,應該有效的欣賞畫面,還可以有效的感受到聲色等。利用高度仿真的聽覺、觸覺以及視覺,保障大眾在進行玩游戲時,可以對虛擬世界進行真實的感受,還能夠利用動作以及肢體語言等來和計算機實現有效的交流。保障大眾不是對電影單獨的進行欣賞,還應該更好的參與到其中,體會藝術的表演。

2.2在數字媒體當中運用計算機視覺藝術能夠對藝術的實際表達形式進行有效的豐富

隨著交互技術的逐漸成熟以及發展,讓該技術得到了有效的拓展以及廣泛的運用。運用交互技術,應該讓人們不受到被動的欣賞,應該積極的參與到視覺藝術當中,保障大眾的積極參與以及做出判斷,同能夠利用各種選擇來呈現出過程以及解決,對觀眾的興趣進行充分的調動,進而來有效提高大眾的參與積極性。

2.3在電子游戲當中,運用計算機視覺藝術,應該在相對比較大型的電子游戲當中進行計算機視覺技術的運用

在實際的游戲過程當中,大部分的玩家基本上不再是僅僅運用鍵盤以及鼠標來實施游戲,大部分都是利用身體行動來移動。通常情況下,機器利用攝像機部來對玩家的具體身體動作進行一定的捕捉,玩家能夠與機器相連接的手槍進行有效的操作,射中屏幕當中的對象。同時,手機上的相對比較小型的電子游戲,僅僅需要手指來滑動屏幕,就能夠實現實物的運動以及跳躍等,進而來躲避障礙。除此之外,僅僅需要稍微的傾斜一些收集,就能夠實現人物兩側的奔跑,同時還能夠保障聲光效果,實現互動,具有非常大的震撼力,會在很大程度上促進大眾參與的積極性。

2.4分析數字媒體中計算機視覺技術的應用,保障數字媒體技術有效表現藝術

同時在實用藝術以及純藝術當中,也會運用到數字媒體,該技術能夠讓相對比較單純的個人視覺實現有效的創造,同時還能夠把藝術箱社會性視覺產品進行轉化,并得到一定的經濟效益。同時,大眾能夠通過剪切以及拷貝等相關的方式來有效獲取視覺技術,之后有效的轉化藝術資源,有效奠定了創作視覺藝術的基礎。現階段,大眾對于個性化以及獨特性有著逐漸提高的需求,在對相對比較獨特的視覺技術進行追求時,在一定程度上提高了評價視覺作品的標準。在數字媒體當中運用計算機視覺技術,會在很大程度上提高大眾對美的享受,保障大眾能夠充分感受到舒適以及愉快的感覺,同時還能夠得到審美方面的評價,在該過程當中,不能夠參雜任何的因素,應該讓計算機視覺因素僅僅對視覺美感以及視覺形式進行充分的追求,可以有效體現藝術的本質。同時,數字媒體有著美方面的品格,有效結合計算機視覺藝術,保障數字媒體藝術的美以及真。這個實際的運用過程能夠有效提升審美方面的機制,更好的領悟視覺藝術當中所存在的美。

3結語

綜上所述,在數字媒體當中,計算機視覺技術的運用,應該有效結合圖像、動畫、聲音以及文本等多個因素,在對語言表現的具體形式進行一定的豐富時,應該讓作品具有更大的感染力。除此之外,還應該保障視覺技術有何足夠的光聲效果,利用一定的互動,會具有非常大的震撼能力,積極促進大眾的參與程度。還可以在很大程度上滿足大眾對于美方面的追求,進而對其所具有的藝術價值進行充分發揮,有效提升藝術所具有的人文價值。

計算機視覺論文:計算機視覺下圖像檢索技術分析

從某種角度來說,在計算機視覺領域,這類目標圖像檢索的研究是具有一定的挑戰與現實意義。它以計算機模擬人的視覺為基礎,對其中相關圖像的內容予以描述。在此基礎上,以描述的特點為參照,在眾多圖像中尋找那些感興趣的目標圖像。隨著計算機網絡技術不斷發展,它的應用范圍逐漸擴大。比如,網絡圖像檢索、醫學圖像的挖掘、不良圖像的過濾。但就當下計算機視覺下目標圖像檢索技術研究的現狀來看,并不樂觀,還有很長的路要走。可見,對計算機視覺下的目標圖像檢索技術予以分析是非常必要的。

1計算機視覺概述

1.1計算機視覺學概述

從某種意義上說,計算機視覺學是一門在20世紀60年代興起的新學科。它是一門邊緣學科,融入了很多學科的特點,具有很強的工程性特征。比如,圖像處理、應用數學、光電技術。換個角度來說,計算機視覺同屬于工程領域、科學領域。

1.2計算機視覺的應用

計算機視覺的應用能夠使計算機具有和人一樣的視覺功能。在生活和生產過程中,照片資料、視頻資料的處理是計算機視覺應用的主要方面。比如,在航空事業方面,對衛星照片的翻譯;在醫學領域中,主要用于輔助性方面的診斷;在工業生產方面,由于各種復雜因素的影響,計算機視覺在這方面的應用顯得特別簡單,有利于相關系統的實際構成。

2目標圖像檢索存在的問題

從某種角度來說,目標圖像檢索需要分為特征匹配、特征提取兩個方面。它們表達了不同的含義。對于特征提取來說,它是圖像進行檢索的及時步,其提取結果會對進一步的研究造成直接的影響。而對于特征匹配來說,其匹配的度會直接影響圖像檢索系統的返回結果。但在目標圖像檢索完善的過程中,遇到一些問題阻礙了這兩個方面的完善。因此,本文作者對其中的一些予以了相關的探討。

2.1環境因素不斷變化

對于目標圖像來說,環境因素是影響其率的重要因素。同時,在復雜混亂的環境中,由于受到眾多干擾物的影響,加上部分目標圖像區域被遮蓋,致使目標圖像信息不夠,使目標物體特征的提取難度進一步加大。

2.2圖像噪聲的影響

子為了更好地模仿生活中的圖像檢索,數據庫中的圖像也會隨之發生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會使目標物體的外觀發生對應的變化。在此基礎上,嚴重降低了目標圖像信息獲取的度。

2.3目標圖像檢索訓練數據的自動標注

由于處于網絡中的圖像資源信息過于繁多,需要采用手工的方式對它們進行標注。但這種方法非常浪費時間,率也比較低。很顯然,這就需要目標檢索圖像能夠具有自動標注的能力。實際上,圖像檢索方法過分依賴人工標注信息。而這些信息很多收到來自各方面因素的影響。比如,認識差異因素、個人經驗。以至于對圖像產生誤解。

3基于計算機視覺下的目標圖像檢索技術

3.1以多尺度視覺為紐帶的目標圖像檢索方法

該種目標檢索技術的應用主要是為了提高目標圖像檢索的率,能夠實現目標圖像訓練數據的自動化標注。該類技術主要是用于那些沒有遮擋,不需要進行監督的目標圖像檢索方面。具體來說,它需要經過一系列的訓練。在訓練的過程中,以統計學習為紐帶,對相應多尺度的目標檢測模型進行適當的訓練。在此基礎上,以該模型為基點,對圖像中那些顯著性的區域進行合理地提取。比如,該區域的亮度、顏色。,需要對用于該實驗研究中的概率潛在語義分析模型進行合理地利用??傊?,利用這種檢索方法可以對圖像中那些顯著目標所處的區域自動進行檢測。同時,對其中目標圖像的顯著性進行合理地排序,能夠提高檢索引擎所返回圖像結果的度。

3.2以彩色LBP局部紋理特點為媒介的目標圖像檢索方法

這種目標圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關因素對所提取紋理特征的影響,提高了圖像目標的率。對于這種圖像目標檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機地相融合。在此基礎上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉特點。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時,這種目標圖像檢索方法的應用可以使對應計算方法的難度得以降低,還能對角度等變化狀態下的目標圖像進行地識別以及檢索。

3.3以視覺一致性為橋梁的目標圖像檢索方法

從某個角度來說,它的應用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結果的目標顯著圖予以的計算。此外,還要對其中的目標顯著系數進行適當地過濾。二是:以所有圖像為基點,以顯著目標為導向,采取視覺一致性的模式。三是:以視覺一致性為基礎,對其中的不同目標圖像信息進行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結果的率。更重要的是,在提高圖像搜索引擎檢索性能的同時,能夠及時為用戶選出的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關。

4結語

總而言之,在新時代下,基于計算機視覺下目標圖像檢索技術的研究與實踐應用有著非常深遠的意義。這些檢索方法的應用能夠有效地解決目標圖像檢索存在的問題。以此,使我國在該方面的研究不斷完善,更好地發揮自身的實踐價值。同時,在信息大爆炸的時代,成為人們及時而有效獲取目標圖像資源信息道路上重要的基石。,作者希望本文在豐富廣大讀者朋友們內心世界的同時,也能喚起他們對此的思考以及展望。

作者:單位:??诮洕鷮W院

計算機視覺論文:計算機視覺教學改革分析

人類從外界獲取的信息中70-80%來源于視覺,因此,使計算機具備人類視覺的功能具有巨大的應用價值。近年來,計算機視覺技術市場前景明朗,需求日趨廣泛,計算機視覺領域工程師人才供不應求。在此背景下,國內外高校大多都開設了這門課程,深受學生歡迎。傳統計算機視覺課程根據Marr理論框架,圍繞由2D圖像獲取3D信息的基礎理論展開教學。通常,計算機視覺的目標設定為獲取3D場景的有用信息,如深度、結構、運動、表面朝向等。經過多年工程碩士及本科教育發現,以工程應用能力培養為目標的工程師培養中,傳統計算機視覺教學中尚存在如下問題:

(1)課程內容方面:工程應用價值較小的內容居多;具備工程應用價值的方法,如基于結構光的3D信息獲取,在課程內容中卻極少出現。

(2)課程定位方面:現有課程體系中未能體現近期研究成果,而掌握世界近期工程應用成果是工程師的基本要求之一。

(3)教學形式方面:傳統計算機視覺課程側重基本原理,盡管范例教學被引入到課堂教學中,在一定程度上幫助學生理解,但工程師培養目標是培養學生解決實際工程問題的能力。針對工程師培養目標,以及目前計算機視覺課程中存在的問題,本文提出工程應用導向型的課程內容、面向近期成果的課程定位、理論實例化與工程實踐化的教學形式,以培養具有扎實理論基礎及工程實踐能力的工程師。

1工程應用導向型的課程內容傳統計算機視覺課程圍繞Marr理論框架展開教學,其中部分原理僅在理想狀態或若干假設下成立,不能直接運用到工程實踐中。近年來已具備工程應用基礎的原理及方法,在傳統課程內容中較少出現,如已在工業測量、視頻監控、游戲娛樂等領域中應用的主動式三維數據獲取方法等。我們對工程應用價值高的課程內容,增加課時,充分講解其原理及算法,并進行工程實例分析;對工程應用價值較低內容,壓縮課時,以介紹方法原理為主。例如,在教授3D信息獲取部分時,課時主要投入到工程應用價值較大的內容,如立體視覺、運動恢復結構、基于結構光的3D信息獲取等;而對于基于陰影的景物恢復等缺乏應用基礎的內容主要介紹其基本原理,并引導學生進行其工程應用的可行性分析,培養學生縝密的思維習慣,訓練學生辯證的分析能力。

2面向近期成果的課程定位計算機視覺近十年來發展迅速,新方法和新理論層出不窮,在現有課程體系中未能得以體現。跟進世界近期成果是工程師的基本要求之一,因此計算機視覺課程定位應當面向國際近期成果。為實現這一目標,我們主要從以下兩方面入手。

(1)選用涵蓋近期成果的教材。我們在教學中加入國際近期科研成果及應用范例,在教材選取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作為參考教材。該書是RichardSzeliski教授在多年MIT執教經驗及微軟多年計算機視覺領域工作經驗基礎上所著,涵蓋計算機視覺領域的主要科研成果及應用范例,參考文獻近期引用至2010年。這是目前近期的計算機視覺著作之一,條理清晰,深入淺出,特點在于對計算機視覺的基本原理介紹非常詳盡,算法應用緊跟國際前沿。

(2)強化學生調研及自學能力。“授之以魚”,不如“授之以漁”。在教授學生的同時,更重要的是培養學生調研、跟蹤、學習并分析國際近期科研及工程應用成果的能力。為強化學生的知識結構,培養學生跟蹤國際前沿的能力,我們在教學中加入10%的課外學時,指導每位學生完成最近三年本領域的國際近期文獻調研及工程應用新技術調研,并撰寫相關調研論文。同時,設置2學時課內學時,讓每位學生介紹調研成果,并進行課堂討論。在調研基礎上,選擇相關算法進行了實驗證明,進一步強化學習成果。實踐證明,由于學生能夠根據自己的興趣,選擇本領域感興趣的課題進行深入調研,極大地調動了學生的積極性,強化了學生調研、跟蹤、學習并分析國際近期科研及工程應用成果的能力。

3工程實踐化的教學形式我們在教學中提出工程實踐化的教學形式,即以人類視覺功能為背景,由相應工程實例引出相關理論,并最終將理論運用到工程實例中的算法和方法傳授給學生。

(1)工程實例化的理論講解。在工程實例的系統功能基礎上,提出教學內容的命題;在關鍵技術及難點基礎上,講解基本原理及方法。在教學過程中,不斷穿插眾所周知的實例。例如,講解攝像機模型時,由“近大遠小”的原理,解釋青少年流行拍攝的“大頭照”,從上而下俯拍容易拍出視覺更美的“錐子臉”;由過近拍照產生面部變形,解釋鏡頭原理及畸變現象??茖W研究發現,大學生課堂注意力平均為10-15分鐘。課堂教學質量的優劣關鍵取決于教學效率,因此,抓住學生注意力至關重要。經過我們的教學實踐發現,大量學生熟悉并感興趣的實例引入后,學生的注意力會即時迅速提高,興趣大大提升。

(2)理論的工程實踐化。工程師培養的關鍵是利用所學算法與方法解決實際工程問題的能力。計算機視覺課程中介紹的方法大部分基于理想狀況的假設。在工程實踐中,生搬硬套將出現錯誤。因此,培養學生將理論進行工程實踐,是工程師培養中必不可少的一個環節。該過程不僅可以鍛煉學生的動手能力,更重要的是引導學生認識到理論知識與工程應用的距離,提煉并解決理論結合實際時需解決的關鍵問題。同時,工程應用中遇到的問題,往往不是一門課程內的知識可以解決的,需協同多門課程知識。這樣,可培養學生通匯貫通課程及相關領域知識,解決問題的能力。我們依托計算機視覺與模式識別實驗室多年來在該領域的研究基礎與實驗條件,對學生的工程實踐能力進行配套培養。主要包括兩個策略:利用10%的課內學時,選取相關經典工程實踐實驗,指導學生獨立完成;利用10%的課外學時,指導學生調研近期科研成果,指導學生分組完成仿真實驗。實踐證明,該過程加深了學生對理論的理解,大大提高了學生的成就感、學習興趣及工程實踐能力。4結論本文提出的計算機視覺課程教學方法是經過多年工程型碩士及本科教學實踐探索的經驗所得,并在三個班次進行了教學實踐。工程應用導向型的課程內容緊貼實際,所學即所用,極大地增強了學生的學習興趣及動手樂趣;面向近期成果的課程定位緊跟計算機視覺的技術發展,培養學生調研、跟蹤、學習并分析國際近期科研及工程應用成果,開闊學生眼界和思路;理論實例化與工程實踐化的教學形式,注重理論聯系實際的能力培養。教學實踐表明,上述方法對培養具有扎實理論基礎、理論結合實踐的工程實踐能力的工程師,起到了有別于傳統計算機視覺教學的良好效果。

計算機視覺論文:計算機視覺在交通領域的運用

近年來,隨著科技水平的提高,計算機視覺技術逐漸被人們熟知并廣泛應用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領域中,也對計算機視覺技術進行研究完善,將計算機視覺技術應用在交通領域各個方面中,并取得了顯著的成效。

1計算機視覺的概述及基本體系結構

1.1計算機視覺概述

通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。

1.2計算機視覺領域基本體系結構

提出及時個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。

2計算機視覺在交通領域的應用

2.1牌照識別

車輛的身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。

2.3統計公交乘客人數

城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態判斷

交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結論

本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。

作者:夏棟 單位:同濟大學軟件學院

計算機視覺論文:計算機視覺交互技術在企業日常工作中的應用

摘要:在現代企業的新產品開發,市場調研數據分析報告等集體智力活動當中需要很多的可視化的展示與溝通工作。目前很多情況下企業往往是采用傳統的PPT方式進行,這些PPT中大部分動畫都是單向無實時交互的。隨著現代計算機視覺識別和交互技術的發展,可以設計更好的交互展示系統,幫助企業改善復雜問題的溝通。

關鍵詞:計算機技術;視覺識別技術;交互技術;會議展示;智能辦公環境

在日常的企業辦公管理活動中,有很多時候需要可視化地展示企業市場計劃、新產品設計、數據分析報告等。盡管這些活動所需要的材料在事前可以經由辦公自動化軟件處理,但處理結果卻很大程度上只能由靜態的PPT展示和說明。但很多時候,這些展示和說明往往是多個部門不同專業背景的人員參與,于是展示材料制作的水平和質量就很大程度上影響到了參與者對所展示內容的理解和吸收程度。很多復雜的問題或者設計的展示,如果能采用互動交互的方式展示,在很大程度上能夠幫助問題討論的參與者對所討論問題更好的理解。這一點在常規的教育過程中已經獲得了充分的證實,相關的數據和結果可以從多媒體教學的優勢的相關研究中得到。同樣,企業中很多方案的討論,數據分析報告的說明其實對于企業而言也是一個方案設計者或數據研究分析者對相關人員類似教學的過程。采用現有企業常規會議設備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應的計算機視覺識別程序,我們可以將交互的投影演示引入到企業日常的展示討論活動中,增強溝通效果,提高工作效率,并且在技術上同樣的識別交互的程序配合上相應的員工面部特征的數據庫,還能擴展延伸到考勤或門禁系統中提供更加智能化的辦公環境。對于以展示溝通為主的教育培訓企業,通過配合一般人臉數據特征,可以通過攝像頭捕捉現場視頻并識別其中人臉識別,記錄現場關注展示內容的人員的數量,作為日后教學效果的自然客觀的評估參考。

1目前辦公信息化中存在的問題

1.1會議演示文稿展示時多人交互型差

目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統下的KeyNote、基于Linux操作系統的Openoffice中的Impress。它們主要的功能都是對輸入的文字、圖片聲音等多媒體進行編輯制作生成電腦上播放的多媒體幻燈片,盡管它們都具有強大的多媒體數據的處理能力,但最終制作的多媒體幻燈片在演示時都是“單向交互”的,即由播放者播放,而其中的內容及動畫按預先設計好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會需要有專人進行操作,浪費大量的時間和精力,但如果是配置專門的多點觸摸屏幕,則一來屏幕尺寸有所限制,二來費用相對較高容易造成設備的浪費。

1.2傳統辦公考勤與門禁系統的弱勢

目前企業常規的門禁系統與日??记谙到y往往是分離的,兩個系統使用了各自獨立的軟硬件環境,其中門禁系統使用的是攝像監控設備采集信息并通過專人24小時值班,其主要職能僅僅是監控辦公環境的人員進出并記錄下相應的影像資料。而企業日常的考勤系統則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機,這些打卡機多數是獨立工作,對于員工的考勤則需要人工根據卡片記錄情況統計。無論是員工自身打卡或者是統計考勤都是人工完成,有時還會出現錯誤和疏漏,同時主要的問題還在于容易出現代人打卡等作假的情況。所以,在傳統的辦公考勤與門禁系統獨立的情況下,兩個系統各自記錄各自的相關數據,同時投入兩套不同的軟硬件環境,有時這樣的辦公環境的信息化反而沒有給人員帶來便利,而是增加一項打卡簽到的日常任務。

2對存在的部分問題的分析和討論

2.1傳統演示設備缺乏交互型功能

由于很長一段時間硬件以及軟件的條件約束,電腦的鍵盤、鼠標完成了95%以上的數據輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設備。所以常規軟件設計和開發時都是把鍵盤、鼠標、顯示器/投影儀的輸入輸出組合當做幾乎所有使用情況下的模式。但隨著觸摸屏與多點觸控硬件的出現,多點觸控、屏幕的直接交互輸入輸出操作成了未來發展的一個趨勢,并且相對普通鼠標和單一顯示功能的顯示器用戶交互體驗明顯提升,人機交互界面更友好直觀。但是對于普通辦公中使用的投影儀,由于其投影的目標位置情況多樣,如果一體化的設計制造具有交互功能的互動投影儀其成本要比普通投影儀更高,對于解決互動操作的問題經濟上不是的。而大面積的多點觸控屏幕由于設備體積和重量的因素無法在需要靈活移動的新產品推廣談判等活動中使用,如果只是企業自身辦公環境中做普通會議展示的效果改進,其投入產出的效率也不理想。

2.2基于傳統輸入輸出設備的開發

由于長期以來人機交互都是以鼠標鍵盤為主,所以絕大多數程序開發設計都只考慮這種單一的輸入方式。但對于目前多媒體數據增多的趨勢,這樣傳統的輸入輸出模式就存在著很多弊端,其中最明顯的是對于多媒體數據的采集就需要單獨使用設備,采集后再人工處理。而為了簡化系統設計的復雜度,很多管理信息系統的數據采集和錄入主要基于鍵盤鼠標的錄入,如果出現非鍵盤鼠標錄入的數據則被要求人工進行數據格式的轉換,所以從一個側面也反映出一些企業排斥信息化,因為原本帶來效率提升與管理便利的信息系統,反而由于一些數據格式的錄入要求增加了人工勞動。如果直接使用現實當中的多媒體類的數據則系統又缺少相應轉換的功能。因為系統在考慮使用鍵盤鼠標錄入采集數據時已經默認了操作者來完成數據錄入前的標準化工作。但是實際上隨著現代計算機視覺以及人工智能、模式識別技術的發展和完善,過去無法識別的原始多媒體數據現在也可以由計算機識別并進行標準化的處理。

3運用計算機視覺技術改善人機交互

3.1低分辨率識別情況下改善會議演示交互效果

采用現代的計算機影像處理技術和方法,可以用普通的圖像采集設備配合程序識別影像當中的特定顏色區域的移動軌跡,并對軌跡做出判斷實現與計算機的交互。由于該識別只是需要識別圖像中的特定顏色的區域的運動,而非具體的形狀與細節,所以識別的難度相對不大,可以運用在會議的展示環境下,通過定位確定普通投影區域與特定顏色區域的位置關系,并通過圖形圖像的投影與變形運算,實現人與普通投影的交互。在環境背景比較清晰,圖像采集設備分辨率與色彩分辨比較靈敏的情況下還能更進一步對人體膚色和手的幾何特征進行識別,實現更加自然良好的人機互動交互,并且還能引入人工智能的模式識別算法,實現多人的互動交互,從而大大改善互動展示效果,實現更加人性化有效的溝通。特別在教育培訓行業,在現有普通硬件條件下能夠實現更加生動的教學講解演示,提高學生的課堂體驗激發更多興趣,改善教學效果。

3.2運用計算機視覺與模式識別技術整合企業門禁與考勤系統

應用計算機視覺技術配合相對高分辨率的識別與人像數據庫,企業可以采用現有的門禁系統的硬件設備配合相應的軟件實現門禁與考勤系統的整合,以此提高企業辦公環境的智能化人性化的效果,并對員工進行更加精細化的管理。重要的是,通過人機接口的改進改變以往服務信息系統的面貌,讓人在自然的環境下工作提高系統的人性化程度。同時整合門禁與考勤系統可以通過識別企業內部員工與外來人員加強辦公環境的管理,而且在硬件上可以利用現有的設備,軟件方面可以與前面提到的交互演示系統共用相同的圖形圖像處理內核,減少代碼的冗余降低系統復雜度提高性。就目前的人像識別技術而言,已經在個人電腦的安全保護上得到了應用,所以在技術上是可行的,并且也有了實際應用的例子。將該技術移植到普通的門禁管理系統與考勤系統中,只需要解決接口的數據交換就能實現,并且隨著現代企業辦公環境的要求,應用該技術能大大提高企業的辦公環境的智能化程度,并且通過門禁系統提取的企業員工考勤信息更加自然和真實,能夠更加地掌握和管理企業員工的日常工作情況提高管理精度。

3.3具體實現方法與原理

為了能充分利用企業現有的硬件設備,并使得附加的程序簡單化,這里針對類似會議互動展示這樣不需要細節識別的情況采用的是顏色識別的方法,即統計場景中的圖像直方圖,然后探測直方圖上的變化,由于特定顏色的待識別區域的引入可以對整體直方圖的特定區域產生峰值的變化,并且通過反向的直方圖運算又可以確定特定區域的位置。而直方圖的運算屬于比較簡單的圖像運算處理所以能夠在很多圖像處理的開發工具中直接找到。并且對于細節識別要求比較高的人像的模式識別,采用以上的運算也能縮小待檢測區域的大小,提高識別效率,并且人的面部特征采用色識別也能很快找到特征點(眼睛、鼻孔、嘴唇、頭發以及頭像邊緣)。在前面通過色彩識別找到的檢測區域中,識別出特征點,并測量特征點的位置關系比例,進而在和數據庫中數據對比模式匹配找到最終結果。

4結語

在越南河內的機場,為了使乘客能在等待航班時有比較輕松的環境,在旅客的候機大廳專門安放了一臺具有互動功能的投影儀,并將互動內容投影在地面,乘客可以在候機時與地面上的互動投影交互,緩解候機帶來的單調乏味感。同樣我們可以把它引入到日常企業辦公會議或者是培訓教育類企業的日常教學中,運用現有的投影屏幕和現有的設備實現多人的在投影屏幕上的互動交互討論。而人像識別系統在單機上的應用也在很多商用筆記本電腦上得到了應用,在一些科研院所和高科技企業人像識別的門禁系統也被應用到了辦公環境當中,提高了辦公環境的智能化程度;將人像識別技術結合考勤系統則在教育行業能夠實現更為方便的考勤管理防止目前比較嚴重的代簽逃課等情況的發生。隨著現在對數據挖掘技術的研究,從日常情況采集到的數據積累到一定程度還能為今后分析員工/學生行為做出數據的積累。這里所討論和解決的問題主要只是集中在人機交互界面的一些改進,其實對于IT技術而言這只是一小部分,對于企業而言需要使用IT技術真正提高企業的工作效率還需要其他很多方面的配合和集成。

計算機視覺論文:基于計算機視覺的植物黑腐病病斑分析

摘要:給出一種基于圖像處理和神經網絡技術進行植物黑腐病病斑分析的方法,即利用圖像處理技術提取病斑的幾何特征和顏色特征,其中幾何特征根據病斑形狀提取,并基于HSV空間提取病斑顏色矩結合紅綠顏色特征作為病斑的顏色特征,利用神經網絡加以識別,從而判斷病斑所處的生長周期?給出系統的總體設計和實現方案,研究結果表明,該系統獲得了較為理想的檢測效果?這一思路為植物病害檢測和分析提供一種新的方法?

關鍵詞:計算機視覺;神經網絡;病斑分析

1引言

基于計算機視覺的植物黑腐病病斑的檢測與分析的研究內容和目標是提取植物葉片及黑腐病病斑的特征,分類并確定病害程度?十字花科蔬菜黑腐病(Xanthomonas campestris pv.campestris (Pammel) Dowson)俗稱“半邊癱”,是蔬菜生產重的主要病害之一[1]?它是一種細菌引起的病害,癥狀是引起維管束壞死變黑?細菌從葉緣入侵后,產生玉米粒大小的黃褐色壞死斑,再延葉脈蔓延,逐漸擴大成“V”字形或長條形斑塊,周邊伴有黃色退綠暈帶?進入致病末期,葉緣形成火燒似的卷縮燒邊,致使大量外葉枯死?因為植物病害等級判定的一些特性一般都可以由采集樣本觀察測量獲得數據,即所選的性狀都是可以直接觀察到的,則相應的數字化圖片上同樣可以獲得,所以我們利用計算機自動?高效?的特點,提出了基于計算機視覺的植物黑腐病病斑分析的概念,并對黑腐病病斑危害程度的確定進行了探索?本文根據病斑的幾何及顏色特征進行選擇,并用人工神經網絡的方法加以識別?

2病斑的幾何特征選擇

由于黑腐病進入中后期后,病斑呈較為規則的“V”字形斑塊,所以可以選擇其幾何特征作為其等級判斷的依據?通過多次試驗,我們選擇了以下幾種較為具有代表性的幾何特征[2]:

2.1病斑區域與葉片區域的面積比p

式中,s為葉片面積,S為病斑面積,葉片和病斑區域面積可以通過掃描圖像,累加同一標記區域中象素的個數來表示?

2.2病斑區域的圓形度C

圓形度C描述的是病斑形狀接近圓形的程度,其計算公式為:式中,S表示的是病斑面積,L為病斑周長;C值的范圍是0~1,當病斑區域為圓形時周長最短,C=1,病斑區域越偏離圓形,則C值越小?

2.3病斑區域長?寬比E

E=min{寬度,高度}mx{寬度,高度}病斑區域越細長,E越小,當病斑區域為圓形時,E=1?

2.4病斑形狀復雜性e

式中,L表示周長,S表示面積,用離散指數e來描述單位面積圖形的周長大小?e越大,表示單位面積圖形周長越大,即圖形離散,為復雜圖形?

2.5從重心到輪廓線的長度的平均變動系數d

如果從病斑重心出發,每隔10°對病斑輪廓進行掃描,設重心到輪廓的距離分別為 n,其中n=0°,10°,…,350°,則平均變動系數:

3病斑的顏色特征選擇

由于葉片的生長及病斑的蔓延存在很大的隨機性,所以單一依靠病斑的幾何特征無法對病斑做出而有效的判斷?鑒于此種情況,除幾何特征外,我們提取病斑的顏色特征結合上述幾何特征共同作為病斑的評判依據?

3.1基于HSV空間的病斑顏色矩特征提取

為了處理彩色圖像,首先要選取合適的顏色空間?由于常用的RGB三色空間中,兩點間的歐氏距離與顏色距離不成線性比例,也就是說顏色受亮度影響很大,RGB空間不具有進行彩色圖像處理所要求的獨立性和均勻性指標,所以我們在提取病斑顏色矩特征時采用了均勻性更好的HSV空間?從RGB到HSV的轉換公式為[3]:

由于顏色信息集中在圖像顏色的低階矩中,我們主要對每種顏色分量的一階?二階和三階矩 進行統計?這三個顏色矩的數學定義如下[4]:式中:pij是第j個象素的第i個顏色分量的值;N是象素數量?由于每幅圖像有3個顏色分量,每個顏色分量包括3個顏色矩,這樣就一共得到了9個特征向量?

顏色矩的優點是特征描述比較緊湊,缺點是低階顏色矩往往分辨率不夠,所以除此之外我們又提出了基于統計的病斑紅?綠象素特征特提取的方法?

3.2基于統計的病斑紅?綠象素特征提取病菌對葉片的侵蝕實際上是一種破壞植物葉綠素的過程?經過實驗發現,葉片致病后病斑部位與正常葉片相比,圖像G通道平均數值相對R通道大幅降低,由原先G>R轉變為G

圖2正常葉片的R?G?B曲線圖3早期黃色病斑的R?G?B曲線圖4中后期褐色病斑的R?G?B曲線

基于此種情況,我們提取R通道和G通道的象素平均灰度值和的相 對關系參數X和L作為病斑特征?其中N是象素個數,Ri和Gi分別是R通道和G通道第i個象素的灰度值,式中X描述病斑由黃色轉為褐色,R?G通道數值均減小的過程,L則表征伴隨病情的加重,葉綠素的減少,G值相對R值變化的過程?

4人工神經網絡分類器設計

4.1神經網絡的結構在本文中,我們利用bp算法進行人工神經網絡分類器的設計[5],借助MATLAB2006Ra及其所帶的神經網絡工具箱系統進行系統的實現?最終采用3層神經網絡:16個輸入節點,分別為文中上述提取的16種特征;30個隱含層節點;3個輸出節點,分別代表病斑處于致病的早期,中期和晚期?

4.2取樣與神經網絡的訓練

由于實驗室培育的黑腐病發病周期一般為6天,我們在2006年4月3日~2006年4月8日間,在溫度為24~28℃,濕度為80%的廣西大學生命科學院溫室內,每天隨機采取樣本40枚,共計采取樣本240枚?將其掃描為圖片后,從中挑選出75張圖片作為訓練樣本?其中發病頭兩天的25張,作為早期;發病3~4天的圖片25張,作為中期;剩下25張作為末期?經過大量實驗,我們將中間層的傳遞函數和輸出層的傳遞函數均設為S型的對數函數,即logsig/logsig,訓練次數設為1000次,訓練目標誤差為0.001?經過736次后訓練后,網絡收斂,目標誤差達到要求?

5實驗結果

使用早期,中期,晚期圖片各20張為測試樣本(其中15張為新取樣本,5張為已使用過的學習樣本)對已學習好的神經網絡進行測試,網絡輸出值大于等于0.85時算作1,當輸出值小于等于0.15時算作0?則表1為全部測試樣本的判別結果:

6結論與展望

應用上述方案進行識別實驗,bp訓練網絡全部收斂,而且收斂速度較快,15個學習樣本全部正確識別?從上表中可以看出,病斑危害程度的平均識別率達到了90%,其中晚期病斑識別率較高,達到了95%?中期識別率較低,為85%,這可能是由于某些病斑發展較快或較慢導致中期特征并不明顯,使得識別時出現偏差?另外早期病斑的識別率偏低,這可能是由于有些早期病斑太小,感染初期病斑形狀很不規則,所以出現誤分?如何在判別中增加早期病斑顏色判據的權重,增加晚期病斑形狀判別的權重,使得分類更加合理,是下一步需要繼續思考的問題?

計算機視覺論文:計算機視覺在案例推理系統中的應用

摘要:本文結合案例推理的關鍵技術,從計算機視覺如何圖像獲取、如何圖像預處理、如何圖像特征抽取描述及案例如何進行檢索,得出計算機視覺如何在案例推理系統應用,實現案例推理系統對產品實時質量檢測、監控和故障診斷。

關鍵詞:計算機視覺;案例推理;圖像處理;圖像描述

1 引言

基于案例推理(case-base reasoning)是人工智能中正不斷發展的一項重要推理技術?;诎咐评砼c類比推理方法相似,案例推理將舊經驗或教訓轉換為知識,出現新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經過推理后解決新問題的方法,又會成為新的案例或新經驗,下一次再遇到相同問題時,就可以復用這些案例或經驗。

這與人遇到問題時,首先會用經驗思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響糜诠I產品檢測或故障診斷時具有以下特點:

CBR智能化程度較高。利用案例中隱含的難以規則化的知識,以輔助規則推理的不足,提高故障診斷系統的智能化程度。

CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎,案例的獲取比規則獲取要容易,大大簡化知識獲取的過。

CBR求解效率較高。是對過去的求解結果進行復用,而不是再次從頭開始推導,可以提高對新問題的求解效率。

CBR求解的質量較高。CBR以過去求解成功或失敗的經歷,可以指導當前求解時該怎樣走向成功或避開失敗。

CBR持續不斷的學習能力,使得它可以適應于將來問題的解決。

所以基于案例推理方法正不斷應用在產品質量檢測和設備故障診斷方面,并取得較好的經濟效益。為了產品檢測和設備故障診斷中,更為智能化,更容易實現現場檢測和診斷,計算機視覺技術起到很大的作用。

計算機視覺是研究用計算機來模擬人和生物的視覺系統功能的技術學科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進行圖像的獲取預處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達到識別、理解的目的。

計算機視覺隨著科學技術發展,特別計算機技術、通信技術、圖像采集技術、傳感器技術等,以及神經網絡理論、模糊數學理論、小波的分析理論等計算機視覺理論的不斷發展和日趨成熟,使計算機視覺從上世紀60年代開始興起發展到現在,取得快速發展,已經從簡單圖像質量處理發展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉向運動,由二維轉向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應用領域更為廣泛,為案例推理中運用計算機視覺打下基礎。

2 案例推理系統的主要關鍵技術

(1)案例的表示與組織

案例的表示與組織即是如何抽取案例的特征變量,并以一定的結構在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內容存放在案例中,案例按什么組織結構存放在存儲器中,這關系到基于案例推理方法的效率,而且對于案例數量越來越多,結構十分復雜的案例庫,尤其重要。

(2)案例的索引與檢索

案例的索引與檢索即是為了查找相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發揮出應有的作用,很大程度上依賴于這一階段得到的案例質量的高低,因此這一步非常關鍵。

(3)案例的復用和調整

案例的復用即是如何根據舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應用于新問題的解決。而復用還分案例的結果復用,案例的求解方法復用。

(4)案例的學習

案例的學習即是將新解添加到案例庫中,擴充案例庫的案例種類與數量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。

針對案例推理的關鍵技術,根據檢測和故障診斷系統的特點,計算機視覺主要解決如何將產品圖像輸入系統,如何將產品圖像特征進行抽取和描述,如何區別產品不同之處。以便案例推理系統進行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統進行探討。

3 產品輸入系統

產品輸入系統在不同產品類型和生產環境可能有不同之處,主要應有傳感器單元和圖像采集單元。如圖1。

圖1 產品輸入系統結構

傳感器單元主要判斷是否有產品存在,是否需要進行圖像采集,是否繼續下一個產品圖像的采集。這簡單傳感器可使用光電開關,配合光源,當產品經過時,產品遮擋住光源,使光電開關產生一個0值,而沒有產品經過時,光電開關產生相反的1值,系統通過判斷光電開關的值,從而判斷是否有產品。

圖像采集單元簡單地說是將產品拍攝并形成數字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設備。圖像采集卡主要是將圖像數字化。通過傳感器判斷有產品后,光源發出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經過圖像采集卡數字化后輸入存儲設備。存儲設備即為計算機硬盤。存放原始圖像、數據、處理結果等。

這是案例推理系統的原始數據,是圖像處理、圖像特征抽取描述的基礎。

4 圖像處理

在案例推理系統中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區別其它圖像,具有性。同時,又能完整地表示該圖像。所以案例的表示要體現案例的完整性、性、操作容易性。

圖像中有顏色區別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內部包含表示的本質,即圖像的描述。根據圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數字化外觀、圖像物體的數字組成等屬性。這需要對產品輸入的原始圖像進行處理。

在計算機視覺技術中,對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經過這些處理后,輸出圖像的質量得到相當程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示:

圖2 計算機視覺的任務與工作流程

圖像預處理是將產品的數字圖像輸入計算機后,首先要進行圖像的預處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。

圖像二值化處理主將灰度圖形二值化的關鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據灰度直方圖中兩峰之間的谷值作為閾值來分割目標和背景。

圖像的平滑處理技術即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設備和環境所造成的圖像失真,提取有用信息。

圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數學或符號表達形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進行特征提取和形狀分析了??刹捎枚喾N算法,如采用Sobel算子提取邊緣。

圖像預處理是為下一步的特征描述打基礎,預處理的好壞直接影響案例推理的結果和檢測診斷的效率。

特征提取是對圖像進行描述,是案例建模關鍵,案例建模是根據案例組織要求抽取圖像特征,是建立案例索引和檢索的關鍵。如果圖像沒有特征,就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產品、產品形狀大小、產品顏色,產品有什么缺陷、產品缺陷在什么位置等特征,根據這些圖像特征進行描述,形成計算機中屬性值,并從數據庫查找相應信息資料,從而確定產品之間的關系,相似度,也就是案例推理的方向。

5 系統的檢索

根據案例推理原理和相應算法,建立案例推理系統模型,如圖3所示。

圖3 案例推理系統

對話系統:完成人機交互、問題描述、結果顯示和系統總控制。

案例庫系統:由案例庫及案例庫管理系統組成。

數據析取系統:對各種已有的源數據庫的數據通過轉換而形成所需的數據。

多庫協同器:根據問題求解的需要,按照一定的數據抽取策略,完成問題求解過程中對模型庫系統、方法庫系統、知識庫系統和數據庫系統等資源的調度與協調。

知識庫系統:由產生式規則組成,這些知識包括專家經驗和以規則形式表示的有關知識,也可以是數據挖掘結論,支持案例檢索、案例分析、案例調整等。 模型庫系統:由模型庫、算法庫、模型庫管理系統組成。完成模型識別和調用,并把結果綜合,送入對話系統顯示,作為補充信息供案例檢索、調整使用。

數據庫系統:存放待決策支持的所有問題,并完成其維護與查詢等功能。

由于系統主要應用產品的現場實時檢測監控或故障診斷,所以系統的檢索時,也必須輸入檢索值,即輸入現場產品的圖像,在通過產品預處理、圖像的二值化、分割和邊界處理后,進行圖像特征描述,根據圖像描述進行分類識別。根據案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度較大作為結果,并將案例的解輸出,給相關控制系統進行決策。如產品質量檢測,確定產品質量是否合格,是否有不合格產品,不合格產品是什么原因造成,故障源是什么,如何解決和排除故障,等等。

6 結論

案例推理方法有效地解決計算機視覺技術中圖像檢索問題。對提高圖像檢索的效率和度提供了平臺。

計算機視覺技術也為案例推理系統實現產品現場實時檢測、監控、診斷提供技術支持。計算機視覺技術現場的數據采集、處理為案例推理打好基礎。

兩者的結合設計的系統適用范圍很廣,只要產品需要進行質量檢測、監控,或設備需要進行故障診斷和維護,都可以適用。

系統提供的實時檢測、監控和診斷功能,提高企業的生產效益,降低了生產成本。

計算機視覺論文:計算機視覺技術在交通工程測量中的應用

一、引言

隨著科技的發展,計算機替代人的視覺與思維已經成為現實,這也是計算機視覺的突出顯現。那么在物體圖像中識別物體并作進一步處理,是客觀世界的主觀反應。在數字化圖像中,我們可以探尋出較為固定的數字聯系,在物體特征搜集并處理時做到二次實現。這既是對物體特征的外在顯現與描繪,更是對其定量信息的標定。從交通工程領域的角度來看,該種技術一般應用在交管及安全方面。監控交通流、識別車況及高速收費都是屬于交通管理的范疇;而對交通重大事件的勘察及甄別則是交通安全所屬。在這個基礎上,筆者對計算機視覺系統的組成及原理進行了分析,并形成視覺處理相關技術研究。

二、設計計算機視覺系統構成

計算機視覺處理技術的應用是建立在視覺系統的建立基礎上的。其內部主要的構成是計算機光源、光電轉換相關器件及圖像采集卡等元件。

(一)照明條件的設計。在測量物體的表征時,環境的創設是圖像分析處理的前提,其主要通過光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設計照明條件時,我們通常會視具體而不同處理,不過總的目標是一定的,那就是要利于處理圖像及對其進行提取分析。在照明條件的設定中,主動視覺系統結構光是較為典型的范例。

(二)數據采集的處理。如今電耦合器件(CCD)中,攝像機及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號。在此基礎上,A模式與D模式的相互對接更能夠讓信號進入計算機并達到數字處理標準,再量化入計算機系統處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機輸入的結果;彩色圖像則需要彩色相機來實現。其過程為:彩色模擬信號解碼為RGB單獨信號,并單獨A/D轉換,輸出后借助色彩查找表來顯示相應色彩。每幅圖像一旦經過數字處理就會形成點陣,并將n個信息濃縮于每點中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來看,彩色的圖像采集分析更為繁復些。不過黑白跟灰度圖像也基本適應于基礎信息的特征分析。相機數量及研究技法的角度,則有三個分類:“單目視覺”、“雙目”及“三目”立體視覺。

三、研究與應用計算機視覺處理技術

從對圖像進行編輯的過程可以看出,計算機視覺處理技術在物體成像及計算后會在灰度陣列中參雜無效信息群,使得信息存在遺失風險。成像的噪聲在一定程度上也對獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預設分析,還原圖像本相,從而消去噪音。邊緣增強在特定的圖像變化程度中,其起到的是對特征方法的削減。基于二值化,分割圖像才能夠進一步開展。對于物體的檢測多借助某個范圍來達到目的。識別和測算物體一般總是靠對特征的甄別來完成的。

四、分析處理三維物體技術

物體外輪擴線及表面對應位置的限定下,物體性質的外在表現則是其形狀。三維物體從內含性質上來看也有體現,如通過其內含性質所變現出來的表層構造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態是最常用的處理技術。檢測三維物體形狀及分析距離從計算機視覺技術角度來看,渠道很多,其原理主要是借助光源特性在圖像輸入時的顯現來實現的。其類別有主動與被動兩類。借助自然光照來對圖像獲取并挖掘深入信息的技術叫做被動測距;主動測距的光源條件則是利用人為設置的,其信息也是圖像在經過測算分析時得到的。被動測距的主要用途體現在軍工業保密及限制環境中,而普通建筑行業則主要利用主動測距。特別是較小尺寸物體的測算,以及擁有抗干擾及其他非接觸測距環境。

(一)主動測距技術。主動測距,主要是指光源條件是在人為創設環境中滿足的,且從景物外像得到相關點化信息,可以適當顯示圖像大概并進行初步分析處理,以對計算適應功率及信息測算程度形成水平提高。從技術種類上說,主動測距技術可分為雷達取像、幾何光學聚焦、圖像干擾及衍射等。除了結構光法外的測量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環境到條件所涉,以結構光法測量作為主要技術的工程需求較為普遍,其原理為:首先在光源的設計上由人為來進行環境考慮測算,再從其中獲取較為的離散點化信息。在離散處理后,此類圖像已經形成了較多的物體真是特征表象。在此基礎上,信息需要不斷簡化與甄別、壓縮。如果分析整個物體特征信息鏈,則后期主要體現在對于數據的簡化分析。如今人們已經把研究的目光轉向了結構光測量方法的應用,體現在物體形狀檢測等方面。

(二)被動測距技術。被動測距,對光照條件的選擇具有局限性,其主要通過對于自然光的覆蓋得以實現。它在圖像原始信息處理及分析匹配方面技術指向較為突出。也通過此三維物體之形狀及周圍環境深度均被顯露。在圖像原始信息基礎上的應用計算,其與結構光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內涵入手,適應物體自身特點而存在。不過相對來說獲得圖像特征才是其適應匹配的條件保障。點、線、區域及結構紋理等是物象特征的主體形式。其中物特較為基礎與原始的特征是前兩個特征,同時它們也是其他相關表征的前提。計算機系統技術測量基本原理為對攝像機進行構建分析,并對其圖像表征進行特征匹配,以得到圖像不同區間的視覺差異。

五、結束語

通過對計算機視覺技術的研究,悉知其主要的應用領域及技術組成。在系統使用的基礎上深入設計,對系統主要構成環節進行分析。從而將三維復雜形態原理、算法及測量理論上升到實際應用。隨著社會對于計算機的倚賴程度增加,相信該技術在建筑或者其他領域會有更加深入的研究及應用。

計算機視覺論文:計算機視覺技術及其在自動化中的應用

摘要:隨著社會的發展,科技的進步,計算機的應用范圍也越來越廣,人們開始試圖建立利用計算機來代替人類進行自動識別的人工智能系統,而要想建成這種系統一項必不可少的技術就是計算機視覺技術。為了進一步促進計算機視覺技術的發展,使計算機視覺技術得到更廣泛的推廣與應用,本文概述了計算機視覺技術的基本概念、工作原理與理論框架,并重點分析了計算機視覺技術在農業自動化、工業自動化以及醫學自動化中的應用,以期為計算機視覺技術的推廣與發展貢獻自己的綿薄之力。

關鍵詞:計算機;視覺技術;應用;分析

計算機人工智能技術中的一項重要技術就是計算機視覺技術,這種技術主要是讓計算機利用圖像來實現認知環境信息的目的,這一目的的實現需要用到多種高尖端技術。近年來隨著計算機技術以及計算機網絡的普及與發展,計算機視覺技術也得到了較快發展,并且在實際生產與生活中的應用也越來越廣泛。

1 計算機視覺技術概述

1.1 基本概念

計算機視覺技術主要研究計算機認知能力的一門技術,其具體主要是通過用攝像機代替人的眼睛,用電腦代替人的大腦,最終使計算機具備類似于人類的識別、判斷以及記憶目標的功能,代替人類進行部分生產作業。人們目前研究的人工智能技術中的一項重要內容就是計算機視覺技術,通過研究計算機視覺技術可以讓計算機擁有利用二維圖像認知三維環境的功能??偟膩碚f,計算機視覺技術是在圖像與信號處理技術、概率分析統計、網絡神經技術以及信息處理技術的基礎上,利用計算機來分析、處理視覺信息的技術,它是現代社會新興起的一門高新技術。

1.2 工作原理

在亮度滿足要求的情況下,首先使用攝像機對具體事物的圖像信息進行采集,利用網絡把采集到的圖像信息向計算機內部輸送,然后在計算機系統內部處理加工圖像信息會把事物的原始圖像得到,隨后利用圖像處理技術進一步處理原始圖像,獲得優化質量效果之后的圖像,分類與整理圖像中有特征價值的信息,通過智能識別技術識別與描述提取到的圖像信息特征,把得到的高層次的抽象信息存儲起來,在進行識別事務時分析對比這些儲存信息就可以實現事物的識別,這樣視覺系統的基本任務也就完成了。其具體視覺系統如圖1所示:

1.3理論框架

人類研究視覺技術雖然起步比較早,但取得較大進步是在20世紀80年代初伴隨著視覺計算理論的出現。它的出現把研究視覺理論的策略問題解決了,視覺技術是一項特別復雜的信息處理過程,要想對視覺的本質完整的理解,必須從不同角度與層次研究與分析視覺本質。視覺計算理論研究層次大致可分為:計算機理論、算法以及實際執行。站在計算機理論的角度分析視覺技術,我們可知必須用要素圖、維圖、以及三維模型表像來描述視覺信息。

所以,可以把計算機視覺技術當做從三維環境圖像中抽取、描述與解釋信息的過程,其主要分析步驟可分為感覺、處理、描述、識別、解釋等。若依據上述各過程實現需用到的方法與技術的復雜性劃分層次,可大致把計算機視覺技術劃分為:低層視覺處理、中層視覺處理、高層視覺處理三個層次。

2 計算機視覺技術在自動化中的應用

2.1 農業自動化中計算機視覺技術的應用

在農業自動化中應用計算機視覺技術可以全天候實時監測農作物的生長狀況,便于科學管理農作物。還可以應用計算機視覺技術來檢測農產品的質量,例如可以應用計算機監測技術來監測大多數蔬菜的質量,傳統的人工檢測蔬菜質量的方法,不僅費時費力,而且檢測結果的性也不能很好的保障,在實際人工檢測過程中還容易傷害蔬菜,可以通過利用計算機視覺技術來感應蔬菜自身釋放的紅外線、紫外線以及其他可見光的能量大小,然后和質量達標蔬菜的光線能量大小進行對比,根據這些對比結果可以把蔬菜質量的好壞判斷出來,在蔬菜質量檢測過程中應用計算機視覺技術,把傳統的蔬菜檢測方法顛覆了,極大的方便了農產品的質量檢測,由此可見,計算機視覺技術在農業生產中有很高的使用與推廣價值。

2.2 在工業自動化中計算機視覺技術的應用

計算機視覺技術在工業自動化應用的一個重要領域就是可以精密測量零件尺寸,其測量與被測對象的原理如圖2所示。

光學系統、計算機處理系統以及CCD攝像頭,是計算機檢測系統的主要組成,被測物體由光源發出的平行光束進行照射,利用顯微光學鏡把待檢測部位的輪廓圖像呈現在攝像機的面陣CCD上,然后再通過計算機處理這些圖像,進而把被測部位的輪廓位置信息獲取下來,若被測對象是出現位移時,可通過兩次重復測量,利用兩次測量的位置差就可以得出,被測物體的位移量。

此外計算機視覺技術還可以應用于逆向工程中,應用3D數字化測量儀可以快速的測出現有工件輪廓的坐標值,同時還能構建曲面,保存成CAD或CAM圖像,把這些圖像送入CNC制作中心加工,便可制作出產品,這也就是所謂的逆向工程。由上述分析我們可知逆向工程要想實現,最關鍵的一環就是如何通過精密測量系統來測量樣品的三圍尺寸,獲得各部位數據,進而做曲面處理進而加工生產。對于這一難題我可以通過利用線結構光測量物體表面輪廓技術來實現,器具體輪廓結構示意圖如下圖3所示。

這種測量方法的工作原理為:利用激光穿越平行、等距的振幅光柵組件,或直接采用干涉儀發出的干涉條紋,形成平面條紋結構光,再向物體表面投射,由于物體各表面的深度與曲率的不同,條紋會自動出現變化,然后再通過使用CCD攝像機對變形條紋進行拍攝。這樣就可以把物體表面輪廓的變化情況分析出來。攝像機在拍攝圖像的過程中,把圖像信號轉化為模擬信號,再轉化為數字信號,然后經過傳送再還原信號到圖形處理系統,就得到三維輪廓圖像。

在工業自動化中計算機視覺技術的深入廣泛應用,不但使工業產品的生產質量得到了保障,而且跨越式的提高了工業產品的生產速度。如計算機視覺技術可以很好的檢測產品包裝質量,封口質量以及印刷質量等等,如我國重點指定的印刷造幣機器的南京造幣廠,由于貨幣制造印刷是由印刷造幣機器來實現的,所以要嚴格要求其生產工藝,一絲一毫的生產差錯都不允許存在,為了保障印刷制造出來的造幣機器質量達標,必須嚴格檢測生產出來的成品。在印刷造幣機器的過程中要求要有非常高的計算機視覺技術,隨著計算機視覺技術的不斷進步,計算機視覺技術已經對印刷造幣機器的需求滿足了,實際的應用效果也非常理想,印刷造幣機器在實際生產的過程中,南京造幣廠把計算機視覺技術應用在了每個應刷造幣機器的生產工序上,硬幣受到重力下落的瞬間,計算機視覺技術可以瞬間采集圖像的信息,拍攝硬幣在下落過程中的圖像,通過高速光纖傳感器可以把硬幣圖像向計算機系統快速傳輸,利用計算機系統處理信息與識別信息的超強能力,可以及時識別硬幣質量,經大量實踐研究得出,在印刷造幣機器上應用計算機視覺技術已經幾乎沒有檢查差錯現象的發生,由此可知,在工業自動化中計算機視覺技術的應用不但可行,而且發展空間還很大。

2.3 在醫學自動化中計算機視覺技術的應用

在醫學領域計算機視覺技術也得到了廣泛應用,如醫學中經常用到的CT圖像以及X射線圖都用到了計算機視覺技術,這些技術的廣泛應用很大程度上方便了醫生判斷病人病情,另外,在生產藥品的過程中,應用計算機視覺技術可以高效檢測藥品包裝的合格與否,其基本流程是:傳送裝置先運輸藥品到指定位置,傳送裝置自身又可分為檢測與分離兩個區域,在傳送藥品的過程中藥品的圖像信息會被特定的攝像機采集,采集完成后向計算機系統傳遞采集信息,然后計算機系統會分析與處理這些信息,把沒有包裝好的藥品自動識別出來,并且向分離區傳遞識別信息,分離區的自動裝置會依據傳輸的分離信息,隔離開沒有包裝好的藥品,這樣就可以有效分類包裝好的藥品與沒有包裝好的藥品,在藥品包裝檢測方面應用計算機視覺技術代替傳統人工檢測,不但可以實現藥品無誤的檢測,而且還可以大大提高檢測藥品包裝質量的效率,完善了藥品生產的自動化,由此可見,在醫學自動化中應用計算機視覺技術可以積極促進醫學自動化的發展。

3 結束語

總之,計算機視覺技術是一門研究計算機識別能力的高新技術,它涵蓋了很多其他技術,具有一定復雜性。要想使其在自動化生產中得到更好地推廣與應用,我們必須在明白其基本概念、工作原理以及理論框架的基礎上,結合實際生產情況,不斷進行深入研究,只有這樣才能使計算機視覺技術得到更好地推廣與應用,才能使這項現代化的高新技術更好的服務于社會,服務于人類。

計算機視覺論文:淺議高校計算機視覺課程教學的創新

摘要:計算機視覺是利用計算機及相關設備來模仿生物視覺的技術,計算機視覺課程的建立對學生的學習和互聯網的發展有著重要的意義?;诖耍疚膶⒅靥接懹嬎銠C視覺課程的特點和高校計算機視覺課程教學的創新策略,主要包括教學內容的選取和工程實例的選取,以期為當前計算機視覺課程的教學提供一些指導意見。

關鍵詞:計算機視覺;課程創新;教學改革

計算機視覺課程是人工智能學科的分支學科,對互聯網技術的發展有著重要的推進作用。隨著時代的飛速變遷,越來越多的學生對這一領域產生了濃厚的興趣,計算機視覺課程在信息專業中也開始占據重要的地位。如何讓學生對這門課程保持長久的興趣,如何培養學生的專業能力和實踐能力,是當前高校應該考慮的問題。經過近幾年的教學實踐后,很多高校已經逐步確定了通過實際應用培養學生興趣的教學方法,在滿足學生對計算機視覺應用需求的同時,加深了學生對理論知識的理解,這已經成為了當前高校計算機視覺課程教學的重要模式。

一、計算機視覺課程的特點

近年來,隨著計算機網絡的飛速發展,計算機視覺的應用也越來越廣泛,成為了信息相關專業學生的一門必修課。計算機視覺課程涉及眾多領域,包括人工智能與模式識別、應用數學等,其覆蓋范圍廣,綜合性較強。具體來說,計算機視覺課程有以下幾個特點:一是內容廣泛,理論抽象。計算機視覺是一門新技術,隨著時代的變遷,互聯網新技術的更新日新月異,這就使得課程內容的更新過快,內容廣泛,教師很難在及時時間向學生輸送所有的課程知識。二是計算機視覺課程涉及多個學科領域,并且所涉及的領域知識內容復雜,表達抽象,這對學生的學習來說是一個較大的障礙。三是實踐性強。計算機視覺課程的知識內容來源于各種專業不同的領域,操作性極強,學生只有在具有一定的工程項目綜合能力后,才能進行計算機視覺應用和操作。

二、計算機視覺與計算機圖形學、數字圖像處理之間的聯系和區別

1.計算機視覺與計算機圖形學的聯系與區別。計算機視覺一般輸入的都是圖像或圖像序列,其輸入資料主要來自usb攝像頭或是相機。經過處理后,計算機視覺輸出的是對圖像序列和圖像對應的對真實世界的一種理解,在這一方面,計算機視覺有識別車牌、人臉的作用。而計算機圖形學則是一種對虛擬場景的描述。它一般是由多個多邊性數組組成,每個多邊性有三個頂點,輸出的是二維像素數組。在增強現實的應用中,人們不僅需要用計算機視覺來提高對物體識別和姿態獲取的效率,還需要用到計算機圖形學對虛擬三維物體的疊加方法。

2.計算機視覺與數字圖像處理的聯系和區別。首先,計算機視覺與數字圖像處理之間的聯系在于數字圖像處理是計算機視覺處理的基礎,而計算機視覺的研究成果也可以作為數字處理的素材。其次,計算機視覺與數字圖像處理之間的區別在于圖形是一種純數字化、矢量的單位,而圖像則不僅包括圖形,有時還包括來自現實世界的信號,并且圖形的處理不是一種簡單的堆積,計算機視覺的處理要從圖像中找到一些統計數據和信息,并做進一步的數據分析。

三、高校計算機視覺課程教學的創新策略

1.以工程應用為導向的課程內容。鑒于學習本課程的學生在畢業之后多數會進入相關工程企業或者研究院工作,因此,在對學生進行培養時,高校一方面要考慮到學生的知識接受度,另一方面要設置以工程應用為導向的課程內容,幫助學生更好的進入企業或研究院開展工作。高校在進行計算機視覺課程教學創新時,首先要創新課程教材,摒棄以往枯燥的理論書籍,多選取一些實踐性和應用性強的教材??紤]到國內教材的滯后性和學生基礎的薄弱性,高校應該選擇以下兩本書作為學生的專用教材:一本是我國著名教授賈云得編纂的《機器學習》,這部教材深刻體現了時展的教學要求,書中不僅詳細講述了計算機視覺中的一些基本知識,包括計算機視覺的基本概念、算法及其應用,還有一些經典的數字圖像處理方法和視覺應用分析,對學生了解基礎知識和實踐內容有著重要的意義;另外一本是國內外十分推崇的計算機視覺著作,它是美國教授Richard Szeliski教授的作品。該書在2010年出版,獲得了眾多業界人士的好評。Richard Szeliski教授是華盛頓大學的兼職教授,也是微軟研究院交互視覺與多媒體的主任,他對計算機視覺的發展和未來走向十分清楚,也深刻了解產業界和大學需要什么樣的計算機視覺課程教材。因此,這本教材面向應用,與當今近期的科技成果緊密相連,綜合論述了計算機視覺在各個領域的發展,展示了計算機視覺的近期研究成果和未來的發展趨勢。此外,本書中還有詳細的國外研究案例和更加深入的應用案例,適合學生開展探究性學習。兩本教材都是遵循以工程應用為導向的原則,對學生開放性思維的培養有著重要的意義。

2.面向科技近期成果的課程定位。計算機視覺是一門新技術,科技創新是其發展的原動力,因此,高校在進行課程安排時,應該將當今計算機視覺領域的重要的科技成果作為計算機課程的基本教學內容。要想以科技近期成果定位計算機視覺課程,高校要做到以下兩個方面:(1)選取涵蓋近期成果的教材??紤]到不同學生的數字圖像處理基礎不一的問題,學校可以在課程中補充一些有關數字圖像處理的基礎內容。在選擇教材內容時,計算機視覺課程的內容應該包括數字圖像處理、視覺學習和模式識別這三大部分。數字圖像處理是視覺課程的基礎內容,主要向學生介紹數字圖像處理和計算機視覺所涉及的一些基礎知識,包括圖像的分割和檢測、圖像濾波的處理等。數字圖像處理是整個計算機課程學習的重要基礎內容,其課時可占總課時的二分之一。其次,視覺部分是近幾年來計算機視覺的近期科技成果,內容主要包括攝像機的幾何設定和計算機攝影機的序列處理等。作為最前沿的科技領域,視覺部分將會是該課程后期的重點內容,與實踐作業緊密結合。而模式識別則更多的是新技術的一種工程應用,學生會更多的涉及到實踐操作,更好的培養學生的實踐能力。(2)強化學生自學和調研能力。課程調研和實踐是信息專業學生強化能力的重要方法之一,高??梢栽谡n程項目中引入新技術的探究,在使課程在具有基礎性、研究性的同時,具有一定的前沿性,還能讓學生在及時時間了解到近期的科技成果和互聯網應用技術。在課程調研和實踐中,高校必須要強化學生的自學和調研能力,在調研時給每一個小組安排一位高年級研究生作為指導,每組學生獨立完成任務,高年級研究生只做引導和輔助的作用。學生在自我設置調研程序,查找資料,理解和熟悉相關程序的時候,能夠更加掌握近期科技成果的內容,同時還提高了學生的自學能力和團隊協作能力。

3.工程實踐化的教學形式。工程項目綜合能力是信息專業的學生必須具備的素質之一,因此在計算機視覺課程的教學過程中,培養學生的工程實踐能力是教學目標之一。高??梢圆扇∫韵聝煞N方法:(1)選取適當的工程實例。對于信息專業的學生而言,計算機視覺課程各個獨立的算法和方法較多,彼此沒有過多的聯系。這對學生來說過于抽象,不易理解,因此教師不應當僅僅限于知識的傳授,還應該選取一些適當的工程實例,將知識體系串聯在一起,加深學會對教學內容的理解,從而達到良好的教學效果。例如,在教學過程中,教師可以著重介紹手機制造的例子。手機是現在學生十分熟悉的產品,用手機舉例更加貼近學生的生活,教師可以詳細介紹手機鍵盤和主板的制造過程,并在這一過程中將所學的算法和理論融合進去,加深學生對知識的理解。其次,教師在手機講解時,還可以引導學生思考類似的產品制造,從而引出數碼相機的制造原理,和學生一起探討其制造算法。這種做法不僅可以幫助學生學習,還可以讓學生拓寬思路,發散思維,不斷創新計算機視覺領域。(2)選擇合適的實際應用。計算機視覺課程是一門實踐性和操作性極強的學科,因此,為了學生更好的學習,教師要將理論工程實踐化,選擇合適的實際應用來提高學生的實踐能力。教師可以安排學生進入手機制造廠房,給學生上一堂別開生面的實踐課,詳細介紹每個制造流程,并向學生不斷拋出與課程有關的問題,引發學生的思考,比如選擇什么樣的模板匹配法可以更為簡單。學生在不斷的解答和提問中,對學科知識的了解也會逐步加深。其次,高??梢越iT的實訓基地,學生可以在基地里實踐操作,將理論轉化為實物,親自嘗試做出模型,這種做法可以極大地提高學生的實踐能力,使學生更快的將理論轉化為實際。

四、結語

在新形勢下,高校應不斷創新計算機視覺課程的教學模式,并以此展開教學活動,培養學生的實踐能力和創新精神。將工程應用和科技近期成果結合的教學模式,有利于解決理論和實踐相脫節的問題,在增強學生學習興趣、提高學生獨立分析能力的同時,還使學生接觸了國際近期的研究成果,拓寬了學生的思路,這對學生未來的發展有著重要的意義。