引論:我們為您整理了13篇數字圖像處理綜述范文,供您借鑒以豐富您的創作。它們是您寫作時的寶貴資源,期望它們能夠激發您的創作靈感,讓您的文章更具深度。
篇1
數字圖像處理技術發展是十分迅速的,從早期的電報打印機打印的粗糙圖片,到圖像信號可以遠距離傳輸并清晰顯示出來,到現在數字圖像處理技術可以觀看到人體內部組織結構等等,在技術發展的同時,在人們生活中的作用也越來越顯著。
1 數字圖像處理技術的主要分類
數字圖像處理的技術基本可以分為兩大類:分別是模擬圖像處理和數字圖像處理.模擬圖像處理內容主要包括光學圖像處理和電子圖像處理。如人們平常拍照、攝像頭監控和電視信號處理等都屬于模擬圖像處理。模擬圖像處理的優點是處理速度快,系統占用運行內存小,圖像實時性強, 能夠在處理的同時進行其他圖像的處理,其缺點是處理精度較差,處理功能比較單一,沒什么智能判斷能力和非線性處理的能力。
數字圖像處理技術是目前主流的處理技術,其功能的實現一般需要計算機軟件的支持,所以一般也稱之為計算機圖像處理。數字圖像處理有很多優勢,如處理內容方面,處理精度方面,處理靈活性等等都是模擬圖像處理所比不上的,而且可以進行復雜的非線性處理,改變處理功能只需要進行不同功能模塊的重新編碼和參數變換,但其處理速度慢,尤其是在進行復雜的圖像處理時更要占用更高的內存。
2 數字圖像處理技術的主要內容
2.1 圖像的顯示
圖像顯示是數字圖像處理技術中最基本也是最重要的一門技術,對于計算機來說,獲取信息的最直觀的方式就是圖像的觀看,任何其他圖像處理技術都需要先顯示圖像,然后在圖像做后續操作,如對圖像進行特效顯示,包括圖像的掃描,圖像的移動,分條柵欄,馬賽克效果,百葉窗效果等,所以圖像顯示的原理和基本方法是數字圖像處理技術中所必須掌握的[1]。
計算機顯示圖像并不是直接打開圖像并顯示在電腦熒幕上,當大家想要打開一幅圖像時,計算機首先得調用電腦自帶的調色板,一幅位圖里面包含了圖像顏色信息表,當載入位圖,并且準備打開位圖的時候,系統會先將位圖自身的顏色信息表即調色板載入系統調色板,然后顯示硬件調用系統調色板就可以顯示位圖原來的顏色了。
2.2 圖像的幾何處理
為了滿足視覺的不同需要,人們需要對圖像的顯示進行不同的處理,以求給人帶來最適合的視覺效果,其方法包括坐標變換,圖像的放大,縮小,旋轉、移動等。
2.3 圖像的變換域處理
數字圖像處理經常要用到線性系統,在圖像處理中使用空間作為參數來描述,通常用二維系統進行表示,輸入函數f(x,y)表示原始圖像,輸出函數g(x,y)表示經處理后的圖像,線性系統可以看作是輸入函數和輸出函數之間的一種映射w,反映了各種線性圖像的處理方法,關系公式如下:
當將圖像有空間域變換到頻域時,一般要用到線性正交變換,線性正交變換算法主要包括傅立葉變換離散小波變換,離散余弦變換等。
2.4 圖像的銳化處理
許多圖像里面的有用信息比較不顯眼,這時需要對圖像進行增強顯示,抑制其中不重要的信息,突出顯示其中重要的信息,讓兩個部分有鮮明的對比,能讓用戶有更加直觀的視覺信息,可以提高有用信息的接收率。
而圖像復原的目的也是為了增強圖像的顯示效果,它跟圖像增強的區別在于:圖像增強是采用各種技術來增強圖像的視覺效果,不去考慮之前的圖像是因為什么原因需要增強。因此,圖像增強是以圖像符合人們的視覺觀為主,不用管增強之后和原圖是不是有比較大的區別。圖像復原處理跟圖像增強處理完全不同,它需要知道圖像復原前的算法,并且根據已經退化的圖像得到逆算法將圖像復原,然后才能對圖像進行增強處理。
2.5 JPEG圖像的壓縮編碼
其核心思想就是在滿足一定質量的情況下減少圖像占用的內存,因為圖像中有許多與大家想要信息無關的區域或冗余信息,這些信息不僅占用內存,而且傳輸過程中需要更多的帶寬,所以,對圖像進行編碼壓縮能盡可能節約帶寬資源,提高傳輸速度,給圖像顯示帶來更好的體驗。圖像壓縮編碼方法很多,從信息論方面看主要可以分為兩大類:冗余度壓縮方法和信息度壓縮方法。
2.6 圖像的灰度變換
圖像的灰度變換處理是圖像增強處理技術中單個一種非常基礎、直接的空間域處理方法,灰度處理是指根據某種目標條件按一定變換關系逐點改變原圖中每個像素灰度值的方法,目的是為了改變圖像質量,讓圖像顯示效果更加清晰,如攝像頭在室內光照不強時會導致圖像顯示不清晰,灰度過于集中。灰度變換處理方法主要包括線性變換和非線性變換。
圖像處理內容包括很多方面,以上所舉只是一部分,專業的數字圖像處理技術是遠遠不止這些方面的,隨著計算機技術發展越來越快,數字圖像處理技術的復雜程度只會越來越深,所以,在數字圖像處理技術這一門博大精深的課程中,擇一而精也是一個很好學習態度[2]。
3 數字圖像處理的應用
數字圖像處理技術在各行各業應用都不可或缺,它已經從剛開始的高科技領域逐步滲透到人們的日常生活中,例如天氣預報信息收集、醫院身體各方面檢測、銀行自助提款機、全國各地的大小超市商品編碼、道路交通監控、重要部門的監控報警系統、可視電話視頻傳輸技術、互聯網媒體信息傳輸等等。
3.1 遙感航天中的應用
天文、太空星體的探測及分析,數字圖像處理可以根據拍攝到的星體輪廓等進行智能分析。軍事偵察、定位、指揮等,如現在的衛星地圖,手機定位系統;地質、地形、地圖的普查及繪制,如網上和手機上和司機普遍使用的電子地圖和導航儀;地下礦藏的偵察,地質勘查儀等通過超聲波檢測地質層,然后用數字圖像處理的方法把地質層構成顯示出來;環境污染的監控,有物理監控和自動化智能監控等;氣象、天氣預報的合成分析。
3.2 生物醫學中的應用
顯示圖像處理,平常我們所使用的CT照,B超等技術;DNA顯示分析;生物進化的圖像分析;專家系統如手術規劃;內臟大小、形狀、活動及異常檢出分析;癌細胞的識別。
3.3 工業應用
產品無損檢測、焊縫及內部缺陷檢測;流水線零件自動檢測識別;生產過程的監控;交通管理、機場監控;支票、簽名辨偽及識別;機器人視覺系統的應用。
3.4 軍事公安領域中的應用
罪犯臉型的合成;指紋自動識別;巡航導彈主動識別;手跡、印章的鑒定識別;遙控飛行器的引導;雷達的目標偵察。
數字圖像處理短短幾十年得到了飛躍式的發展,技術的精進帶來的是我們生活中、科技中。教育中、醫學中的各種技術的發展,人們的生活質量在一天天提高,工廠和生產等的工作效率也是突飛猛進,這些都離不開智能化,自動化的數字圖像處理技術,在未來的不久,數字技術將給我們帶來更為巨大的改變。
篇2
1 引言
膠帶的縱向撕裂問題是一個在國內國際都普遍存在的問題[1]。如何設計一種能對膠帶實行實時監控的、并且在縱向撕裂發生后快速可靠的膠帶保護裝置,在國內外都是一個正在努力攻克的難題。相比較而言,由于我國煤礦的數量和膠帶輸送機的數量遠遠超過國外任何一個國家,而國內的膠帶質質量與國外相比有很大的差距,縱向撕裂識別和保護問題在我國煤礦生產中更加受到重視,其中亟待解決的問題之一是進行有效的實時識別縱向裂縫。
國內外從70年代就開始縱向裂縫的識別研究,己從接觸式發展到非接觸式,從單一化到智能化,除嵌入法、光電傳感技術、超聲波掃描技術之外,現在又有了改進后的嵌入法、超聲波技術和最新研究探討的原子物理方法等等。由于煤礦生產環境的惡劣,每種方法都有其不成熟和不穩定的地方。因此,本文利用數字圖像處理技術靈活性高、再現性好、處理精度高、適用面寬以及處理算法和圖像特點相關性高的優點,根據礦用膠帶圖像的特點,選取結構識別方法,利用裂縫處灰度跳變的特性,使用了符合其特點連通域檢測,通過圖像預處理,圖像切割,以及連通域檢測三個步驟實現了礦用膠帶的縱向裂縫的識別。
2 圖像的分析及其預處理
當大多數縱向撕裂發生后,膠帶表面會有變化,用肉眼能辨別的出來,我們可以在膠帶下安裝若干個攝象頭,然后用計算機進行圖象識別,利用膠帶撕裂前后的圖象特征變化來進行即時的監控。即可以進行預防以及及早的對發生的撕裂進行處理。由于膠帶下面的環境比較惡劣,我們可以使用低照長壽命ccd攝象機。攝象機的安裝地點要兼顧實用性和經濟性,基于以上兩個原則,要安裝在最容易發生膠帶撕裂的部位,在膠帶的機頭、機尾以及轉折點各安裝一個,以一個適合的高度盡可能照顧大的范圍。
本實驗系統由CCD攝像頭、數據采集卡及識別軟件系統和電腦組成。其中硬件包括CCD采集卡、視頻采集卡和電腦主機;識別系統模塊包括圖像采集模塊,預處理模塊,邊緣檢測模塊以及識別模塊。
首先對裂縫圖像進行了整體、灰度、噪聲三個方面進行了分析,得到其幾何、數學、灰度分布上的特點,針對這些特點選擇合適的圖像處理算法。由于彩色圖像其信息容量比灰度圖像大,因此處理難度大、速度慢,而且在識別裂縫的過程中,灰度圖像所含的信息量已經足夠,因此先將彩色圖像轉換成為灰度圖像。然后根據圖像的灰度直方圖進行像素分析,根據分析的結果進行自適應閾值分割,通過計算或設定一個概率值,根據總像素值和灰度分布來確定分割的閾值,然后調用閾值分割程序來進行閾值分割。圖像預處理還包括最重要的一個部分:圖像濾波,分析了圖像噪聲來源,選擇了合適的濾波器,對濾波效果進行了分析,并對不同形狀的裂縫選擇了不同的濾波模板。
其次對圖像進行形態學處理。由于在一幅裂縫圖像中,在圖像預處理的過程中或多或少的會對原始圖像中的裂縫區域帶來影響,例如:將屬于裂縫區域的點去除,可能導致連續的一條裂縫被分割為幾條或裂縫的區域減小,因此要對預處理后的圖像進行形態學處理,使裂縫區域得到恢復和加強。圖1(b)是使用中值濾波進行平滑處理的效果。
3 圖像邊緣分割
圖像分割是實現圖像識別膠帶是否撕裂的重要步驟,分割效果的好壞直接影響這系統的識別率,是特征提取、裂縫識別的前提準備步驟,在系統視線中占有不可忽視的地位,因此如何提高分割效果,減輕識別難度也就成了我們的首要任務,也是課題實現的難點之一。主要體現在以下兩個方面:首先,目前不存在適合所有類型圖像的通用分割算法,現有的分割算法都是針對具體應用而設計的,因此我們必須根據膠帶撕裂裂縫圖像的特征,即直方圖沒有明顯雙峰,裂縫與背景的比例像素懸殊等特點,來設計適合本系統的分割算法,其次,由于本文中盡心分割的裂縫圖像是從實際環境中獲取的,受到的干擾很大,煤礦膠帶下的情況惡劣,造成我們獲得的原始圖像質量較差,為進行有效分割帶來困難,因此選擇一個分割算法,使其能夠最大程度去除噪聲、邊界、偽缺陷等非裂縫區域,保留裂縫區域,減輕后續處理的復雜度,是本步驟的關鍵。
常用的算子可以分為一階微分算子和二階微分算子。一階微分算子通過梯度值來進行邊緣檢測,用此方法可以忽略細節,得到的邊緣也較粗,如圖2所示為一階算子Sobel算子對膠帶裂縫輪廓的提取圖;二階微分算子是通過尋找二階微分中的零穿越來檢測邊緣。用此方法得到的邊緣較細,在細節方面較好,但物體的整體輪廓不如一階微分算子明顯。由于縱向裂縫識別是以裂縫輪廓作為基礎,而對其它細節可以不予考慮,從上面提取的裂縫輪廓圖像可以看出Sobel算子符合識別的要求,所以選擇Sobel算子。
4 縱向裂縫的提取和識別
對于二值圖像的連通域標記處理操作就是從白色像素(通常用“1”來表示)和黑色像素(通常用“0”表示)組成的一幅點陣圖像中,將互相鄰接(一般研究的是4鄰域連接)的目標“1”值像素集合提取出來,并為圖像中不同的連通域填入不等的數學標記。該處理過程是圖像處理和分析中一個非常重要的基礎操作,有著廣泛的應用領域。
為了對圖像的連通域進行標記,需要對一幅圖像作從左到右,從上到下的水平掃描。需檢測當前被掃描到的點是不是和周圍的點連通,需要檢查當前的像素和以前標記過的鄰近像素的值是否一樣。如果當前像素的值和鄰近像素的值一樣,就表示它們連通,反之,就表示和此鄰近像素不連通,此時當前點就要給一個新的標記,同時標記保留在一個與原二值圖像像素點個數相同的二維數組中。
令S代表一幅圖像中的像素子集,如果在S中全部像素之間存在一個通路,則可以說兩個像素p和q在S中是連通的。對于S中的任何像素p,S中連接到該像素的像素集叫做S的連通分量。如果S僅有一個連通分量,則集合S叫做連通集。在很多場合,二值圖像提取連通分量是許多自動圖像分析應用的核心任務。
現場圖像經過二值化處理后,形成多個互不相連的區域,而單個區域都是連通的,將連通域分開標記,就可以得到多個獨立的區域,連通域標記算法可以找到圖像中所有的連通成分,并對同一連通成分的所有點分配同一標記。
具體算法如下:
(1)將所有的白色像素(背景)賦值為0,所有黑色像素(裂縫連通域所在)賦值為-1,連通域個數置為0;
(2)尋找一個連通域開始的像素(值為-1),并將其值改為當前連通域數,存儲,連通域個數增加1;
(3)所有像素搜索。找到值為-1的像素(表示沒有被搜索過),正向搜索其周圍有沒有值為當前連通域數的像素。如果有,將當前像素賦以連通域的值;
(4)如果沒有像素被搜索,表示當前所有像素已被遍歷,轉步驟2;
(5)如果步驟2中沒有找到開始像素,表示所有連通域已經被遍歷。
5 結語
本文利用圖像處理技術,針對膠帶撕裂圖像中的裂縫進行識別,分析了該圖像的特點,通過圖像預處理,圖像切割,以及連通域檢測三個步驟識別裂縫。取得了以下的成果。
(1)裂縫圖像預處理。分析裂縫圖像的像素分布,得到其分布上有相似灰度級出現概率不同的特點。并且分析了裂縫圖像中的噪聲來源。針對其特點選用中值濾波。這個模塊主要完成了彩色圖像的灰度化、灰度拉伸、中值濾波處理。
(2)裂縫的邊緣檢測。比較了幾種邊緣檢測的方法,得到了效果最好的Sobel邊緣檢測方法,方便下一步的裂紋檢出。
(3)裂縫檢出。經過前期處理后,圖像中的裂縫從背景中分離出來,每個裂紋形成一個像素互相連通的區域,利用連通域檢測算法,從而將裂紋檢測出來。
[參考文獻]
[1] 黃民,李恩等.鋼繩芯輸送帶縱向撕裂監測方法研究[J].中國礦業大學學報,2002.31.
[2] 劉英林.輸送帶縱向撕裂的檢測與監視[J].山西礦業學報,1995(13).
[3] 吳劍鋒,張紅衛.膠帶輸送機膠帶損壞原因及運行理論分析[J].中州煤炭,2005,2.
篇3
1.數字圖像處理技術的內容及特點
1.1 研究內容
不管應用到哪個領域的圖像處理圖像數據都要輸入、加工和輸出圖像,其研究內容:
(1)獲取、表示和表現圖像――把圖像信號轉化為計算機可以識別的形式,并把數字圖像顯示和表現出來。
(2)圖像復原――已知圖像發生退化的緣由時,對圖像進行修復,關鍵是建立退化模型。復原是以模型和數據的圖像恢復為基礎,消除退化的影響。
(3)圖像增強――對圖像質量的常規改善。當不知道圖像退化原因時,還可用此技術比較主觀的改善圖像。
(4)圖像分割――人類視覺系統可以輕松地將觀察到的對象區分開來,但計算機卻很難。分割的基本問題目前是將各種方法融合使用,以此提高處理的質量。
(5)圖像分析――檢測和測量圖像中的目標,獲取其客觀信息,是從圖像到數據的過程。
(6)圖像重建――指從數據到圖像的處理。
(7)圖像壓縮編碼――為減少數據容量、降低數據率、壓縮信息量,在不影響其效果的前提下減少圖像的數據量。
1.2 數字圖像處理技術的特點
(1)圖像再現性好――不會因為對圖像的變換操作而影響到圖像質量;
(2)圖像處理精度高――可以將圖像數字處理為任意大小的數組;
(3)適用面寬――來自不同信息源的圖像被變換為數字編碼形式后,都可以用數組來體現灰度圖像。
(4)靈活性高――圖像處理可完成線性及非線性處理。
2.應用領域
數字圖像處理技術被應用到越來越多的領域中,如醫療保健、航空航天、交通通信、軍事、工業、農業、林業等。下面選取幾方面進行分析:
(1)試聽資料證據――視聽資料證據是重要的訴訟證據,在司法訴訟活動中發揮著越來越重要的作用,數字圖像處理技術是視聽資料證據中圖像證據資料技術性司法鑒定的常用手段,是圖片原始性、真偽性、相關性認定的基本方法,如名捕監控錄像模糊圖像處理系統,該系統是手印、足跡、槍彈痕跡、工具痕跡、印章檢驗、文件檢驗以及錄像帶處理等痕檢、文檢、視頻圖像處理工作的必備工具;以及實時視頻降噪儀,能夠實時處理現場錄像流,增強視頻的清晰度,該在錄像安全系統中加強監視錄像的清晰度,或者在警方實地調查拍攝錄像后回到警署再進行降噪。
(2)電子商務――當前的電子商務中,圖像處理技術也大有可為,如身份認證、產品防偽和水印技術等。
(3)軍事公安領域――軍事的目標是偵察、制導和警戒系統和自動滅火器的控制及反偽裝;公安部門的現場照片、指紋、手跡、印章和人像等的處理和辨識;歷史文字和圖片檔案的修復和管理等。而數字圖像處理技術將數碼攝影和圖像處理技術結合起來以其獨特的優勢在公安領域中逐步開始擔當重任,在刑事攝影、檔案管理、痕跡檢驗、文件檢驗、法醫、物證提取以及公安教學或宣傳中發揮著巨大作用,為廣大的公安人員開闊了視野、拓展了思維空間,為執法的公正性提供了有力保證,應用提高了工作效率,減少了人、財、物的消耗,大大提高了工作效率。
(4)智能交通――圖像處理具有算法柔性大、適應能力強等特點,在智能交通系統中取得了廣泛的應用價值,例如車牌識別(車牌定位、車牌傾抖校正與字符分割、車牌字符識別變換等)和車輛檢測與跟蹤系統(包括感興趣區域提取、車輛檢測、車輛跟蹤等),智能車輛導航、車型識別、交通控制等。
(5)航空航天通信――包括圖像傳輸、電視電話和視會議等,主要是進行圖像壓縮甚至理解基礎上的壓縮。
(6)遙感技術――航空航天和衛星搖撼圖像獲取中和獲取后都要用圖像處理技術進行加工處理,提取出有利用價值的信息。主要用來對地形地質、礦藏資源搜索以及農業、水利、森林和海洋等資源調查研究,對自然災害進行預測預報、檢測環境污染、處理氣象衛星云圖以及識別地面軍事目標。
(7)生物醫學領域――圖像處理在醫學界的應用非常廣泛,圖像處理首先應用于細胞分類、染色體分類和放射圖像等,臨床診斷和病理研究中都大量接住了圖像處理技術。它的直觀、安全方便、無創傷的優點受到醫生和患者的青睞。
(8)工業生產中的應用――在生產線中對產品及部件進行無損檢測
(9)機器人視覺――機器視覺相當于智能機器人的重要感覺器官,可以對三維景物進行理解,醫院、工廠、郵政以及家庭中的智能機器人,識別和定位裝配線工件,太空機器人的自動操作。
(10)視頻及多媒體系統――目前,電視制作系統中廣泛使用圖像處理、變換和合成技術,使電視效果更佳。在多煤體系統中廣泛使用靜止圖像和動態圖像的采集、處理、存儲、傳輸和壓縮,以達到使用者的目的。
(11)科學可視化――圖像處理和計算機圖形學的緊密結合,使科學研究得各個領域有了更為新穎的研究工具。
(12)宇宙探測――由于探索太空的需要和太空技術的快速發展,需要用數字處理技術來處理從外太空獲取的大量星體照片。
(13)地質勘探――近年來發展起來的以數字圖像處理技術為基礎、綜合多門學科知識的地學信息處理新技術的多源地學信息綜合圖像處理,使用一些特定的圖像處理方法,實現了多源地學信息綜合圖像處理,用來輔助地質填圖,構造地質研究,進行寸產資源的預測和評估,成為當前地質工作者正在研究和探討的一個問題。
由圖像處理技術在以上幾個領域中的應用可以看出,圖像處理技術在各領域中的重要程度:計算機圖像生成技術在航空航海中可以充當仿真訓練系統,還可以應用到廣告和動畫制作,跟友人將其應用到網游中;圖像傳輸與通信還可在多媒體教學、網絡視頻領域得到廣泛應用;在醫學上,醫學圖像處理和材料分析也日益重要,如超聲成像、X光成像、Y光成像以及核磁共振成像,對醫生工作產生了巨大的輔助;圖像跟蹤和光學制導在戰略技術武器中發揮了重要作用。
3.發展方向
隨著計算機的發展,圖像處理技術將越來越成熟,對各領域的影響也越來越大,總的來說,圖像處理技術的發展有以下幾個趨勢:
(1) 在目前的基礎上,圖像處理速度越來越快,分辨率越來越高,多媒體應用光來月廣泛,標準化、立體化程度越來越高,并產生智能化的趨勢;
(2) 在目前二維基礎上將出現多維成像的趨勢;
(3) 芯片廣泛運用到圖像處理技術中,使用起來更加方便;
(4) 將出現新的算法與理論。
圖像處理技術在各個領域的應用與發展,大大降低了相應領域的工作難度,效率更高,質量也無可挑剔,使人類受益匪淺。日后圖像處理技術將進一步根據人類需求,在相關科研人員的努力奮斗下而實現新的突破,在更為廣闊的領域造福人類事業。
參考文獻
[1] 李紅俊,韓冀皖.數字圖像處理技術及其應用. 計算機測量與控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]楊枝靈,王開.Visual C++數字圖像獲取、處理及實踐應用.人民郵電出版社,2003
篇4
1巖土力學的研究現狀
巖土力學是近展起來的一門新興學科,也是力學和地學相結合的一個基礎學科。過去,工程中遇到的巖土工程問題,往往多憑經驗解決,但工程實踐表明,單憑經驗越來越難以適應日益發展的工程規模和工程的復雜性,從而在工程設計中預測巖土工程的可靠性和穩定性,并使工程具有盡可能的經濟性,這些巨大的工程建設問題,大大促進了巖土力學的發展。
巖土力學試驗是巖土力學發展的基礎,它包括實驗室巖土力學參數的測定、現場巖體的原位試驗及監測技術、巖體構造的測定等。隨著試驗設備和技術手段的提高,巖土力學的試驗水平有了較大的發展,如常規的單軸拉伸、巖體弱面直剪試驗、巖土應力應變破壞全過程試驗和巖土流變等.
巖土損傷力學研究的重點是建立損傷變量和損傷擴展之間的本構關系,自從掃描電鏡技術引入巖土損傷研究以來,我國學者在這方面進行了大量的研究工作。許江[1]等采用帶有加載裝置的光學顯微鏡進行了砂巖在不同加載階段的損傷裂紋分析;孫鈞等[2]采用帶有微型加載裝置的掃描電鏡對巖土的微損傷擴展進行研究。這些研究有力地推動了巖體損傷力學的發展。另外,楊更社等[3]在巖土損傷CT識別方面進行了嘗試性的研究。
分形幾何由于可以很好地描述巖土力學中的不規則性和不確定性,在巖土力學領域得到了不同程度的應用。
2數字圖像技術在巖土力學研究中的應用
2.1傳統研究趨勢的轉變
隨著巖石力學的發展,研究工作的重點已經從建立在均勻介質假設基礎上的巖石宏觀力學行為研究轉向巖石內部細觀和微觀結構對其宏觀力學性質影響的研究。巖石斷面的數字圖像包含了我們所關注的大量巖石細觀信息,其處理技術也正隨著計算機的發展日新月異。
近20 年來,數字圖像處理(digital image processing ,簡稱 DIP)作為一種材料細觀空間結構及幾何形態的精確量測和數字表述手段快速地被應用于瀝青混凝土、土和巖體的細觀結構定量分析中[4]。特別是其在巖石工程中的應用為人們全面認識巖石的非均勻性、內部結構特征、各組分的形態特征及相應的細觀力學特性開辟了新的道路
2.2數字圖像技術在研究巖土力學方面的優越性
數字圖像處理技術作為一種材料細觀尺度上的空間結構精確測量和數字表述手段,已廣泛應用于土、巖石及混凝土的細觀結構定量分析中。應用數字圖像處理進行的巖石細觀力學研究是對巖石力學研究方法的革新數字圖像量測技術是一種非接觸無損量測技術,克服了接觸量測容易對測量體造成擾動、破壞以及測量誤差大、工作效率低等缺點,并且可以進行局部變形量測以及動態量測。
3 結論
隨著巖石力學的發展,研究工作的重點已經從建立在均勻介質假設基礎上的巖石宏觀力學行為研究轉向巖石內部細觀和微觀結構對其宏觀力學性質影響的研究。巖石斷面的數字圖像包含了我們所關注的大量巖石細觀信息,其處理技術也正隨著計算機的發展日新月異。國內外發表的有關DIP 應用于巖石內部結構定量分析及細觀力學計算的研究成果表明,DIP 具有傳統測量和分析手段無可比擬的優越性:
(1)數字圖像量測技術是一種非接觸無損量測技術,克服了接觸量測容易對測量體造成擾動、破壞以及測量誤差大、工作效率低等缺點,并且可以進行局部變形量測以及動態量測,這些都是傳統測量方法無法完成的。
(2)DIP 成功地表征了巖石的非均勻性,使我們可以方便、直觀地研究巖石的不同礦物及結構對其宏觀力學性質的影響,可以將巖石的巖性劃分得更為具體,這將在巖土工程建設中發揮重要作用。
綜上所述,數字圖像處理為巖石內部細觀介質的空間分布及變形進行精確測量和數值表述提供了可行途徑,這意味著在理論上可以突破將巖石當作均勻介質的傳統假設,從而深化對巖石宏觀力學行為的本質認識。巖土工程的建設給巖土力學研究提出了許多挑戰性的課題,為解決重大巖土工程面臨的問題提供強有力的理論工具。
參考文獻
[1] 許江,劉婧,程立朝等.壓剪應力條件下砂巖雙面剪切細觀開裂擴展演化特性試驗研究[J]. 巖石力學與工程學報, 2014, (4):649-657.
[2] 孫鈞.巖土力學在我國的若干進展[J].西部探礦工程,1999,11(1):1-5.
[3] 楊更社.巖土損傷特性的CT識別[J].巖土力學與工程學報,1996,15(1):48-54.
篇5
1 研究背景
2003年4月,中國教育部了《關于啟動高等學校教學質量與教學改革工程精品課程建設工作的通知》,提出精品課程是具有一流教師隊伍、一流教學內容、一流教學方法、一流教學管理等特質的示范性課程。經過幾年的推行實施,國家精品課程在數量上已具有一定規模,質量上也在逐年提高,但是在課程資源等方面仍然存在不足之處:(1)課程資源庫建設。在《國家精品課程評價指標體系》中,課程資源主要是通過教學內容和教學條件兩大項來評價,他們是課程的核心部分,是教學信息設計、組織與呈現等教學設計思想的具體化表現。經過這幾年的努力,課程資源建設模塊逐漸約定俗成,絕大多數課程均有課程介紹、教學大綱、教學安排、授課錄像和試卷習題等,而實驗/實踐稍差,學習/教學指導、電子教材和素材庫等最為薄弱;(2)課程資源類型。精品課程充分發揮現代教育技術強大功能,采用各種多媒體技術來呈現教學信息,如音/視頻、PowerPoint、Word、Flash等,課程資源類型可以分為演示型、過程型、交互型、管理型和評價型5種,但是現在絕大多數課程都不重視過程型和交互型資源的建設,更是忽略知識管理型和評價型資源的建設[1]。
2 需求分析
精品課程網站的設計與開發,充分發揮計算機在呈現信息、提供聯系、激發動機、學習評價方面等方面優勢,彌補了教師、課本、視聽媒體的不足;計算機作為使用者收集和組織信息、探究與批判性思考、合作與交流的工具,能很好的激發學習者的學習動機,促進有意義學習的發生;另外,精品課程的設計與開發,突破了時空限制,具有傳播范圍廣的特點,任何人、任何時間、任何地點都可以按各自的興趣選擇任何課程進行學習。總之,精品課程網站的設計很好的適應了當今世界國際化、信息化、知識化等特征的要求,學習者能更好的實現自主學習。《遙感數字圖像處理》是一門專業基礎課,是以理論聯系實踐為主,注重運用,重視上機實踐的一門課程。對于這樣一門操作性較強的課程,設計與開發它的精品課程網站是非常有必要的。《遙感數字圖像處理》精品課程網站的設計與開發依托了校級《遙感數字圖像處理》精品課程的建設,面向遙感數字圖像處理專業的學生,旨在輔助學生完成對本門課程的自主學習,實現學習效果的最優化,其目的是為了讓學生通過學習,打牢遙感數字圖像處理的基礎知識,進而可以運用到實踐中。通過該課程的學習,使學生樹立正確的遙感數字圖像處理的概念,培養學生良好的計算機實踐習慣,實事求是的科學態度和嚴謹細致的工作作風,為后繼課程的學習和將來參加社會生產實踐打下基礎。
3 主要技術簡介
3.1 ASP技術簡介
ASP是Microsoft Active Server Pages的簡稱,是服務器端腳本編寫的環境,可以創建和運行動態、交互的Web服務器應用程序,即可以組合HTML頁、腳本命令和Web頁和基于Web的功能強大的應用程序。ASP不是一種語言,它所使用的語言是Javascript或VBScript,或者是這兩種語言的結合體。總的來說,ASP具有以下的特點:(1)使用簡單易懂的腳本語言(Javascript或VBScript等),結合HTML就可以快速開發出各種各樣的應用程序;(2)不需要編譯,容易編寫,而且代碼在服務器端直接執行;(3)ASP源程序在服務器端被執行后,將執行結果返回給客戶端,從而提高了源程序的安全性;(4)可使用服務器端腳本來產生客戶端腳本;(5)由于ASP程序在服務器端執行,因此只要客戶端使用的瀏覽器可以執行HTML代碼即可。這樣便最高限度地保證了ASP程序的通用性;(6)可以使用VB等多種編程語言來開發ActiveX服務器組件來擴充服務器端程序的功能;(7)使用普通的文本編輯器即可對ASP程序進行設計、修改;(8)ASP提供了幾種內置對象使得腳本功能更強大,在其他方面,這些對象完成從瀏覽器中檢索或向瀏覽器發送信息的功能。總之,ASP是目前網頁制作技術中最容易學習、靈活性也最大的工具之一。更重要的是它擁有非常好的可擴充性。像標準的HTML文件一樣,ASP包含可以被Web瀏覽器顯示并解釋的HTML標簽。通常放入HTML文件的Java小程序、閃爍文本、用戶端腳本、用戶端ActiveX控件都可以放入Active Server Pages中[4]。
3.2 ACCESS技術簡介
Microsoft Office Access(前名 Microsoft Access)是由微軟的關聯式數據庫管理系統,是 Microsoft Office的主要成員之一。Access能夠存取 Access/Jet、Microsoft SQL Server、或者任何ODBC兼容數據庫內的資料。Access 數據庫由七種對象組成,它們是表、查詢、窗體、報表、宏、頁和模塊。
表(Table)―是數據庫的基本對象之一,是創建其他對象的基礎。表由記錄組成,記錄由字段組成,表用來存貯數據庫的數據,因此又稱數據表。
查詢(Query)―查詢可以按索引查找到需要的記錄,按要求篩選記錄并能連接若干個表的字段從而組成新表。
窗體(Form)―窗體提供了一種方便的瀏覽、輸入及更改數據的窗口。還可以創建子窗體顯示相關聯的表的內容。窗體也稱表單。
報表(Report)―報表的功能是將數據庫中的數據匯總,然后打印,以便
分析。
宏(Macro)―宏相當于DOS中的批處理,用來自動執行一系列操作流程。Access列出了一些常用的操作以方便用戶選擇,使用起來十分便捷。
模塊(Module)―模塊的功能和宏相似,但其操作比宏更加精細和復雜,用戶可根據自己的需求編寫程序。
頁―是特殊的直接連接到數據庫中數據的一種WEB頁。通過數據訪問頁可將數據到Internet 或Intranet上,而且可以適用瀏覽器進行數據的維護和操作。
參考文獻
[1] 許坦,石.精品課程發展現狀綜述[J].中國電化教育,2007(5):244.
篇6
Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.
Key Words:license plate identification;DSP;algorrithm
1 引言
據公安部相關數據統計,現如今我國汽車保有量已達2.4億輛,且每年的增長率都在15%以上,應用智能交通系統來解決隨之產生的交通問題已是大勢所趨。基于DSP的車牌識別方法是智能化車牌識別的有效方法。現如今,自動車牌識別技術已被廣泛應用,但由于算法的復雜性與效率的矛盾,及算法于系統上的應用的困難性,對車牌識別的關鍵算法還有待于更深入的研究。
2 硬件系統結構
通用可編程的DSP芯片的硬件技術的發展給數字圖像處理帶來了飛躍性的進步。要實現車牌識別,需要數字圖像處理技術中的很多復雜的算法,基于DSP的車牌識別系統也因此得到了廣泛的研究與應用。為了提高整個系統的可操作性及性價比,當前應用最多的是分布式的處理模式,即聯合PC機與DSP的優勢共同完成車牌識別系統,其總體結構及具體結構如(圖1)所示:
3 車牌識別關鍵算法
算法流程為圖像預處理、車牌定位、車牌分割,最后字符識別。圖像預處理為提高攝像機攝取的圖像質量,便于后續處理。利用DSP技術在處理車牌識別關鍵算法中的車牌的定位與字符分割方面優勢顯著。
3.1 車牌定位
基于灰度圖像的定位技術日趨成熟,但彩色圖像包含了圖像的更多信息特征,加之車牌的底色是有規律可循的,所以基于彩色圖像的定位技術越來越成為在發展定位技術上的突破點。本文定位的思路為:
(1)圖像從RGB空間轉換到HSI空間,其算法為(以藍底白色車牌為例):
(3)對二值圖像進行水平投影[1],從車牌固有的矩形特征中的高度特征提取車牌圖像,如圖3所示。再使用特征顏色邊緣檢測法,檢測車牌正確位置,如圖4所示。
(4)根據車牌固有的矩形特征中的寬度特征,使用垂直投影法提取車牌圖像,如(圖5)所示:
3.2 字符分割
字符分割是字符識別的關鍵前提。在2013年新交通法規中規定,對故意遮擋、污損、不安規定安裝車牌的扣12分的處罰,這項規定的出臺,也間接降低了算法的復雜性。本文采用車牌字符間隔的特征在垂直投影中的規律來進行字符分割。
其算法原理為:
(1)設垂直投影值為T,閾值為V,在確定前還要充分考慮字符粘連、斷裂及“1”字符的特殊性。當時,T=0。
(2)設數組為從左向右掃描的投影值,當掃描的數組的值時,字符的寬度設為。根據規律[2],單個字符的寬度約為45mm,除第2、3字符的間隔為34mm,其它字符的間隔均為12mm。由此,得出以下3中情況:
(1)時,為字符粘連,取為單個字符的寬度;
(2)且后面的字符也如此時,為字符斷裂,合并這兩個字符;
(3)且不滿足字符斷裂,此字符為數字“1”。
實驗結果如(圖6)所示:
4 結語
本文在以DSP處理器TMS320DM6437嵌入式系統上對以上兩大關鍵算法進行實驗研究,在150張不同類型的車牌進行識別后,測試結果的正確率92.3%,且處理的速度達到實時處理的需求。為以后在智能交通控制系統中的車牌識別技術的提高和發展提供了參考基礎。
參考文獻
篇7
中圖分類號:TP319
文獻標識碼:A文章編號文章編號:16727800(2017)005004704
0引言
圖像識別是一項利用計算機對圖像進行處理、分析和理解,以識別各種不同模式目標和對象的技術[1]。圖像識別技術目前還不能達到人類的認知水平,但在特定應用環境中,可以通過模式識別或者神經網絡的方法來對圖像中的事物進行分類判斷。一般而言,一個數字字符識別系統主要由3個部分組成,如圖1所示。
圖1系統組成
其中,預處理模塊將圖片格式(例如JPG格式)轉換為計算機能識別的二進制數據流;圖像處理模塊則實現圖像采集與轉換、邊緣提取、歸一化等功能;字符識別模塊可以由兩種方法實現:模式識別或者神經網絡方式,本文系統采用神經網絡方式。
1識別目標及預期結果
此系統識別目標是在沒有強干擾下,系統能夠準確識別出圖片中的0~9這10個數字。示例圖片如圖2所示。
系統識別中所用到的含單個數字的圖片取自圖2,均為純色背景(不一定必須為白色背景)圖片,且圖片中數字圖像無較大噪聲干擾。系統經過一系列處理后,能成功識別,給出識別結果,并且給出處理過程中各個階段的圖片,以便更好地理解圖像處理過程。
2預處理
預處理是將圖片二值化的過程。預處理的目的簡單來說就是把彩色圖片處理為計算機更好處理的二進制數據流。預處理的過程主要分兩部分:彩色圖轉灰白圖,灰白圖轉二進制矩陣形式數據。
目前用于彩色圖轉換為灰度圖的基本算法主要有:最大值法、平均值法、加權法,本文采用加權法。加權法的主要思想是設當前像素的三分量分別為R,G,B,然后利用公式(1)得到轉換后的像素分量值:
GRAY=0.3*R+0.59*G+0.11*B(1)
在MATLAB中,函數img2gray就是采用加權法實現的。圖像二值化就是將圖像像素點的灰度值設置為0或255,也就是將整個圖像呈現出明顯的黑白效果。二值化的處理過程是將圖像中有意義的特征和需要應用的特征進行分割,利用前景和背景灰度特性的差異,低于閾值的像素設定為一個灰度值,高于閾值的像素設定為另一個灰度值。這樣可將前景色與背景色以明顯差異的灰度級區分開來[2]。閾值選取有手動選取和自適應選取兩種方法。MATLAB中圖像二值化的實現主要依靠im2bw函數來實現。圖像二值化過程中,最重要的是閾值變換。比如數組a=[120,254,0,200,99],設定一個閾值125,并對a進行閾值變換,那么a中凡是大于125的,則變為255,小于等于125的則變為0。具體對臨界情況處理可能不同,不過MATLAB中im2bw函數是按照上述方法處理的。a經過閾值變換后變為[0,255,0,255,0]。在MATLAB中使用im2bw函數進行圖像二值化處理時(將圖像轉換為二值圖像),人為設定閾值并不總是十分有效。MATLAB工具箱提供了graythresh函數[3]。該函數使用最大類間方差法得到一個閾值,利用這個閾值進行圖像二值化通常有效。
經過預處理后得到的二值化圖像,還要經過一系列圖像處理過程,才能用于神經網絡訓練。
3圖像處理
圖像處理的目的是將圖片變為神經網絡能處理的數據流。圖像處理流程如下:
(1)利用梯度銳化。使得圖像更加突出,以便分析。算法:當前點像素值與其下一個像素值之差的絕對值,加上當前點像素值與其下一行當前像素值之差的絕對值,如果結果大于閾值,則當前像素值置為此結果。
(2)去除離散噪聲。利用遞歸方法查找當前像素8個方向是否存在黑色像素,這里設置連續長度為15,如果用遞歸方法得到連續像素值大于15,則認為不是噪聲;相反,則認為是噪聲,則置為白色像素。
(3)字符傾斜度調整。盡量保存每個字符的位置一致。
(4)分割字符。找出每個字符的區域,用矩形記錄,記錄每個字符矩形數據。
(5)字符歸一化。根據圖像預處理準備階段設置的歸一化標準,把每個字符的區域進行歸一化,使得所有字符區域矩形一樣大,只是位置不一樣。
(6)字符緊密排列。把所有字符緊密排列,以備識別使用。
本文示例樣本圖片中只有單個數字,且無較大干擾,所以不需要去除離散噪聲、字符傾斜度調整、分割字符和字符緊密排列等步驟。經過預處理的圖像數據,只需要進行銳化和歸一化處理,就可以用于神經網絡訓練。
圖像梯度銳化的目的是使原來的模糊圖像變得清晰。MATLAB中使用的梯度函數為gradient函數。Gradient(F)函數求的是數值上的梯度,計算規則:[Fx,Fy]=gradient(F),其中Fx為其水平方向上的梯度,Fy為其垂直方向上的梯度,Fx的第一列元素為原矩陣第二列與第一列元素之差,Fx的第二列元素為原矩陣第三列與第一列元素之差除以2,以此類推,如公式(2)。
最后一列則為最后兩列之差。同理,可以得到Fy。
歸一化就是把需要處理的數據經過處理后(通過某種算法)限制在要求范圍內。對于圖像處理中的w一化而言,就是將所有數字圖像中的字符歸化成為一個具有同一高度、同一寬度的圖像,也即讓其中的字符具有同樣規格。MATLAB中用于實現圖像矩陣歸一化功能的函數是mat2gray函數[5]。該函數在數字圖像處理中經常用到,歸一化的具體流程如圖4所示。
經過歸一化處理之后的圖片數據,將其存儲在一個矩陣中,用于神經網絡的訓練。
4神經網絡訓練
人工神經網絡算法主要有兩種:一種是先對待識別字符進行特征提取,然后用所獲得的特征來訓練神經網絡分類器[6];另一種方法是直接把待處理圖像輸入網絡,由網絡自動實現特征提取直至識別出結果。前一種方法識別結果與特征提取有關,而特征提取比較耗時。因此,特征提取是關鍵。后一種方法無需特征提取和模板匹配,隨著相關技術的進步,這種方法更實用。
神經網絡有許多種,在MATLAB中已經有集成神經網絡工具箱。本文系統中,對數字圖像的識別采用BP神經網絡來進行訓練。BP神經網絡為前饋神經網絡,網絡的學習狀態為有導師學習狀態。它是一種具有學習能力和記憶能力的神經網絡,主要由輸入層、中間層、輸出層3個部分組成。輸入層、中間層和輸出層可以具有不同數量的節點,具體數量隨需求而定,沒有具體的標準。單層神經網絡結構如圖6所示。
BP神經網絡是誤差反傳誤差反向傳播算法的學習過程,由誤差的反向傳播和信息的正向傳播兩個過程組成[7]。輸入層各神經元首先接收來自外界的輸入信息,然后傳遞給中間層各神經元;輸入信息經過中間層內部信息處理,實現信息變換,按照信息變化能力需要,中間層可以布局成多隱層或者單隱層結構;最后,一個隱層傳遞把信息傳遞給輸出層,通過進一步處理,實現一次學習的正向傳播處理過程,輸出層把信息處理結果輸向外界。當輸出結果和預先期望效果不符時,就進行誤差反向傳播。誤差通過輸出層,根據誤差梯度下降的方式改變各層權值,由隱層向輸入層依次反傳。多次交替的信息正向傳播和誤差反向傳播過程,是各層連續修正的過程,也是神經網絡學習訓練的過程,這個步驟一直執行到最終輸出的誤差降低到能夠接受的范圍,或者預先輸入的學習次數為止。
此系統中所使用的神經網絡在中間層設置25個節點,1個輸出節點。此系統采用三層神經網絡來實現。采用s型對數函數logsig作為隱含層各神經元的傳遞函數,并采用純線性函數purelin作為輸出層各神經元的傳遞函數。此神經網絡的訓練函數采用traingdx,學習模式函數為learngdm。訓練步數最長設為5 000,性能目標設為0.001。
神經網絡模塊的部分代碼如下:
net=newff(pr,[25 1],{'logsig' 'purelin'},'traingdx','learngdm');
net.trainParam.epochs=5000;
net.trainParam.goal=0.001;
pr為前面圖像處理所獲得的矩陣數據。
神經網絡的訓練結果如圖7所示。神經網絡的性能曲線如圖8所示。
5用艚換
考慮到該系統具有一定交互功能,讓用戶能自主選擇需要識別的圖片,向系統中添加如下代碼段:
test=input('請輸入用于測試的圖片編號:','s');
x=imread(test,'jpg');
開始運行時,會提醒用戶選擇需要識別的圖片編號,效果如圖9所示。
用戶輸入需要識別的圖片序號后,系統給出識別結果和圖像處理各階段中的圖片,此處用subplot函數來實現一個窗口中顯示多張圖片的效果,部分代碼如下:
6結語
通過樣本識別驗證,本文數字識別系統具有一定識別精度。本系統基本做到樣本圖片的100%識別,對于其它只有單數字的圖片,經過訓練之后,也能準確識別。本系統實現了部分人機交互功能,能讓用戶自主選擇需要識別的圖片,并輸出識別結果和各個處理過程中的圖片。
參考文獻參考文獻:
[1]岡薩雷斯.數字圖像處理(MATLAB版)[M].阮秋琦,譯.北京:電子工業出版社,2006.
[2]梁路宏,艾海舟,徐光佑,人臉檢測研究綜述[J].計算機學報,2002,25(5):449458.
[3]羅華飛.MATLAB GUI設計學習手記[M].北京:北京航空航天大學出版社,2009.
[4]聶影.MATLAB軟件應用研究[J].軟件導刊,2014,13(7):102104.
篇8
近年來,機器人視覺導航技術有了很大的發展。移動機器人的工作環境可能比較復雜,因此,提高圖像識別的準確性以實現移動機器人的準確定位是移動機器人完成其導航任務的首要前提;同時,由于移動機器人在導航過程中需要實時的采集并分析圖像信息,從而實現對作業環境的識別以進行準確的路徑跟蹤。因此,如何在提高圖像識別的準確性的同時達到較好的實時性是移動機器人視覺技術的一個發展方向
1.圖像處理
數字圖像處理,是對數字圖像信息進行加工以滿足人的視覺心理或應用需求的行為,數字圖像處理的英文名稱是"Digital Image Processing'',通常所說的數字圖像處理是指用計算機對圖像進行的處理,因此也稱為計算機圖像處理。圖像處理就是用一系列的特定操作來改變圖像的像素,以達到特定的目標,比如使圖像更清晰,或者從圖像中提取某些特定的信息等。
CCD攝像頭的主要工作原理具體而言,就是攝像頭連續地掃描圖像上的一行,輸出就是一段連續的電壓視頻信號,該電壓信號的高低起伏正反映了該行圖像的灰度變化情況。當掃描完一行,視頻信號端就輸出低于最低視頻信號電壓的電平(如0.3v),并保持一段時間。這樣相當于,緊接著每行圖像對應的電壓信號之后會有一個電壓"凹槽",此"凹槽"叫做行同步脈沖,它是掃描換行的標志。然后就需要跳行,跳過一行后(因為攝像頭是隔行掃描的方式),開始掃描新的一行,如此下去,直到掃描完該行的視頻信號,接著就會出現一段場消隱區。此區中有若干個復合消隱脈沖,其中會有個脈沖遠寬于(即持續時間長于)其它的消隱脈沖,該消隱脈沖又稱為場同步脈沖,它是掃描換行的標志。場同步脈沖標志著新的一場的到來,不過,場消隱區恰好跨在上一場的結尾部分和下一場的開始部分,要等到場消隱區過去,下一場的視頻信號才真正到來。攝像頭每秒掃描25幅圖像,每幅又分奇、偶兩場,先奇場后偶場,故每秒掃描50場圖像。奇場時只掃描圖像中的奇數行,偶場時則只掃描偶數行。
選擇一款具有全電視信號輸出的黑白CCD圖像傳感器,用LMl881進行信號分離,結合A/D采樣,實現了視頻信號的采集。在總線周期為400M的情況下,每行采集72個有效數據,攝像頭每場信號有320行,其中第23到310行為視頻信號。我們從中均勻采集了24行,最后得到一個24×72的二維數組。
CCD采集的原始數據包含了黑線的位置信息,為了穩定可靠地提取這一信息,有一下幾種方法:
(1)二值化算法
算法的思路是:設定一個閾值value,對于視頻信號矩陣中每一行,從左至右比較各像素值和閾值的大小。若像素值大于等于閾值,則判定該像素對應的是白色道路;反之,則判定對應的是目標指引線。記下第一次和最后一次出現像素值小于閾值時的像素點的列號,算出兩者的平均值,以此作為該行上目標指引線的位置。該算法的思想簡單,具體實現時還可以一旦檢測到左邊緣后就退出該行掃描,這樣上面的流程圖將變得更加簡潔。但是這種提取算法魯棒性較差,當拍攝圖像中只有目標指引線一條黑線時,還能準確提取出目標指引線。但當光強有大幅度的變化,或圖像中出現其它黑色圖像的干擾時,并且離機器人比較近的黑線比較的明顯,離機器人越來越遠時黑線越來越淡,該算法提取的位置有可能與目標指引線的實際位置偏離較大。
(2)直接邊緣檢測算法
算法的思路是:設定一個閾值,對于視頻信號矩陣中每一行,從左至右求出相鄰兩像素值的差值(左減右)。若差值大于等于閾值,則判定下一個的像素點對應的是目標指引線的左邊緣,以此像點作為該列的特征點,記錄下此像素點的列號,作為該行上目標指引線的位置。當然,可能出現差值始終小于閾值的情況,此時一種方法是令該行上目標指引線位置為0,通過進一步濾波或擬合來修正;另一種方法是讓該行上目標指引線位置和通過上一場視頻數據求得的位置一樣。
該算法較二值化方法而言,抗環境光強變化干擾的能力更強.同時還能削弱或消除垂直交叉黑色指引線的干擾。因為該算法在視頻信號矩陣中是由左至右來尋找目標指引線的左邊緣的,所以當黑色圖像出現在目標指引線左方時,該算法無法排除干擾,而當其出現在右方時,則可以排除干擾。
(3)跟蹤邊緣檢測法
這種算法跟直接邊緣榆測算法一樣,也是尋找出目標指引線的左邊緣,仍然用左邊緣的位置代表目標指引線的位置。但跟蹤邊緣檢測從視頻信號矩陣每行中尋找左邊緣的方法與直接邊緣檢測法不同。
因為目標指引線是連續曲線,所以相鄰兩行的左邊緣點比較靠近。跟蹤邊緣檢測正是利用了這一特性,對直接邊緣檢測進行了簡化。其思路是:若已尋找到某行的左邊緣,則下一次就在上一個左邊緣附近進行搜尋。這種方法的特點是始終跟蹤每行左邊緣的附近,去尋找下一列的左邊緣,所以稱為"跟蹤"邊緣檢測算法。
在首行邊緣檢測正確的前提下,該算法具有較強的抗干擾性,能更有效地消除垂直交叉黑色指引線的干擾,以及指引線外黑色圖像的影響,始終跟蹤目標指引線。
另外,較之前兩種算法,跟蹤邊緣檢測算法的時間復雜度更低,因此效率更高。但值得注意的是第一行的左邊緣位置對整個目標指引線的搜尋影響 很大,一旦它的位置和實際導引線偏差較大,就會產生一連串的錯誤,這是不可容忍的。
通過比較本系統選擇了效率更高,更可靠的跟蹤邊緣檢測法。流程圖如圖所示:
2.結論
本文中圖像處理和路徑信息識別的方法,并對不同時刻不同位置采集到的圖像的處理效果進行比較研究,結合實際環境中的圖像特點,確定出適合于本研究的圖像處理算法。提出了改善路徑信息辨識速度和精度的方法。
參考文獻:
[1]張文志,呂恬生.基于改進的遺傳算法和模糊邏輯控制的移動機器人導航[J].機器人.2003,
25(1):1
[2]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報.2000,26(1):44-45
篇9
近年來,人們提出了許多方法用于檢測和跟蹤序列圖像中的運動目標,但是由于受到計算機速度和算法復雜度的限制,使得在檢測和跟蹤運動目標的實時性和魯棒性方面總是不太理想。同時在設備不斷小型化、集成化、網絡化的今天,FPGA由于其可編程的特點成為嵌入式開發的最佳平臺。因此,本設計核心模塊為Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心處理器,以提高系統的整體的性能。[1]
2 系統工作流程和原理
系統主要由一體化攝像機、高速數字云臺、視頻解碼器SAA7113H、圖像存儲器SRAM,FPGA控制器、以太網模塊、監視器、報警模塊等部分構成。
該跟蹤系統的工作過程為:系統開機后FPGA加載程序,然后根據算法對采集到的圖像進行處理,獲得控制云臺的參數并傳遞給云臺控制器,從而跟蹤目標運動。具體實現過程:攝像頭安裝在跟蹤轉臺上,攝像頭輸出的電視制式的信號(含有圖像和同步、行場消隱信號)一路送到監視器上進行實時監視,另一路經過視頻預處理,經過SAA7113變換后送入圖像處理單元FPGA進行圖像處理,圖像處理單元首先形成一個檢測(波門)窗口,然后在窗口中檢測、識別、提取出目標圖像信號,確定出目標在當前幀觀測圖像中的精確坐標,經計算得到相對于攝像頭瞄準線的偏差量,送至伺服機構,云臺輸出控制信號控制步進電機轉動,帶動云臺上的攝像頭轉動,使目標始終處于視場中心,從而達到跟蹤的目的[2]。通過以太網上傳目標坐標數據,用于進一步分析。
3 裝置硬件的具體實現
本裝置對核心處理器、視頻解碼芯片,以太網模塊等器件的選擇關系到整個裝置的性能和價格,即選擇性能價格比高且能滿足設計需要的器件。
3.1核心處理器選擇
處理器需要根據算法及實際被測目標對處理能力的要求來選擇。目前的處理器主要有單片機、ARM、DSP、FPGA等等。本裝置核心模塊主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,該芯片有149760個邏輯單元,RAM 635520 bit, 8個鎖相環,用戶I/O 508個,芯片具有很高的性價比,還支持SOPC ,從而完成各模塊功能,并協調整個系統工做。芯片功能很強大,為以后系統升級,算法改進,數據量增大提供很大空間。
3.2 視頻解碼芯片SAA7113 和以太網W5100配置
為了使視頻解碼芯片SAA7113H可以按照預想的方式工作,需要對其進行初始化,視頻解碼芯片為I2C串行總線,在上電后首先修改SAA7113H的內部寄存器的數值,進行正確初始化[3]。
W5100是一款多功能的單片網絡接口芯片,內部集成10/100以太網控制器,內部集成為全硬件形式,且具有經過多年市場驗證的TCP/ IP協議棧,太網介質傳輸層MAC和物理層PHY 硬件,TCP/IP等協議已經在很多領域經過多年驗證[4]~[5]。
W5100內部集成有16KB的存儲器用于數據傳輸,使用W5100不需要考慮以太網的控制,只要進行簡單的端口SOCKET編程。此外,其接口非常簡單,可選擇SPI接口。
對上述兩個模塊的設計采用SOPC方法,SOPC是一種用于嵌入式開發的片上可編程系統,設計靈活,可剪裁,可升級軟硬件在系統可編程的功能,運用FPGA 的NIOS II 對 I2C,對SPI口配置過程為:運行QUARTUS II 軟件中的SOPC BUILDER 添加I2C,SPI 模塊,從而構成功能強大的32位NIOS嵌入式系統。
4 目標的跟蹤定位
確定目標位置的方法分兩類,即波門跟蹤和相關跟蹤算法。本文采用形心跟蹤算法,該算法對跟蹤窗內的數字圖像處理得到一閾值,再從跟蹤窗內的數字圖像中分割出目標像元,然后根據分割出的全體目標像元位置數據和目標像元的點數,計算出目標的形心,目標的形心相對于視場中心的位置數據則作為目標偏差數據[6]。
5 結論
本文介紹了一種移動目標跟蹤裝置。該裝置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N為核心處理器。通過以太網上傳的跟蹤信息來看,看該系統取得了較好的跟蹤效果,實驗結果證明該裝置能夠很好的適應目標檢測和跟蹤算法,該裝置對運動目標監視和跟蹤產品有一定的參考意義。
參考文獻
[1]楊宜禾,周維真.成像跟蹤技術導論[M].西安電子科技大學出版社,1992.
[2]王栓,艾海舟,何克忠.基于差分圖像的多運動目標檢測與跟蹤[J].中國圖形圖像學報,1994(6).
[3]郝迎吉,劉青,徐凌志.基于EPP和FPGA的CMOS圖像傳感器的數據采集[J].電子設計應用,2002(01).
[4]黃釘勁,阮照軍,王剛,郭小莉.基于FPGA的圖像采集與遠程傳輸系統設計[J].西安工業大學學報,2008.
[5]放璐,楊天怡,牟萬軍.數字圖像遠程監控系統的組網方式[J].電子產品世界,2002(21).
篇10
1993年Mallat和Zhang提出了信號的稀疏表示,在信號逼近上取得了出色的表現,迅速引起了廣大學者的普遍關注,信號稀疏表示研究很快被從一維信號推廣到二維信號圖像的研究上。
稀疏表示的模型可以表示為:
式中為向量的l0范數,表示向量x中非零元素的個數,x即為信號y的稀疏表示。
在數字圖像處理中,由于圖像的數據信息具有冗余性,為冗余字典,因此可以在冗余字典上進行稀疏表示,y則為圖像子塊的列向量表示。如何構造表達能力強、訓練簡單的冗余字典是圖像處理中的關鍵一步,自稀疏表示理論的提出,在圖像去噪、去模糊、超分辨率、圖像修復等方面得到了廣泛的應用,取得了比傳統方法更好的處理結果。
1 稀疏表示理論在提高數字圖像質量中的應用
Michael Elad是較早將稀疏表示理論應用于圖像去噪與超分辨率的代表人物[1],他將K均值聚類方法引入字典訓練過程中。在K均值算法中,求解一個包括K個代碼的碼本,使得在此碼本上,根據最鄰近分配法則,對包含N個信號的集合進行分類,得到最佳分類。在稀疏表示中,稀疏表示的過程可以看做廣義矢量量化過程,其中的每個信號用多個代碼的線性組合表示。當要求K-SVD中的每個信號只能用一個原子來近似時,K-SVD算法就退化為K均值算法。K-SVD在稀疏編碼與字典更新之間交替迭代,保證總誤差單調下降,因此可保證能收斂到局部(或全局)最小值,從而得到性能優良的過完備字典。K-SVD訓練字典方法廣泛的應用在圖像復原問題上。基于K-SVD訓練得到的過完備字典,取得了較好的圖像去噪與超分辨率結果。
統計學中的主成分分析(PCA)的概念,也被引入到字典訓練當中。在統計學當中,變量個數太多會增加問題的復雜性主成分分析作為一種統計分析方法,它可以從多元事物中解析出主要影響因素,簡化復雜問題。PCA的核心思想,就是將高維數據投影到低維空間。尋找 r 個新變量,使其反映事物的主要特征,每個新變量是原有變量的線性組合,體現原有變量的綜合效果,則這 r 個新變量稱之為“主成分”,它們兩兩正交不相關。這 r 個主成分可以在很大程度上反映原來變量的信息。Hui Zou引入了SPCA(Sparse PCA)的概念,他修改了傳統的PCA方法,利用主成分負載的稀疏性,使算法變得更加易懂,且得到更為稀疏的結果。
形態學成分分析(MCA)作為一種新興的信號分解方法,吸引了很多人的注意。MCA根據圖像信號組成成分的形態差異性,將圖像內容分割為紋理區域和卡通區域。不同區域其擬合字典類型不同。小波變換可以很好的表示圖像光滑區域的特征,curvelet變換通過帶方向的局部傅里葉基,可以有效的處理邊緣特征。離散余弦變換(DCT)以及Gabor變換是紋理區經常采用的兩種處理方式。MCA充分的考慮了圖像的結構組成部分以及內部特征,廣泛用于盲源分離、圖像分解、圖像修補等。
Julien Mairal將自然圖像的自相似性引入到圖像恢復模型中。圖像的自相似性,其根本是自然圖像的統計特征。Julien Mairal非局部模型與稀疏編碼結合成一個框架,將噪聲在相似塊之間進行平均,取得了較好的去噪、去馬賽克結果。同樣,自相似性在圖像去模糊、圖像修補方面也展示了其良好的性能。
Weisheng Dong提出了一種新的圖像復原模型CSR,利用減小退化圖像分解系數與原圖分解系數之間的差異來達到復原圖像的目的,其本質是自相似性的應用。在超分辨率方面,他提出了自適應稀疏域選擇超分辨率算法,認為超分辨率重建結果的優劣很大部分取決于稀疏域的選擇,對輸入的樣本先采用K-均值聚類,采用PCA算法進行詞典訓練,將非局部相似性(NL)和圖像去噪中的自回歸(AR)模型與超分辨率重建模型有效結合,提高了超分辨率重建質量。
Nebojsa創造性的提出了圖像摘要的概念。他將圖像的特征提取為一幅摘要圖,在圖像處理過程中,對該摘要圖進行分解處理,這是合理并且有效的。Louise 利用該思想,在圖像去噪方面取得了較好的去噪結果。
Kostadin在變換域,通過一組協作濾波器,將一幅圖像中結構相似的二位塊聚合成一組,形成一個三維模型,以增強其表示的稀疏性。Aram利用該3D理論,建立了一個新的圖像模型―BM3D。BM3D在圖像復原方面表現了其卓越的性能。
最近,保持圖像幾何結構的思想吸引了很多人的注意。Samy Bengio將圖像分割成相互重疊的塊,結構相似的塊組成一個群組,分別對每個組進行分解訓練,這就是群組編碼的思想,其基本思想類似于非局部思想,也是利用了自然圖像的自相似性。關于結構稀疏方面的研究展示了結構分組比簡單不重疊的分組更一般的特性。例如,樹狀分組或是重疊分組。結構稀疏正則化具有十分廣闊的應用前景。結構稀疏PCA作為一種新型的有效的非凸稀疏方法,在字典訓練方面,可以取得較為理想的結果。
縱觀稀疏表示理論出現以后的圖像處理論文,廣大研究者著重于研究如何獲得表示能力強的冗余字典,以及通過結合多重約束,如平滑約束,相似性約束,幾何結構不變性約束等來得到高質量的圖像,近年來取得了很大的進展。但是稀疏表示屬于一種優化問題,涉及到字典學習和稀疏求解的計算過程比較復雜,因而對于該理論在圖像的實時處理上受到了限制,因此如何縮短計算時間也是這個模型急需解決的問題。
2 結語
篇11
Image Stitching Technology Overview
Cai Jian
(Nanjing University of Aeronautics and Astronautics,Nanjing210016,China)
Abstract:Today,more and more high-resolution digital images for domestic,industrial,medical and defense technology applied.With computer vision,image processing technology,using an ordinary camera computer digital image composition as a large high-resolution images of the image stitching technology came into being.
Keywords:Image;Stitching technology;Overreview
而在人們的實際生活應用中,所需要的目標場景往往超出普通數碼相機、監控攝像機等的視角范圍。這些相機,往往在增大視角會降低采集圖像的精度,而提高精度又只能窺豹一斑。因此,為了得到應用所需的高分辨、大視角的圖像,人們不得不使用廣角鏡頭和全景拍攝相機,這加大了生產、生活的成本,且使用技術不為一般人所能熟悉。所謂圖像拼接技術,就是將數張有重疊部分的圖像(可能是不同時間、不同視角或者不同傳感器獲得的)拼成一幅大型的無縫高分辨率圖像的技術。圖像拼接的流程大致分為:獲取待拼接的圖像,進行圖像預處理,圖像重疊區域配準,圖像的無縫融合,輸出所得拼接圖像。其中,圖像配準和圖像融合是圖像拼接成功的關機,是拼接的關鍵技術。因此,國內外學者多圍繞此兩項技術展開研究和討論。
圖像配準是圖像融合的基礎,而且圖像配準算法的計算量一般非常大,因此圖像拼接技術的發展很大程度上取決于圖像配準技術的效率。
一、圖像拼接的應用價值
目前,圖像拼接技術已經數據圖像處理研究的熱門方向之一,被廣泛地應用在文物保護(古跡、古文字資料的拼接)、工業監控、刑事案件偵破、醫學圖像分析、攝影測量學、機器視覺、虛擬現實技術、超分辨率重構、軍事地形圖像生成等領域,有著實際的應用意義和研究價值。主要表現為:
(一)全景圖和超寬視角圖像的合成。將普通圖像或視頻圖像進行無縫拼接,得到超寬視角甚至360°的全景圖,這樣就可以用普通相機實現場面宏大的景物拍攝;
(二)碎片圖像的組合。將醫學和科研的顯微碎片圖像或者空間、海底探測得到的局部圖像合成大幅的整體圖像;
(三)虛擬現實。圖像拼接是虛擬現實領域里場景繪制(Image-based Rendering,IBR)方法中的一項基本技術,利用圖像拼接技術可以生成全方位圖像,用全景圖表示實景可代替3D場景建模和繪制。
例如2003年,美國“勇氣號”和“機遇號”火星探測器發回了大量的火星地面照片,科學家們就是運用圖像拼接技術合成了火星表面的寬視角全景圖像。
二、圖像拼接的方法
圖像拼接的方法很多,不同的算法步驟會有一定差異,但大致的過程是相同的。一般來說,圖像拼接主要包括以下步驟:
(一)圖像預處理。包括數字圖像處理的基本操作(如去噪、邊緣提取、直方圖處理等)、建立圖像的匹配模板以及對圖像進行某種變換(如傅里葉變換、小波變換等)等操作。
(二)圖像配準。就是采用一定的匹配策略,找出待拼接圖像中的模板或特征點在參考圖像中對應的位置,進而確定兩幅圖像之間的變換關系。
(三)建立變換模型。根據模板或者圖像特征之間的對應關系,計算出數學模型中的各參數值,從而建立兩幅圖像的數學變換模型。
(四)統一坐標變換。根據建立的數學轉換模型,將待拼接圖像轉換到參考圖像的坐標系中,完成統一坐標變換。
(五)融合重構。將帶拼接圖像的重合區域進行融合得到拼接重構的平滑無縫全景圖像。
三、國內外研究現狀
1975年,Kuglin和Hines提出了相位相關算法,該方法具有場景無關性,能將純二維平移的圖像進行精確對齊。1987年,De Castro和Morandi等人使用傅立葉變換將具有旋轉變換的圖像做對齊,由此產生擴展相位相關法。1996年,Reddy和Chaterji改進了De Castro的算法,基于快速傅立葉變換,利用極坐標和互功率譜,實現了具有平移、旋轉和縮放變換的圖像配準。
相位相關法雖然計算簡單精確,但要求待配準圖像之間有較大的重疊比率,同時計算量和適用范圍與圖像的大小有很大的關系。因此,出現了基于圖像幾何特征的配準方法。
1997年,Zoghlami I.、Faugeras O.和Deriche R.提出了基于幾何角模型的圖像對齊算法。1999年,Bao P.和Xu D.利用小波變換提取保留邊(edge-preserving)的視覺模型進行圖像的對齊,Nielsen F.則提出了基于幾何點特征優化的匹配方法。
隨著人們對圖像的分析和理解的深入,圖像拼接技術的研究也趨于成熟,圖像拼接利用的配準特征也從圖像的低級特征發展到利用高級特征。
1996年,Richard Szeliksi提出了基于運動的全景圖像拼接模型,模型通過采用Levenberg-Marquardt迭代非線性最小化方法(L-M算法)求出圖像間的幾何變換關系進行配準。此算法效果好、速度快,且能應對平移、旋轉和仿射等變換圖像的拼接,因此成為圖像拼接領域的經典算法。2000年,Shmuel Peleg、Benny Rousso等在其基礎上,根據相機的不同運動,自適應的選擇拼接模型,通過把圖像分割成條進行多重投影,提出了自適應的圖像拼接模型,使自適應拼接成為拼接領域研究的又一方向。
國內學者也對圖像拼接技術做了大量研究。張祖勛提出了多級影像概率松弛整體匹配技術,對不同傳感器、不同空間分辨率的影像進行配準。杜威、李華二人將視頻紋理和全景圖結合起來,提出一種應用于動態場景的全景圖表示方法。趙向陽、獨立民提出了基于Harris特征點匹配的自動拼接算法。侯舒維、郭寶龍采用簡單的邊緣信息閾值法、金字塔式分層搜索策略,提出了一種灰度圖像上的快速自動拼接算法。方青、王博亮提出了一種基于比值模版匹配的彩色圖像拼接算法。
參考文獻:
篇12
Research and application of image segmentation technology
Wang Wei1, Zeng Xiaoneng2
(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)
Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.
Key words: digital image processing; image segmentation; segmentation algorithm; machine vision
0 引言
圖像分割是數字圖像處理中的一項關鍵技術,它通常用于對圖像進行分析、識別、編碼等處理之前的預處理環節,其分割的準確性直接影響后續任務的有效性,因此具有十分重要的意義。自上世紀70年代以來,已經出現了多種圖像分割方法,而每一種圖像分割方法都是為了解決一些特定的應用問題。該技術成功地應用于許多領域,例如:交通路口的電子警察、光學字符識別(OCR)、指紋識別、機動車牌號識別等等。
圖像分割是指將一副圖像分解為若干互不交疊的有意義且具有相同屬性的區域。好的圖像分割應具備的特性:①分割出來的各區域對某種性質如灰度、紋理而言具有相似性,區域內部比較平整;②相鄰區域對分割所依據的性質有明顯的差異;③區域邊界上是明確和規整的[1]。
大多數圖像分割方法只是部分滿足上述特征。如果強調分割區域的同性質約束,則分割區域很容易產生大量小孔和不規則邊緣;若強調不同區域間性質差異的顯著性,則易造成不同區域的合并。具體處理時,不同的圖像分割方法總是在各種約束條件之間尋找一種合理的平衡。
雖然圖像分割方法已經有了很大的發展,但由于它的復雜性,仍有很多問題沒有很好地得到解決。因此,人們至今還一直在努力發展新的、更有潛力的分割算法,以期實現更通用、更完美的分割結果。實踐表明,對圖像分割理論與技術的進一步研究仍然具有非常重要的意義。
本文首先對數字圖像分割的一些經典分割方法作了概述,然后分析了現有項目開發中使用的圖像分割方法所存在的問題,最后基于經典算法進行技術改進,實現了一種新的分割方法,并將其應用到實際的產品當中,取得了良好的效果。
1 圖像分割方法的現狀
從上世紀五十年代開始,學者一直熱衷于研究圖像分割技術。迄今為止,已提出上千種圖像分割算法,依這些算法對圖像處理的特點,主要可分為以下幾類方法[2]。
1.1 閾值分割法
閾值分割法作為一種常見的區域并行技術,它通過設置閥值,把像素點按灰度級分若干類,從而實現圖像分割。由于是直接利用圖像的灰度特性,因此計算方便簡明、實用性強。顯然,閾值分割方法的關鍵和難點是如何取得一個合適的閾值,而實際應用中閾值設定易受噪聲和光亮度影響。近年來關于閾值分割法主要有[3]:最大相關性原則選擇閾值法、基于圖像拓撲穩定狀態法、灰度共生矩陣法、熵法、峰值和谷值分析法等。其中,自適應閾值法、最大熵法、模糊閾值法、類間閾值法是對傳統閾值法改進較成功的幾種算法。更多的情況下,閾值的選擇會綜合運用兩種或兩種以上的方法,這也是圖像分割發展的一個趨勢。例如,將圖像的灰度直方圖看作是高斯分布的選擇法與自適應定向正交投影高斯分解法的結合,較好地擬合了直方圖的多峰特性,從而得到了更為準確的分割效果。閾值法的缺陷主要在于它僅僅考慮了圖像的灰度信息,而忽略了圖像的空間信息。對于非此即彼的簡單圖像處理(如一些二值圖像的處理)是有效的,但是對于圖像中不存在明顯的灰度差異或各物體的灰度值范圍有較大重疊的圖像分割問題則難以得到準確的分割效果。
1.2 基于邊緣的圖像分割法
邊緣總是以強度突變的形式出現,可以定義為圖像局部特征的不連續性,如灰度的突變、紋理結構的突變等。邊緣常常意味著一個區域的終結和另一個區域的開始,圖像的邊緣包含了物體形狀的重要信息,它不僅在分析圖像時大幅度地減少了要處理的信息量,還保護了目標的邊界結構。對于邊緣的檢測常常借助空間微分算子進行,通過將其模板與圖像卷積完成。兩個具有不同灰度值的相鄰區域之間總存在灰度邊緣,而這正是灰度值不連續的結果,這種不連續可以利用求一階和二階導數檢測到。
當今的局部技術邊緣檢測方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。這些邊緣檢測器對邊緣灰度值過渡比較尖銳且噪聲較小等不太復雜的圖像可以取得較好的效果,但對于邊緣復雜(如邊緣模糊、邊緣丟失、邊緣不連續等)的圖像效果不太理想。此外,噪聲的存在使基于導數的邊緣檢測方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測算子通常都是先對圖像進行適當的平滑,抑制噪聲,然后求導數,或者對圖像進行局部擬合,然后再用擬合光滑函數的導數來代替直接的數值導數,如Marr算子、Canny算子等。有關學者曾給出了一種基于彩色邊緣的圖像分割方法,這是對傳統邊緣分割方法只適用于灰度圖像狀況的一個突破。
在未來的研究中,用于提取初始邊緣點的自適應閾值選取、用于圖像層次分割的更大區域的選取,以及如何確認重要邊緣去除假邊緣將變得非常重要。
1.3 基于聚類的分割法
對灰度圖像和彩色圖像中相似灰度或色度合并的方法稱之為聚類,通過聚類將圖像表示為不同區域即所謂的聚類分割方法。此方法的實質是將圖像分割問題轉化為模式識別的聚類分析,如k均值、參數密度估計、非參數密度估計等方法都能用于圖像分割。常用的聚類分割有顏色聚類分、灰度聚類分割和像素空間聚類分割。
顏色聚類分割實際上是將相似的幾種顏色合并為一色,描述顏色近似程度的指標是色差,在標準CIE勻色空間中,色差是用兩個顏色的距離來表示的。但是顯示器采用的RGB空間是顯示器的設備空間,與CIE系統的真實三原色不同,為簡單起見,一般采用RGB色空間中的距離來表示。
灰度聚類分割就是只把圖像分成目標和背景兩類,而且僅考慮像素的灰度,這就是一個在一維空間中把數據分成兩類的問題。通過在灰度空間完成聚類,得到兩個聚類中心(用灰度值表征),聚類中心連線的中點便是閾值。顯然這個概念也可以輕松地延擴至多閾值和動態閾值的情況。
像素空間聚類分割在某些特定的尺度上觀察圖像,比如說把圖像信號通過一個帶通濾波器,濾波的結果將使圖像的局部信息更好地被表達。通過一個多尺度分解,輪廓信息可以在大尺度圖像上保留下來,細節或者突變信息可以在中小尺度上體現,基于多尺度圖像特征聚類的分割方法漸漸得到了人們的關注。
1.4 函數優化法
基于函數優化的分割方法是圖像分割中另一大類常用的方法,其基本思路是給出一個目標函數,通過該目標函數的極大化或極小化來分割圖像,G.A.Hewer等人提出了一個具有廣泛意義的目標函數。統計學分割法、結合區域與邊緣信息法、最小描述長度(MDL)法、基于貝葉斯公式的分割法等是目前幾種活躍的函數優化法。
統計學分割法就是把圖像中各個像素點的灰度值看作是具有一定概率分布的隨機變量,且觀察到的實際物體是作了某種變換并加入噪聲的結果。統計學分割方法包括基于馬爾科夫隨機場法(MRF)、標號法(Labeling)和混合分布法(Mixture)等。
結合區域與邊緣信息法是基于區域信息的圖像分割的主要方法。區域增長有兩種方式:一種是先將圖像分割成很多一致性較強的小區域,再按一定的規則將小區域融合成大區域,達到分割圖像的目的;另一種是事先給定圖像中要分割目標的一個種子區域,再在種子區域基礎上將周圍的像素點以一定的規則加入其中,最終達到目標與背景分離的目的。分裂合并法對圖像的分割是按區域生長法沿相反方向進行的,無需設置種子點,其基本思想是給定相似測度和同質測度,從整幅圖像開始,如果區域不滿足同質測度,則分裂成任意大小的不重疊子區域;如果兩個鄰域的子區域滿足相似測度則合并。
最小長度描述法(MDL)的基本思路是用一種計算機語言來描述圖像的區域和邊界信息,得到一個描述長度函數,以此作為目標函數,根據圖像極小化描述長度從而得到分割結果。MDL準則主要應用于區域競爭中,即通過這種規則對比若干個種子區域,找出其中的壞種子。它常常與其他方法結合使用。
2 圖像分割技術的研究與應用
2.1 圖像掃描分割
根據實際產品的需要,要根據分割的特殊要求,采用簡單的圖像掃描分割。
2.1.1 算法思想
獲取二值化要分割的圖像,然后轉換為圖像指針并獲取圖像的左右邊界、上下邊界,然后再分割圖像[4]。
2.1.2 分割過程實現
下面介紹基于FrameWork4.0,采用C#實現對圖像進行分割處理的主要步驟。
⑴ 二值化要分割的圖像
BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);
BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);
⑵ 轉換為圖像指針并獲取圖像中的左右邊界
BitmapData bmData=c_Bitmap.LockBits(new Rectangle
(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode
.ReadWrite, c_Bitmap.PixelFormat);
List<int[]> widthLeftRight=GetImgLeftRight(bmData,
c_Bitmap, throldValue);
⑶ 獲取圖像的上下邊界
int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap
.Height-2, widthLeft[widthLeftIndex],
widthRight[widthLeftIndex]);
top=yValues[0]; bottom=yValues[1];
⑷ 分割圖像
Rectangle sourceRectangle0=new Rectangle
(widthLeft[widthLeftIndex],tempTop, widthRight
[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);
Bitmap tempMap=sourceMap.Clone(sourceRectangle0,
sourceMap.PixelFormat);
2.1.3 實際效果
存在干擾情況下的分割效果,如圖1所示。
<E:\方正創藝5.1\Fit201501\圖\ww圖1.tif>
圖1 圖像掃描分割
圖像掃描分割的結果存在多干擾點,一些字符不能完整地被分割出來,多個字符連接在一起,分割效果不是很好。
2.2 findContours分割
2.2.1 算法思想
該算法是提取圖像的輪廓信息,一個輪廓一般對應一系列的點,也就是圖像中的一條線[5]。在算法中用序列cvSeq來保存提取到的序列集,序列中的每一個元素就是曲線中的一個點的位置。
2.2.2 分割過程實現
下面介紹采用C++實現對圖像分割處理的主要步驟。
⑴ 圖像的預處理(二值化、平滑處理等)
threshold(input,img_threshold,60,255,
CV_THRESH_BINARY_INV);
IplImage* input_image=&IplImage(img_threshold);
IplImage* dst_image=cvCreateImage(cvGetSize
(input_image),IPL_DEPTH_8U,0);
cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);
⑵ 查找圖像的聯通區域及輪廓
Mat img_contours;
img_threshold.copyTo(img_contours);
vector<vector<Point>> contours;
findContours(img_contours, contours,
CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);
⑶ 對輪廓進行轉換得到內容區域
vector<vector<Point>>::iterator itc=contours.begin();
IplImage* temp=&(IplImage)input;
vector<Rect> validRect;
while(itc!=contours.end()) {
Rect mr=boundingRect(Mat(*itc));
rectangle(result,mr,Scalar(0,255,0));
if(!checkSplitRect(mr,temp->height,temp->width))
{ ++itc;continue; }
validRect.push_back(mr);
++itc;
}
⑷ 圖像分割
CvSize size=cvSize(rect.width,rect.height);
cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));
IplImage* pDest=cvCreateImage(size,source->depth,
source->nChannels);
cvCopy(source,pDest);
cvResetImageROI(pDest);
2.2.3 實際效果
從分割結果看,該分割算法能把所有的單個圖片聯通區域分割出來,但是分割出的區域存在很多干擾區域,增加了實際區域提取的復雜度(見圖2)。
<E:\方正創藝5.1\Fit201501\圖\ww圖2.tif>
圖2 連通區域分割
下面將在此基礎上進行改進。
2.3 改進后的算法
增加連通區域的有效性判斷及過濾;
checkSplitRect(Rect rect,int height,int width)
同時對一些單字符被分割成多個字符的區域按照一定的算法及規則進行有效組合和合并;
vector<Rect> MergeImage(vector<Rect> validRect)
最后形成的分割效果如圖3所示,將所有字符正確的分割出來,去除了干擾,達到了理想的效果。
<E:\方正創藝5.1\Fit201501\圖\ww圖3.tif>
圖3 改進后的分割效果
3 實驗結果
為了驗證本方案的可行性和可操作性,本文使用10000張測試圖像作為實驗測試庫,對此方案進行測試。測試結果:正確分割達到99%以上。如圖4,改進后的分割正確率比改進前的分割正確率提高了將近20倍。
<E:\方正創藝5.1\Fit201501\圖\ww圖4.tif>
圖4 分割對比
4 結束語
圖像分割沒有通用的理論,要根據具體情況采取有效的方法。利用已經研究出的多種圖像分割方法,將多種方法綜合運用,發揮各自的優勢進行圖像分割將成為這一領域的發展趨勢。同時,由于現在所處理的圖像的復雜度和固有的模糊性,傳統的單一的處理方法已不能適用需要,與新理論、新工具和新技術結合起來才能有所突破和創新。
本文在原有分割技術的基礎上,結合實際的使用情況,進行了算法思想的改進和創新,最終達到了理想的分割效果,在一定程度上具有良好的研究和實用價值。
參考文獻:
[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",
Computer Vision, Graphics, and Image Processing,1985.29:100-132
[2] 羅希平等.圖像分割方法綜述[J].模式識別與人工智能,1999.12(3):
300-312
[3] 吳一全,朱兆達.圖像處理中閾值選取方法30年(1962-1992)的進
篇13
在獲取信息時,通常都要識別某領域內的圖像。精確處理圖像,關系到設定決策的精確性。最近幾年,圖像處理日益融匯于全方位的生產及日常生活。判斷并且識別圖像信息,才能用來處理某一問題。航拍影像照片、層析用到的射線圖、電視的圖像等,這些都源自計算機處理得出的圖像。圖像是否精確,密切關系到圖像本身的分辨率是否優良。由此可見,若要在短時段內獲取完整且精準的圖像信息,就要提升分辨率,快速識別并且獲取可信的圖像信息。
1 圖像處理的根本技術
計算機協助的圖像處理采納了如下技術思路:針對于選定的圖像,借助微機用來處理并且解析。經過全方位處理,獲得符合需求的新圖像。計算機輔助下,圖像處理即為新式的影像處理,采納了新階段的計算機手段。通常狀態下,處理各類的圖像都配備了掃描儀、數字性攝像機。具體在采樣后,可得二維性的數字數組并且構建像素。采樣可得二維的整數數組,由此產生灰度值[1]。從處理流程來看,圖像處理可分成如下:對圖像的壓縮、復原以及強化、匹配各類的圖像、識別并描述圖像。
在這之中,壓縮圖像是必要步驟。數字化處理后,經常獲得較大量的圖幅數據。典型狀態下,數字圖像都含有多個像素。某些圖像呈現為動態性,同時也附帶了更多量的像素數據。由此可見,妥善存儲并且壓縮圖像是尤為必要的。從算法來看,壓縮圖像包含了近似算法以及不失真的方式。常用的流程為:在時間空間上,針對于鄰近像素值予以編碼,而后求出差值。例如壓縮可得精確的游程編碼,即為典型實例。與之相比,壓縮圖像配備的近似算法可借助交換圖像,經過余弦變換可得圖像。這種典型即為MPEG類的新式處理,此外還可選取傅里葉的快速變換。對于動靜態這樣兩類的圖像,都是很適用的。
選出了待處理的某一圖像,還需再次去復原或增強。這樣做,是為從根本上改進圖片,提升影像的質量。復原及增強可選的方式包含了去模糊性、去除噪聲、強化對比度、減低幾何性的畸變。復原圖像則先要設定噪聲模型,估測并推斷得出原先的圖像。增強圖像的方式為空間域或頻率域,把圖像化作可識別的信號,通常為二維信號。在這種基礎上,再去強化信號。去除圖像噪聲,可選傅里葉變換的途徑,但它僅適合于頻率偏低的信號。高通濾波用來強化頻率較高的圖像信號,影像將更為清晰。典型性算法為:算出局部影像的平均值、計算出空間域、選取中值濾波的方式。經過這些處理,都可縮減直至除掉噪聲。
2 圖像處理的必要性
在各個領域中,都不可缺失信息。圖像信息相比來看更具備直觀性,更易識別判斷。認知世界的過程中,就要借助直觀性的圖像信息用來獲得判斷,收獲信息來源。然而,原始影像經常是模糊性的,很難借以估測某些必要信息。唯有經過處理,才能顯示出隱含的某些信息,圖像更加清晰。在現今階段內,計算機輔助下的多樣技術都獲得了進步,尤其圖像處理。在微機協助下,人們即可更便捷且精確地處理影像,進而獲取更精準的清晰圖像[2]。這樣做,便于給出決策,或者獲取信息。
日常生產中、科研等領域中,都需接觸各類的影像。新階段內,圖像拓展了含義,包含遙感影像、醫學拍攝的光片、清晰度更高的照片等。認知客觀世界,不可缺失這些圖片。計算機擁有更大容量及更高的實效性,也提升了原先的處理速度。在這種狀態下,可處理的圖像日益變得多樣化。與此同時,攝像裝置也擁有了高精度,趨向于小型化,這就在根本上改進了畫面的總體質量。由此可見,現今的圖像處理可以憑借于小型微機,提升處理的實效。
信息化時代內,圖像處理日益融匯于多行業。例如醫學影像,可用來分辨出機體內的斷層;技術性的圖像,可用來調控并且監管生產。面對于復雜的圖像,還需快速判斷可提取的信息,作為處理根據。生成數字圖像,也可借助計算機予以實現。最近幾年,計算機配備的軟硬件都正在改進,推進了全方位的圖像處理手段更新。在廣闊領域內,都用到新階段的圖像處理。計算機輔助的新式圖像處理擁有了小型化,也加入了更優的實時性及遠程性。
3 設置圖像分辨率
從根本上看,圖像整合了多層次的信息,表現出全面性。在各類介質上,還可再現原先的信息。作為集合體,圖像可用來集成并處理信息。對此,就有必要設置并匹配分辨率。具體而言,設置分辨率要注重如下事項:
3.1 選取分辨率
選定分辨率過程中,先要確定最適當的影像掃描率。初期在構建圖像時,若設定了較低分辨率,那么掃描得出的影像也并不很精確。從這種角度看,單獨提升像素并非必然可獲得更為清晰的影像。導入掃描的過程中,針對特定圖像還需設定匹配性的分辨率,這種分辨率被看成掃描階段內的分辨率。若分辨率設置得很高,掃描可得優質影像。然而,這種設置也并非完美,也是有局限的。這主要是由于,掃描儀本身就表現為局限性,制約了分辨率。此外,要設置掃描的分辨率,還需兼顧給出來的處理目的[3]。
3.2 具體設置方式
設置分辨率時,要把它限定于最佳范圍內,不可超越范圍。條件準許時,若有必要放大固有影像,則還需篩選更大分辨率。然而各步驟中,都需控制于最吻合的分辨率之內。在軟件幫助下,可再次予以放大。從現狀來看,處理圖像可借助多款的軟件。選取了最佳軟件,對應著的處理實效也會變得更優。同時,插值算法也密切關系到圖像處理。插值算法可用來具體放大圖像,進而判斷出某一最相符的掃描分辨程度。經過掃描之后,要依托某種媒介用來輸出,還要視情況予以放大原圖。
在某些情況下,屏幕可用來顯示出掃描后的影像,可至網頁。具體顯示時,應能維持恒定的圖像規格尺寸。通常來看,可設置于70dpi的分辨率。若有必要放大,那么借助如下公式用來確定分辨率:掃描時的分辨率=72*影像的各邊長/最初的邊長。
掃描之后,需要輸出并予以打印,這樣才可獲得易辨別的影像。具體打印步驟中,要維持最初的邊長及尺寸。在這種基礎上,最便捷的方式即為篩選分辨率,輸出打印線的總數。如果需要打印,還需依照如下思路來設定分辨率:輸出線頻率*圖像處理后的各邊長/最初圖像邊長。
3.3 匹配不同的分辨率
打印的過程中,分辨率應當是可以匹配的,這種匹配是指圖像本身及打印機二者的分辨率。打印機產生了某種輸出,這種狀態下即可算出最精準的分辨率,然后用來計算。輸出打印之前,需要妥善匹配合適的分辨率。需要注意的是:打印設備及圖像本身并不需要設定完全同樣的分辨率,只要匹配即可。經過詳盡的匹配,才會確保輸出得到的圖像是優質的。某些作品設定為較高分辨率,針對于這類作品先要妥善予以保存。預留必備的備份,依照打印機來選取分辨率。
圖像分辨率可設置為雙倍的打印機線頻率。在這時,可自主予以定義。打印的步驟中,需要舍掉冗余性的某些圖像。這是因為,打印出來的影像并不需要添加繁雜的細節,這些細節也會拖延更長的打印時間。打印機設有自身的分辨率,單位為各英寸內的圖像點數。具體打印過程中,若沒能明確某一個打印機的精確線頻率,那么還可大體予以匹配。同時,應當優選適合的紙張用來打印。因為在不同材質上,打印得出的分辨率其實并不相等。
4 處理中的超分辨率
從總體來看,依照輸出及輸入的不同算法,可設置組合性的不同超分辨率。重構超分辨率的微機圖像,借助于信號處理來轉變原先較低的分辨率,變為高分辨率。這種技術目前正被廣泛選用,用于打印圖像、構建視頻監控、解析刑偵案件、構建衛星成像或醫學影像等。超分辨率關系著各類處理,例如根本性的圖像處理、微機輔助的視覺性處理[4]。重構超分辨率時,也需要先期壓縮圖像、提取圖像的特性、評價圖像質量。需要提取獨特的圖像特征,優化得到最佳的某類算法。
超分辨率的構建中,重要步驟應為處理頻域。唯有經過頻域處理,才能構建精準的超分辨率。在頻域范圍內,可以用來卷積圖像、旋轉或平移圖像。經過全面處理,即可轉變成更易辨認的計算方式。分辨率領域內,頻域方式擁有更高層次的直觀優勢。對于此,還可選取傅里葉變換。假定某一生成模型,經過連續性的變換即可構建線性的頻域關系。
此外,超分辨率還會用到插值方法,這種方式針對于不均勻的圖像。在重構超分辨率時,插值方式是更為簡易并且直觀的。對于非均勻性的處理圖像,插值方法包含了如下流程:對于輸入視頻,配準為給出來的平面圖像。經過轉換之后,再設置對應性的圖像約束。從本質來看,這種重構圖像即為整合性的插值,可用于各階段內的圖像生成或處理。
5 結語
圖像處理源自新階段內的微機技術,經過處理以后,應能獲取最佳的圖像效果。通常來看,這類處理技術要符合設定的分辨率,易于辨別且可提供決策的參照。圖像處理包含了多樣的復雜要素,要全方位衡量并且判斷,這種基礎上得出精準的結論。從目前狀態看,圖像處理的相關性技術仍沒能達到完善,有待持久的改進。未來的實踐中,還需繼續摸索,歸納圖像處理的經驗,服務于各領域內的計算機處理。
參考文獻:
[1] 蘇衡,周杰,張志浩.超分辨率圖像重建方法綜述[J].自動化學報,2013(08):1202-1213.