日本免费精品视频,男人的天堂在线免费视频,成人久久久精品乱码一区二区三区,高清成人爽a毛片免费网站

在線客服

數據存儲技術論文

引論:我們為您整理了1篇數據存儲技術論文范文,供您借鑒以豐富您的創作。它們是您寫作時的寶貴資源,期望它們能夠激發您的創作靈感,讓您的文章更具深度。

數據存儲技術論文

數據存儲技術論文:局域網數據存儲技術分析論文

1.局域網安全存儲模型淺析

基于當前工業環境中對于局域網數據存儲安全的需求,內網海量文件數據存儲原型系統(MFDSS)在局域網環境中得到了廣泛應用。其邏輯結構參見圖1。在MFDSS系統環境中,各個組件通過網絡實現聯系,構成邏輯層面共同工作的整體。其中客戶端直接與用戶保持溝通,負責維護用戶存儲視圖,并且用戶面向應用服務器實現請求和響應的傳輸。并且在獲取到服務器授權的前提下,支持客戶端與基于iSCSI的存儲設備SD之間實現直接通信。而應用服務器從邏輯上位于中介位置,需要負責與客戶端保持溝通,并且面向客戶提供統一的存儲視圖,同時還需要與SD保持溝通,實現對于主機認證以及設備操作認證的控制,并且實現文件到對象的映射轉換。而在MFDSS體系中,元數據是重要的概念,具體分為系統元數據、內容元數據和存儲元數據三種,對應的元數據服務器則關注元數據管理的相關工作,并且實現元數據在存儲對象上的映射索引,同時支持從邏輯層面上對于多個SD設備的管理。這樣的文件存儲體系,相對于傳統文件體系而言有著十分顯著的工作特征。傳統文件存儲體系中,元數據通常由文件服務器實現維護,因此每次對數據訪問的相關操作都需要獲取元數據,因此在訪問請求頻繁發起的時候,承擔元數據相關操作的設備就必須同時面對多個請求,對應的形成資源瓶頸的可能性也相對較大。對應的無序訪問進一步加劇整個系統存儲環境安全隱患的產生。而在MFDSS系統中,每次操作只有一次對于元數據的訪問請求,并且進一步由專門的SD存儲設備和應用服務器來共同實現對于整個存儲訪問過程的管理,因此在元數據的操作方面實現了有效的降低和控制,從而增強了整個系統的彈性,在安全水平方面也有所改進。

2.MFDSS體系得到實現的基礎

還可以進一步加強多協議文件系統(MPSFS)的建設。MPSFS系統從性能角度看,保留了分布式文件系統本身的靈活性優勢,并且在并發訪問管理以及安全性方面都有很大改善。從技術角度看,MPSFS系統除了提供文件的存取接口以外,更為重要的在于采用存儲卷實現存儲。存儲卷中包括文件目錄結構以及其固有的存儲模式,對應的進一步包括元數據結構、操作接口、功能函數集以及對于空間的利用優化算法和數據結構。在MPSFS工作環境之下,能夠實現面向不同的用戶區分提供不同的存儲訪問視圖,因此在油田工作環境中,能夠更好地實現與權限身份控制更好的數據管理機制。除此以外,MPSFS還能夠實現更為完善的用戶身份認證,具體是通過相應的專用認證服務器,來依據內部的多個證書文件來實現對于身份的確定。

3.結論

在面對局域網數據存儲安全的客觀需求時,諸多技術開始涌現并且不斷發展成熟。在MFDSS框架體系之下,包括MPSFS等多種相關技術,并且在集成完成之后,整個技術框架會呈現出良好的安全特征。與之對應的,讀寫性能會受到一定的制約,估計下降幅度會在12%-18%之間,但是以這樣的一個效率換取整個系統的數據存儲安全,仍然是一個可以接受的環境。并且如果進一步展開基于數據挖掘等相關技術的深入應用,這樣的下降狀況還會有所縮減,將整個系統的安全性和可用性控制在一個相對良好的范圍內展開工作。

作者:趙鑫鑫 單位:大慶油田信息技術公司東風分公司

數據存儲技術論文:數據存儲安全技術分析

摘要:在云計算日益發達的今天,為方便企業運行,企業的運行數據通常放入云平臺。通過云端共享,可以將公司內部數據傳遞給職員,方便快捷的操作方式,讓越來越多的用戶使用云平臺存儲數據,因此,如何保障信息的安全性是用戶們廣泛關注的問題。筆者首先討論了云平臺數據的數據存儲結構,然后分析了目前的云存儲安全類型,并且介紹了云存儲數據安全技術,為廣大研究者提供理論依據。

關鍵詞:云存儲;數據安全;安全技術

各行各業的經營數據都在不斷變化,如何完整保存和傳輸企業的數據,滿足企業的需求,是廣大研究員在研究數據技術時面臨的重要挑戰。云數據存儲方便員工共享企業資訊和資源,替代了傳統的數據保存模式,更能輔助員工移動辦公,數據保護安全技術應運而生,降低數據泄漏風險。如果企業數據泄漏,可能會對公司造成巨大損失,從而影響公司的發展。所以研究云數據存儲模式以及數據保護技術,可以提高企業數據存儲的安全性,保護公司的無形資產。

1云數據存儲結構

云數據存儲結構包含了云服務器、用戶和第三方。在這種三角形結構中,用戶主要是將個人數據及公司數據通過云服務器上傳并進行存儲,一方面能夠節省自己的計算機存儲空間,另外一方面可以將資源共享給其他的同事,讓其他人也可以查詢和下載數據,第三方只對云存儲數據起到監管作用。

2云平臺數據存儲安全類型

2.1存儲安全性

云存儲數據平臺存儲了大量的客戶信息以及公司的運營數據,是黑客和不法人員攻擊的主要對象。云服務器的安全性至關重要,要加強管理,并且要制訂安全防護方案,建立嚴格的數據存儲安全制度體系,加強數據檢測巡邏,保障數據存儲的安全性。

2.2操作安全性

由于云存儲下的數據可以被多方用戶同時共享,其數據從生成到刪除會被許多用戶訪問,數據的生成或者更改都會出現操作安全問題,一方面是人為的隱患,另外一方面是由于云數據存儲系統發生問題而造成的隱患,后者的隱患較小。當用戶操作數據后,數據將會更改并且同步更新,如果用戶出現操作錯誤,則更新后的數據無法再恢復,所以應謹慎操作。另外,數據傳輸易出現數據損壞以及泄漏現象,數據在傳輸的過程中,易被非法人員篡改或竊取等,應提高數據的傳輸安全性。

2.3訪問安全性

云存儲數據可以被多個客戶訪問,用戶通過用戶名和密碼進入云系統訪問數據,具有數據訪問的安全性。訪問用戶是否合法,應受到系統的監測,查詢和鑒定其身份信息。

3云平臺下數據存儲安全技術分類

3.1同態加密技術

要保障云平臺下的數據存儲安全,就必須同步研究數據的加密存儲技術,該技術的研究情況符合我國的云技術發展趨勢,是運用最廣泛的存儲技術。同態加密技術屬于加密技術,首先在系統中設置加密代碼和防護代碼,用戶在輸入密碼時,系統會自動進行代數運算,根據運算結果,判定用戶是否為合法用戶。這種云計算方式,保障了用戶數據的安全性。同態加密技術由私密加密技術發展而來,設置同態加密,必須要在了解解密技術的基礎上才能實現。同態加密技術能夠解決大部分加密存儲問題,保障數據文件的安全性,然而這其中依舊存在耗時耗力、欠缺計算方法等相關問題,還需不斷調整、優化、升級,以獲得更好的用戶體驗。

3.2SE加密技術

用戶在存儲數據之前,應先對數據進行加密操作,這樣才能夠較大限度保障數據的安全性、隱私性,然而會出現查詢難度加大的問題。如果云平臺中存儲的相關數據,其初始用戶對其進行了加密,初始用戶沒有將密碼告訴共享用戶,則共享用戶即使下載了數據,也無法打開數據包。如果初始用戶不設置密碼,那么數據會面臨泄漏的危險。云數據加密存儲技術是建立在加密存儲技術之上的一種新型技術,簡稱為SE。SE技術方法不僅可以對數據進行加密,還能夠在數據有密匙的情況下,查詢數據包中的數據名稱及類型,只是不能打開數據文件。云平臺存儲的數據具有共享性質,任何用戶在使用云平臺時,都可以在搜索框中輸入相關的關鍵詞,檢索到該關鍵詞相關的文件,篩選獲得有用的數據信息。根據初始用戶的設置,有的數據可以下載,數據是否能夠打開,要看數據是否在加密狀態。云平臺的數據查詢功能,嚴格要求關鍵詞不能出錯,根據關鍵詞的相關性,云平臺的數據會自動對查詢出的數據文件進行排列。這種搜索方式也會導致用戶如果要確定數據文件和其查詢的關鍵詞的關聯性,必須返回上層文件夾。很多文件的子文件和母文件相關性并不大,需要用戶進入數據文件查詢此文件的名字,才能確定該數據文件對自己是否有用。SE加密方法的優勢是可以篩選有用的文件,缺點是會增加網絡的流量。

3.3SiRiUS加解密技術

加解密技術分類較多,主要包含Ptutus加密技術、多重加密技術、密匙加密技術、SiRiUS加密技術等。較為特殊的SiRiUS系統,建立在NFS文件系統基礎上,多重加密保障數據的安全傳輸。當用戶訪問數據時,SiRiUS系統進行嚴格控制,每一個文件對應一個元文件,這些文件隱藏于文件訪問的控制列表中。后來SiRiUS系統不斷升級,近期的加密算法是NNL廣播,其算法更加復雜,嚴格控制用戶訪問權限,雖然提高了數據傳輸的安全性,但是由于過于復雜,也限制了系統的擴展及發展。

3.4基于VMM的數據保護技術

在虛擬化平臺上可以進行虛擬機的工作。虛擬機工作建立在云計算的基礎上,同時受到監控系統監管。基于VMM的數據保護技術的作用原理建立在SSL技術的基礎上,一方面利用虛擬監控系統,使用Daoti保護數據的存儲安全;另外一方面,SSL技術能夠保護數據的傳輸安全。其具體的作用過程中,云端接收到數據,數據傳入SSL模塊,加密數據,然后存儲數據,與此同時,會有備份數據提交到用戶設定的相關系統中,并且也會提交給分布式文件系統。如果對數據進行了解密操作,則數據應再次加密,其加密系統依舊是虛擬監控系統。而如果數據已加密并且保存在分布式文件系統中,用戶從系統中獲取數據之前,應使用虛擬機對文件先行解密,否則數據無法使用。該技術較大的特點在于云計算端和分布式文件系統相互隔離、獨自分開,所有的數據互不相通,除非用戶單獨上傳,數據才會同時在兩個系統中出現,因此,增強了數據安全性。在這種情況下,數據得到二次保護,當非法者從云端竊取到數據后,數據依舊是加密狀態。除非非法者還能從分布式文件系統中竊取到數據,否則數據無法使用,保障數據存儲的安全性。

4結語

云平臺下數據存儲模式被廣大企業應用。如果企業數據在云存儲系統中泄漏,數據安全性遭到威脅,則云計算技術將難以得到更好的發展。我國不僅要發展云計算技術,而且要同步發展云計算數據的安全性技術,提高數據存儲訪問傳輸的安全性,推動云計算技術的發展,我國有關部門還應完善法律法規,明文制定相關的技術標準,從而保障云技術的發展。

作者:盧青華 單位:廣州大學華軟軟件學院

數據存儲技術論文:基于網絡數據存儲技術實現的研究

摘要:隨著網絡應用的普及和商用化,多業務、多網絡的融合已經成為不可逆轉的趨勢。人們進行信息的交流和共享越來越方便,同時數據的大規模毀滅也變得容易了。數據是現代企事業最寶貴的生命,數據是一切災難發生后恢復系統的一道防線。因此需要正確選擇相應的儲存技術方式,進行經濟而的數據存儲,從而避免可能發生的重大損失。DAS、NAS和SAN的存儲方式的實現值得研究。

關鍵詞:數據存儲;網上儲存;DAS存儲;NAS存儲;SAN存儲

1 引言

在網絡飛速發展的今天,選擇一種適合需求的高性能數據存儲方式變得十分重要。如何確保數據的一致性、安全性和性,如何實現不同主機類型的數據訪問和保護,如何實現網絡上的數據集中訪問以及便于實現不同數據的集中管理等,這些問題必須需要新網絡儲存技術來實現。數據災難小到一般的文件損壞、誤操作,大到整個網絡系統因病毒入侵、黑客攻擊而癱瘓。因此,企事業單位必須有一套正確的數據存儲和恢復系統方案。現代網絡存儲技術主要利用網絡技術實現信息的異地儲存,即電子數據不再直接儲存在本地服務器上,而是通過網絡保存在與服務器相連的專門設備上。當前流行的幾種主要存儲技術:DAS(Direct Attached Storage)、SAN(Network Attached Storage)、NAS(Store area Network)等。這些網絡儲存方式特點各異,均可應用在不同的領域上。

2 DAS存儲技術

DAS是指將儲存設備通過SCSI接口或光纖通道直接連接到一臺計算機上。當服務器在地理上比較分散、很難通過遠程連接進行互聯時,直接連接是一個比較好的方法。DAS已經有近40年的使用歷史,是目前最常用的網絡儲存設備。但是隨著用戶數據的不斷增長,尤其是數百GB以上時,其在存儲、恢復、擴展、災害等方面的問題變得日益困擾著系統管理員。主要原因如下:

(1)DAS儲存方式

DAS依賴服務器主機操作系統進行數據的I/O讀寫和存儲維護管理,數據設備和恢復要占用服務器主機資源(包括CPU、系統I/O等),數據流需要流回主機再到服務器連接著的磁帶機(庫),數據存儲占用服務器主機資源的20~30%,因此許多企事業單位的用戶日常數據存儲常常在深夜或業務系統不繁忙時進行,以免影響正常業務系統的運行。DAS儲存的數據量越大,存儲和恢復的時間就會越長,對服務器硬件的依賴性和影響力就越強。

(2)DAS的SCSI連接

DAS與服務器主機之間的連接通道是采用SCSI連接的,帶寬為10Mbps、20Mbps、40Mbps、80Mbps等。隨著服務器CPU的處理能力越來越強,存儲硬盤空間越來越大,陣列的硬盤數量越來越多,SCSI通道將會成為I/O瓶頸;服務器主機SCSI ID資源有限,能夠建立的SCSI通道連接也有限。

(3)DAS的限制

無論DAS儲存還是服務器的擴展,從一臺服務器擴展為多臺服務器組成的集群或儲存陣列容量的擴展,都會造成業務系統的停機,從而給企事業單位帶來經濟損失。對于銀行、電信、傳媒等行業7×24小時服務的關鍵業務系統,這是不可接受的。并且DAS儲存或服務器主機的升級擴展,只能原廠商提供,因此受到設備廠商限制。

3 NAS儲存技術

NAS采用(TCP/IP、ATM、FDDI)技術,將一種分布、獨立的數據整合為集中化管理的中心,通過網絡交換機連接存儲系統和服務器主機,建立專用于數據存儲的儲存專網。如下圖所示:

(1)NAS儲存的性能

NAS實際上是一個帶有操作系統的儲存設備,其作用類似于一個專用的文件服務器。這種專用儲存設備具有可附加大容量的存儲,內嵌操作系統,專門針對文件系統進行重新設計和優化,以提供高效率的文件服務等特點。NAS的關鍵特性如下:

一是去掉了通用服務器不適用于數據傳輸的大多數計算功能,而僅僅提供文件系統功能用于存儲服務,降低了儲存設備的成本。為方便存儲到網絡之間以最有效的方式發送數據,專門優化了系統軟硬件體系結構,多線程、多任務的網絡操作系統內核,特別適合于處理來自網絡的I/O請求,不僅響應速度快,而且數據傳輸速率也高;二是它的模式以網絡為中心,利用現有的以太網資源來接入專用的網絡儲存設備,而不是另外再部署光纖交換機來連接傳統的儲存設備。

(2)NAS技術性能

NAS需求旺盛已經成為事實。主要有如下優點:

一是為那些訪問和共享大量文件系統數據的企事業單位環境提供了一個高效、性能優異的解決方案;二是在企事業單位數據量膨脹中,SAN、大型磁帶庫、硬盤柜等產品雖然都是很好的儲存解決方案,但它們那高貴的身份和復雜的操作是資金和技術實力有限的中小企事業單位無論如何也不能接受的,因此,NAS正是滿足這種需求的產品;三是適合于那些需要通過網絡將文件數據傳送到多臺客戶機上的用戶,非常易于部署,可以使用NAS主機、客戶機和其他設備廣泛分布在整個企事業的網絡環境中。

4 SAN儲存技術

SAN是指在網絡服務器群的后端,采用光纖通道技術,通過光纖通道交換機連接儲存陣列和服務器主機,建立專用于區域網絡的存儲。SAN經過十多年的發展,已經相當成熟,成為企事業單位的事實標準。SAN儲存采用的帶寬從100Mbps、200Mbps,發展到目前的1Gbpd、2Gbps。如下圖所示。

(1)SAN儲存性能

SAN作為網絡基礎設施,是為了提供靈活、高性能和高擴展的存儲環境而設計的。SAN的關鍵性能如下:

一是它不同于通常所說的網絡,為連接服務器、磁盤陣列、磁帶庫等儲存設備而建立的高性能網絡;二是提供了良好的存儲連接,服務器可以訪問存儲區域網上的任何儲存設備,如磁帶、磁盤陣列,同時儲存設備之間、儲存設備同SAN交換機之間也可以進行通信;三是獨立服務器網絡的一種專門的網絡,這種網絡通過采用光纖通道協議來傳輸數據,在連接上可以使用光纖和銅纜;四是特別適合于服務器集群、災難恢復等數據量傳輸的關鍵領域,而且這種連接是本地的高速連接;五是采用光纖連接的技術,從而保障了巨大的數據傳輸帶寬(100Mbps),對于所有的應用都可以很好地滿足。

(2)SAN的性能

面對迅速增長的數據存儲需求,大型企事業單位和服務提供商漸漸開始選擇SAN作為網絡基礎設施,因為SAN有如下優點:一是可提供大容量儲存設備數據共享;二是實現調整計算機與高速儲存設備的高速互聯;三是提高了數據的性、安全性和開放性;四是具有出色的擴展性,利用光纖通道技術,可以有效地傳輸數據塊。

5 結束語

DAS、SAN和NAS之間的區別正在變得模糊,所有的網絡存儲技術在用戶的存儲需求下接受挑戰,SAN與NAS都是為適應高性能和密集的網絡儲存要求而在DAS的基礎上發展起來的,是新型數據儲存模式中的兩個主要發展方向。

在IT數據儲存和共享系統方面,傳統B/S的計算機模式將會演化成具有任意連接性的全球網絡存儲系統。網絡存儲技術的未來發展:一是走向開放化和標準化;二是NAS、SAN技術逐步取代DAS技術;三是虛擬儲存技術逐步興起;四是儲存技術走向IP化等方面的趨勢。

數據存儲技術論文:基于RAID技術實現網絡數據存儲的研究

摘要:隨著Internet技術飛速發展,人們進行信息的交流和共享越來越方便,同時數據的大規模毀滅也變得容易了。如何確保數據的一致性、安全性和性,如何實現不同數據的集中管理,如何實現網絡上的數據集中訪問等,這些問題必須需要新網絡存儲技術確立。用RAID技術的方式,實現網絡數據存儲來完成上述提出問題的選擇值得研究。

關鍵詞:RAID;數據存儲;數據備份;磁盤陣列

1 引言

在網絡飛速發展的今天,選擇一種適合需求的高性能數據存儲方式變得十分重要。在一些企事業中,即使是網絡管理員,數據存儲的觀念也尚未被普遍接受。能夠正確選擇相應的儲存設備和技術。進行經濟而的數據存儲與恢復,從而避免可能發生的重大損失。因此,企事業必須有一套正確的數據存儲與恢復系統的方案。RAID(Redun-dant Array of Inexpensive Disks)技術就是網絡數據存儲的一種較佳選擇方案。

RAID網絡存儲技術主要利用網絡技術實現信息的異地儲存,即電子數據不再直接存儲在本地客戶端上,而是儲存在遠端的服務器上。并且還可以通過網絡保存在與遠端服務器相連的專門設備上。由于RAID存儲技術的方式很多,在具體實現上還需進一步的研究。

2 RAID存儲技術

RAID是指廉價(獨立)磁盤陣列,所謂“磁盤陣列”是指多張磁盤連成一個陣列上,然后,以某種方式書寫磁盤,這種方式可以在一張或多張磁盤組之間提供數據。

從主機的角度看,控制器使得整個磁盤組就像一片又快、又大、又的虛擬磁盤。它的初衷主要是為大型網絡服務器提供高端的存儲功能和冗余的數據安全,在系統中RAID被看作是一個邏輯分區。但它是由多個硬盤組成的,通過在多個硬盤上同時儲存和讀取數據來大幅度提高存儲系統的數據吞吐量,而且在很多RAID模式中都有較為完備的、相互校驗與恢復的措施,甚至是直接相互的鏡像存儲。當數據災難發生時可以自動修復,從而大大提高了RAID系統的容錯度,穩定了系統的冗余性。

3 RAID技術規范

RAID技術是一種工業標準,通常將組成磁盤陣列的不同方式分為RAID級別。隨著RAID技術的不斷發展,現在已擁有了以RAID 0到RAID 6七種基本的級別。另外,還有一些基本RAID級別的組合形式,如RAID 10、RAID 50等。現將RAID級別在應用中的實現作進一步的研究。

(1)RAID 0:是連續以位或字節為單位分割數據,并行讀寫于多個磁盤上,因此具有很高的數據傳輸速率,但它沒有數據冗余。它只是單純地提高性能,而且其中的一個磁盤失效將影響到所有數據。因此,它不能應用于數據安全性高的場合。

(2)RAID 1:通常被稱為RAID鏡像,是通過磁盤數據鏡像實現數據冗余,在成對的獨立磁盤上產生互為備份的數據。即所有數據都進行百分之百的備份。當原始數據繁忙時,可直接從鏡像磁盤上讀寫,而不需要重組失效數據。

(3)RAID 0+1:也稱為RAID 1 O標準,至少需要4塊硬盤才可以實現,不過它綜合了RAID 0和RAID 1的特點,將獨立磁盤配置成RAID 0,兩套完整的RAID 0互換鏡像。但構建RAID 0+1陣列的成本投入大,數據空間利用率只有50%。

(4)RAID 2:是按位分配數據到多個驅動器的,在寫入數據時一個磁盤上保存數據的各個位,同時把一個數據不同的位運算到海明校驗碼保存在另一組磁盤上,在數據發生錯誤的情況下將錯誤校正。這種編碼技術需要多個磁盤存放檢查及恢復信息,使得RAID 2技術實施更復雜、速度最慢,因此在商業環境中很少使用,最適合用于諸如圖像之類的應用。

(5)RAID 3:通常是按字節將數據劃分為條紋分配在許多驅動器上,雖然也可按位劃分,但它在陣列時專用一個驅動器保存奇偶校驗信息,因此它同RAID 2非常類似,區別在于它使用簡單的奇偶校驗,并用單塊磁盤存放奇偶校驗信息。如果一塊磁盤失效,奇偶盤及其他數據盤可以重新產生數據;如果奇偶校驗失效,則不影響數據使用,但奇偶盤會成為寫操作的瓶頸。

(6)RAID 4:除了按扇區而不是按字節對數據劃分條紋外,RAID 4與RAID 3相似。同樣也將數據條塊化并分布于不同的磁盤上,但條塊單位為塊或記錄。它使用一塊磁盤作為奇偶校驗盤,這時奇偶校驗盤會成為寫操作的瓶頸,因此它在商業環境中也很少使用。

(7)RAID 5:是把數據和相對應的奇偶校驗信息存儲到組成RAID5的各個磁盤上,并且奇偶校驗信息和相對應的數據分別存儲在不同磁盤上。它使用一種特殊算法,可以計算出任何一個區域校驗塊的存儲位置。這樣就可以確保對校驗塊的任何讀寫操作都會在所有RAID磁盤中進行均衡,從而消除產生瓶頸的可能。它讀出效率很高,寫入效率一般,塊式的集體訪問效率較佳,但控制器的設計也相當困難。

(8)RAID 6:與RAID 5相比,它增加了第二個獨立的奇偶校驗信息塊。兩個獨立的奇偶校驗系統使用不同的算法,數據的性非常高,即使兩塊磁盤同時失效也不會影響數據的使用。相對于RAID 5有更大的寫“損失”,因此“寫性能”非常差。

(g)RAID 7:這是一種新RAID標準,其自身帶有智能化實時操作系統和用于存儲管理的軟件工具,可獨立于主機運行,不占用主機CPU資源。它采用優化的高速數據傳送磁盤結構,所有的I/O傳送均是同步進行的。可以分別控制,這樣提高了系統的并行性和系統訪問數據的速度;每個磁盤都帶有高速緩沖存儲器,實時操作系統可以使用任何操作芯片,達到不同實時系統需要。當多用戶訪問系統時,可以連續多臺主機,訪問時間幾乎接近于零。

4 RAID級別間的關系

RAID0~5級的描述、速度與容錯功能如下表所示:

5 RAID技術的特點

從RAID級別的發展與應用,歸納起來主要有如下特點:

(1)RAID控制器通過磁盤陣列的并行數據讀寫,克服了磁盤機電設計的限制,大大提高了存取速度。即如果是由四張磁盤組成的陣列,其讀寫速度幾乎是單盤的四倍,從而為不同的應用服務。

(2)RAID系統提供了大容量的數據存儲,而且這張磁盤上的數據對于主機來說隨時可用。復雜的RAID系統可允許用戶通過控制器發的數據途徑組成多盤級連。在一個充分設置的RAID中,它的高性能控制器可同時進行90張盤的尋址操作。

(3)RAID系統運用奇偶校驗技術提高數據的性。在這種體系中,當RAID控制器在磁盤上寫數據時,它還會記錄下相應的奇偶校驗位冗余數據。如果盤片失效,這個奇偶信息可使RAID控制器在不降低性能的情況下重新計算丟失的信息。

6 結束語

RAID技術可以通過軟件或硬件實現。軟件實現RAID需要一些網絡操作系統的支持,可以使用標準的SCSI適配卡和管理驅動器來完成。由于是操作系統下實現RAID技術,因此軟件RAID不能保護系統盤。并且當系統崩潰需要重新安裝時,RAID信息也會丟失;硬件RAID是采用集成的陣列卡或專用的陣列卡來控制硬盤驅動器的。這樣可以極大地節省服務器系統CPU和操作的資源,從而使網絡服務器的性能獲得很大的提高。RAID控制器與主系統之間有連接存取接口(如SCSI、IDE和SATA)的信道。在主機系統的存取接口中是一個獨立的直接存取儲存體,并且可以有不止一個邏輯盤卡,都支持在線更換、熱插拔交換,同時在部分操作系統下實現軟件監控和管理。因此,依據企事業的實際,實現RAID技術的數據儲存。

數據存儲技術論文:基于層次型報表的數據存儲技術研究

摘要:數據模型常見有層次、網狀和關系三種模型,結合《某市農業信息系統》的設計中遇到的層次型報表,該文研究了將層次型模型轉化為關系模型的三種方法,最終提出了基于樹型存儲法的字典目錄法數據存儲技術,利用該技術實現了系統的成功開發,證明了字典目錄法有效性。

關鍵詞:數據模型;層次型報表;存儲技術

1 數據模型

數據庫是信息系統的核心和基礎。它把信息系統中的大量數據按照一定的模型組織起來,提供存儲、維護、檢索數據的功能,是信息系統可以方便、及時、從數據庫中獲取所需的信息。一個信息系統的各個部分能否緊密的結合在一起以及如何結合,關鍵在數據庫。因此必須對數據庫進行合理設計[1]。

1.1 常見數據模型

在數據庫系統中,主要的數據模型有[2]:層次模型(Hierarchical Model)、網狀模型(Network Model)和關系模型(Relational Model)。其中,應用最廣泛的當屬關系模型。

1.1.1 層次模型

層次模型:用樹型(層次)結構表示實體類型及實體之間聯系的數據模型稱為層次模型。如圖1。層次結構是一棵樹,樹的結點是記錄類型,非根結點有且只有一個父結點。上一層記錄類型和下一層記錄類型的聯系是1:M聯系。

1.1.2 網狀模型

網狀模型:用從結構(網絡結構)表示實體類型及實體間聯系的數據模型稱為網狀模型。如圖2。記錄之間的聯系通過指針實現,M:N聯系容易實現(一個M:N聯系可拆成兩個1:M聯系),查詢效率高。

1.1.3 關系模型

用規范化了的二維表格結構表示實體集,用鍵表示實體間聯系。通常是若干個關系模型組成的集合。如表1所示。

1.2 項目中數據報表

作者負責開發的《某市農業基礎信息系統》中,提供的基礎信息為如表2。本文為了簡要說明問題,僅以表2中部分信息為例,展開對層次型數據的存儲與檢索的討論。表中其他同結構信息和系統中涉及到的其它12張,以及其基于此基礎信息的統計表實現方法雷同。

對該表中數據進行構造,吻合層次型數據模型。在傳統的項目開發中經常遇到的多是如二維表結構的模型,即便是其它例如層次模型、網狀模型均可以通過描述實體關系的E-R圖轉換為關系模型。

2 項目介紹

為了實現某市農業局農業基礎信息的積累,便于政府決策人員獲取農村基層涉及基礎設施、文化、衛生、福利情況、養殖業、種植業、專業村、經濟收益分配、農民負擔、村集體經濟組織收益分配、村級資產負債等信息統計,根據歷史信息,獲取農業發展規律,為政府管理人員提供決策依據,也便于隨時隨地了解該局下屬各級行政單位縣、鄉、村的基本信息。保障了信息傳遞的暢通性,真實性和公正性。

2.1 項目功能

2.1.1縣、鄉、村類別的行政單位基礎信息網上錄入

2.1.1 村級農經基礎信息的逐年錄入

在每一年度,作為最小的基層單位,需要將本單位涉及到農村基本情況表:基礎設施、文化、衛生、福利情況、養殖業、種植業、專業村、經濟收益分配、農民負擔、村集體經濟組織收益分配、村級資產負債等信息統計,并錄入相應的報表中,要求數據錄入簡捷,操作方便。

2.1.2 鄉,縣,市年度統計信息

依據下屬逐年基礎信息的上報經審核后由村鄉縣市四個級別的自動生成統計信息。上級部門僅有審核權限,沒有修改權限。保障了信息的真實性。

2.1.2 信息檢索

由不同行政級別的決策者查閱信息:年度基礎值、年度統計值、若干年指標平均值、按指標排名等。

2.1.3 信息打印

對于檢索的信息的在線打印,便于決策者查詢與參考。保障在網絡和電腦之外的其他傳統存儲介質的使用,尤其在不能上網的情況下,照樣能隨時查閱農村資料。

2.1.4 信息備份和恢復

信息備份和恢復:對于存儲的基礎信息,為了安全起見,能導出到其它存儲空間。一旦出現意外,數據不會丟失。保障了信息的安全性。

2.2 關鍵技術

2.2.1 數據存儲

數據的存儲是開發的基石,但是表1是一個不規則的層次型表格。對于如此復雜結構的報表想要通過關系之間轉換, 以及如何選擇數據庫進行存儲、數據之間的邏輯關系、選取何種數據模型,該項目的關鍵技術。并且還要考慮到本項目中數據每年不同,同時還不能覆蓋歷史信息。以及類似此結構的(村級)基本信息表共12張,如此基本信息表生成的行政單位(鄉,縣,市)的統計表也是12張。同時初步統計出該市共有2375個行政村,236個鄉,5個縣。該項目中數據逐年增添的龐大性,也要求開發者從長遠考慮,慎重選擇數據庫開發工具。

2.2.2 數據檢索

在信息找到解決方案后,如何在復雜的數據庫中依據數據表之間的對應關系,根據散落的信息,瀏覽者中進行查詢,要求操作簡單,查詢結果易于瀏覽,查詢信息有助于提供領導決策的要求。于是隱藏在數據之中的信息檢索也是本項目的重中之重。

3 層次型數據存儲技術

3.1 關系數據模型的確定

軟件開發中常用的數據庫技術現在比較流行大中型的有MySQL、IBM DB2、Oracle、SQL Server、SyBase、Informix等,個人用戶比較常用的主要是基于中小型數據庫MS SQL Server和Access。但是這些數據庫均是關系型數據庫。而現實項目開發中接觸的教多的初級信息多為不規范的數據,需要進行整合重組為關系數據庫。

3.2 層次模型轉換為關系模型的方法

3.2.1 分割表法

依據層次關系依據節點的父子關系可分割為關系模型,將表2中作為父節點的單元生成新表,只要其內容下有分支,就要產生一個新二維表表,具有規則的行和列,分解后的關系模型以及組成字段的簡要描述如表3。

該方法雖然實現了將層次型數據轉換為關系型數據[3],但是將一個表中信息分解的支離破碎,考慮到數據的完整性,增、刪、改等操作中容易引發異常;表的數量過大,多表查詢時聯接頻繁,導致查詢信息的效率低下。同時對于每個行政單位的具體年份的信息無法存儲下來。結論:此方案不可行。

3.2.2 樹型存儲法

由于每個信息節點需要記錄其兩個組成部分:父節點(parentID)和自身(ID)的數據信息(Num)。借助于《數據結構》課程中對樹型結構數據的實現方法[4],設計出對于每個節點除保存本身信息外還要記錄每個節點的父節點,對于表名視為樹的根(parentID為0),其它節點的parentID是通過記錄父親節點的(ID)實現的。

對于表1行的數量不發生改變,以添加新列記錄下每個單位每年度的信息數據。此方法中便于查詢和統計信息生成。因為行的數量固定,但是列的再逐年改變。依據開發經驗,基于表的信息的操作,一般是表結構固定下來后,添加數據、更新數據、查詢數據等操作不要做表的結構變化。但是此方法雖然記錄了表之間的關系,然而表中信息的年度和行政單位等資料無法存儲,如要存儲需要添加新列,而列的名字等信息還不穩定的話,開發人員無法正確讀取信息[5]。同時在每個年度添加列,修改表的結構會可能會導致表的部分重要信息丟失頻繁,尤其是對于特殊的數據(如必填字段)無法正常執行,導致表的信息或修改表的結構無法正常結束。結論:此方案不可行。

3.2.3 字典目錄法

結合樹型存儲法能記錄層次型數據報表的特點,經項目組研究將樹型存儲法延伸為兩部分組成,形同表1的報表結構,稱之為目錄表,表4稱為信息表。在表4中記錄每個節點在某個年度的數值信息,以及該信息來自何行政單位。而節點的名字和層次需要查詢表4來獲取。而查詢的依據是TableID的值是參照表1中ID而得到的,Depart指的是歸屬的行政單位名稱,Year代表數據是哪個年份。該方法的優點是保存了表的結構,支持表的結構修改,記錄了各個指標的值。目錄表基本不變化,但是信息表每年均隨單位個數成倍遞增。查詢指定的統計信息較難,數據冗余較大。但是此方案實現了信息的完整保存:指標名,指標數,單位和年度信息的一體化。結論:此方案對于本項目是可行的。

4 基于字典目錄法的系統設計實現

系統確定了數據庫的設計思路后,基于字典目錄法的數據存儲實現由邏輯設計到物理設計的實現,為開發基于WEB《某市農業信息系統》的奠定了根基。

4.1 錄入實現

在本系統中確定了信息的存儲方法,由于用戶的涉及面廣,文化程度不一,對于信息技術的操作熟練程度不等,要求對于錄入界面要求界面友好,操作簡潔,信息數據錄入方便。根據用戶具體情況,設計如如圖3錄入界面,在系統使用過程中以操作方便、界面友好,能自動校驗數據之間的平衡關系等特點,得到了用戶喜愛。

4.2 信息檢索

根據系統設計的表:結構表,信息表,行政單位表三個基本表,將基于字典目錄法的數據存儲成功后,就可進行信息查詢。查詢的基本思路如下:

查詢的條件-用戶要錄入選擇-查詢的指標內容和何年度指標。

4.2.1 確定檢索指標種類

選擇檢索的信息的種類,是基礎設施、文化、衛生、福利情況、養殖業、種植業、專業村、經濟收益分配、農民負擔、村集體經濟組織收益分配、村級資產負債等信息中的哪個類別。依次確定該類別信息涉及到的表名。

4.2.2 查找目錄表

根據信息種類依據目錄表來還原為層次模型結構原型。

4.2.3 取出信息表數據

根據層次表原型,結合信息表中的年度信息,取出基本數據。

4.2.4 顯示檢索指標數據

將基本數據載入到層次型結構中。顯示用戶檢索信息。

由于篇幅有限,且此檢索功能需要涉及到項目中的各表,而本文僅重點討論層次型數據存儲技術,檢索算法的詳

細算法和流程圖略。

5 結束語

本文主要結合項目課題基于Web的《某市農業信息系統》的設計,延伸出對于層次型報表轉化為關系模型存儲中的重要技術作了討論;同時結合分割表法、樹型存儲法分析了常用方法的優缺點,提出了基于樹型存儲法的字典目錄法存儲數據。該方法解決了層次模型轉化為關系模型的困難,結合項目的功能要求,實現了與農業局各級行政單位在指定年度的各項指標信息的存儲問題。本系統的實現是新農村信息化的具體表現,解決了農業部門信息資料收集區域廣,信息統計困難、數據誤差大等問題,真正實現了信息的時效性、真實性,為政府部門提供了決策依據。

數據存儲技術論文:基于層次型報表的數據存儲技術研究

摘要:數據模型常見有層次、網狀和關系三種模型,結合《某市農業信息系統》的設計中遇到的層次型報表,該文研究了將層次型模型轉化為關系模型的三種方法,最終提出了基于樹型存儲法的字典目錄法數據存儲技術,利用該技術實現了系統的成功開發,證明了字典目錄法有效性。

關鍵詞:數據模型;層次型報表;存儲技術

1 數據模型

數據庫是信息系統的核心和基礎。它把信息系統中的大量數據按照一定的模型組織起來,提供存儲、維護、檢索數據的功能,是信息系統可以方便、及時、從數據庫中獲取所需的信息。一個信息系統的各個部分能否緊密的結合在一起以及如何結合,關鍵在數據庫。因此必須對數據庫進行合理設計[1]。

1.1 常見數據模型

在數據庫系統中,主要的數據模型有[2]:層次模型(Hierarchical Model)、網狀模型(Network Model)和關系模型(Relational Model)。其中,應用最廣泛的當屬關系模型。

1.1.1 層次模型

層次模型:用樹型(層次)結構表示實體類型及實體之間聯系的數據模型稱為層次模型。如圖1。層次結構是一棵樹,樹的結點是記錄類型,非根結點有且只有一個父結點。上一層記錄類型和下一層記錄類型的聯系是1:M聯系。

1.1.2 網狀模型

網狀模型:用從結構(網絡結構)表示實體類型及實體間聯系的數據模型稱為網狀模型。如圖2。記錄之間的聯系通過指針實現,M:N聯系容易實現(一個M:N聯系可拆成兩個1:M聯系),查詢效率高。

1.1.3 關系模型

用規范化了的二維表格結構表示實體集,用鍵表示實體間聯系。通常是若干個關系模型組成的集合。如表1所示。

1.2 項目中數據報表

作者負責開發的《某市農業基礎信息系統》中,提供的基礎信息為如表2。本文為了簡要說明問題,僅以表2中部分信息為例,展開對層次型數據的存儲與檢索的討論。表中其他同結構信息和系統中涉及到的其它12張,以及其基于此基礎信息的統計表實現方法雷同。

對該表中數據進行構造,吻合層次型數據模型。在傳統的項目開發中經常遇到的多是如二維表結構的模型,即便是其它例如層次模型、網狀模型均可以通過描述實體關系的E-R圖轉換為關系模型。

2 項目介紹

為了實現某市農業局農業基礎信息的積累,便于政府決策人員獲取農村基層涉及基礎設施、文化、衛生、福利情況、養殖業、種植業、專業村、經濟收益分配、農民負擔、村集體經濟組織收益分配、村級資產負債等信息統計,根據歷史信息,獲取農業發展規律,為政府管理人員提供決策依據,也便于隨時隨地了解該局下屬各級行政單位縣、鄉、村的基本信息。保障了信息傳遞的暢通性,真實性和公正性。

2.1 項目功能

2.1.1縣、鄉、村類別的行政單位基礎信息網上錄入

1) 村級農經基礎信息的逐年錄入

在每一年度,作為最小的基層單位,需要將本單位涉及到農村基本情況表:基礎設施、文化、衛生、福利情況、養殖業、種植業、專業村、經濟收益分配、農民負擔、村集體經濟組織收益分配、村級資產負債等信息統計,并錄入相應的報表中,要求數據錄入簡捷,操作方便。

2) 鄉、縣、市年度統計信息

依據下屬逐年基礎信息的上報經審核后由村鄉縣市四個級別的自動生成統計信息。上級部門僅有審核權限,沒有修改權限。保障了信息的真實性。

2.1.2 信息檢索

由不同行政級別的決策者查閱信息:年度基礎值、年度統計值、若干年指標平均值、按指標排名等。

2.1.3 信息打印

對于檢索的信息的在線打印,便于決策者查詢與參考。保障在網絡和電腦之外的其他傳統存儲介質的使用,尤其在不能上網的情況下,照樣能隨時查閱農村資料。

2.1.4 信息備份和恢復

信息備份和恢復:對于存儲的基礎信息,為了安全起見,能導出到其它存儲空間。一旦出現意外,數據不會丟失。保障了信息的安全性。

2.2 關鍵技術

2.2.1 數據存儲

數據的存儲是開發的基石,但是表1是一個不規則的層次型表格。對于如此復雜結構的報表想要通過關系之間轉換, 以及如何選擇數據庫進行存儲、數據之間的邏輯關系、選取何種數據模型,該項目的關鍵技術。并且還要考慮到本項目中數據每年不同,同時還不能覆蓋歷史信息。以及類似此結構的(村級)基本信息表共12張,如此基本信息表生成的行政單位(鄉,縣,市)的統計表也是12張。同時初步統計出該市共有2375個行政村,236個鄉,5個縣。該項目中數據逐年增添的龐大性,也要求開發者從長遠考慮,慎重選擇數據庫開發工具。

2.2.2 數據檢索

在信息找到解決方案后,如何在復雜的數據庫中依據數據表之間的對應關系,根據散落的信息,瀏覽者中進行查詢,要求操作簡單,查詢結果易于瀏覽,查詢信息有助于提供領導決策的要求。于是隱藏在數據之中的信息檢索也是本項目的重中之重。

3 層次型數據存儲技術

3.1 關系數據模型的確定

軟件開發中常用的數據庫技術現在比較流行大中型的有MySQL、IBM DB2、Oracle、SQL Server、SyBase、Informix等,個人用戶比較常用的主要是基于中小型數據庫MS SQL Server和Access。但是這些數據庫均是關系型數據庫。而現實項目開發中接觸的教多的初級信息多為不規范的數據,需要進行整合重組為關系數據庫。

3.2 層次模型轉換為關系模型的方法

3.2.1 分割表法

依據層次關系依據節點的父子關系可分割為關系模型,將表2中作為父節點的單元生成新表,只要其內容下有分支,就要產生一個新二維表表,具有規則的行和列,分解后的關系模型以及組成字段的簡要描述如表3。

該方法雖然實現了將層次型數據轉換為關系型數據[3],但是將一個表中信息分解的支離破碎,考慮到數據的完整性,增、刪、改等操作中容易引發異常;表的數量過大,多表查詢時聯接頻繁,導致查詢信息的效率低下。同時對于每個行政單位的具體年份的信息無法存儲下來。結論:此方案不可行。

3.2.2 樹型存儲法

由于每個信息節點需要記錄其兩個組成部分:父節點(parentID)和自身(ID)的數據信息(Num)。借助于《數據結構》課程中對樹型結構數據的實現方法[4],設計出對于每個節點除保存本身信息外還要記錄每個節點的父節點,對于表名視為樹的根(parentID為0),其它節點的parentID是通過記錄父親節點的(ID)實現的。

表3 分割表法實現的關系模型組成 表4 字典目錄法的信息表

對于表1行的數量不發生改變,以添加新列記錄下每個單位每年度的信息數據。此方法中便于查詢和統計信息生成。因為行的數量固定,但是列的再逐年改變。依據開發經驗,基于表的信息的操作,一般是表結構固定下來后,添加數據、更新數據、查詢數據等操作不要做表的結構變化。但是此方法雖然記錄了表之間的關系,然而表中信息的年度和行政單位等資料無法存儲,如要存儲需要添加新列,而列的名字等信息還不穩定的話,開發人員無法正確讀取信息[5]。同時在每個年度添加列,修改表的結構會可能會導致表的部分重要信息丟失頻繁,尤其是對于特殊的數據(如必填字段)無法正常執行,導致表的信息或修改表的結構無法正常結束。結論:此方案不可行。

3.2.3 字典目錄法

結合樹型存儲法能記錄層次型數據報表的特點,經項目組研究將樹型存儲法延伸為兩部分組成,形同表1的報表結構,稱之為目錄表,表4稱為信息表。在表4中記錄每個節點在某個年度的數值信息,以及該信息來自何行政單位。而節點的名字和層次需要查詢表4來獲取。而查詢的依據是TableID的值是參照表1中ID而得到的,Depart指的是歸屬的行政單位名稱,Year代表數據是哪個年份。該方法的優點是保存了表的結構,支持表的結構修改,記錄了各個指標的值。目錄表基本不變化,但是信息表每年均隨單位個數成倍遞增。查詢指定的統計信息較難,數據冗余較大。但是此方案實現了信息的完整保存:指標名,指標數,單位和年度信息的一體化。結論:此方案對于本項目是可行的。

4 基于字典目錄法的系統設計實現

系統確定了數據庫的設計思路后,基于字典目錄法的數據存儲實現由邏輯設計到物理設計的實現,為開發基于WEB《某市農業信息系統》的奠定了根基。

4.1 錄入實現

在本系統中確定了信息的存儲方法,由于用戶的涉及面廣,文化程度不一,對于信息技術的操作熟練程度不等,要求對于錄入界面要求界面友好,操作簡潔,信息數據錄入方便。根據用戶具體情況,設計如如圖3錄入界面,在系統使用過程中以操作方便、界面友好,能自動校驗數據之間的平衡關系等特點,得到了用戶喜愛。

4.2 信息檢索

根據系統設計的表:結構表,信息表,行政單位表三個基本表,將基于字典目錄法的數據存儲成功后,就可進行信息查詢。查詢的基本思路如下:

查詢的條件-用戶要錄入選擇-查詢的指標內容和何年度指標。

4.2.1 確定檢索指標種類

選擇檢索的信息的種類,是基礎設施、文化、衛生、福利情況、養殖業、種植業、專業村、經濟收益分配、農民負擔、村集體經濟組織收益分配、村級資產負債等信息中的哪個類別。依次確定該類別信息涉及到的表名。

4.2.2 查找目錄表

根據信息種類依據目錄表來還原為層次模型結構原型。

4.2.3 取出信息表數據

根據層次表原型,結合信息表中的年度信息,取出基本數據。

4.2.4 顯示檢索指標數據

將基本數據載入到層次型結構中。顯示用戶檢索信息。

由于篇幅有限,且此檢索功能需要涉及到項目中的各表,而本文僅重點討論層次型數據存儲技術,檢索算法的詳細算法和流程圖略。

5 結束語

本文主要結合項目課題基于Web的《某市農業信息系統》的設計,延伸出對于層次型報表轉化為關系模型存儲中的重要技術作了討論;同時結合分割表法、樹型存儲法分析了常用方法的優缺點,提出了基于樹型存儲法的字典目錄法存儲數據。該方法解決了層次模型轉化為關系模型的困難,結合項目的功能要求,實現了與農業局各級行政單位在指定年度的各項指標信息的存儲問題。本系統的實現是新農村信息化的具體表現,解決了農業部門信息資料收集區域廣,信息統計困難、數據誤差大等問題,真正實現了信息的時效性、真實性,為政府部門提供了決策依據。

數據存儲技術論文:海量數據存儲關鍵技術淺析

摘要:海量數據的大量出現,使存儲技術正發生革命性的變化。針對海量數據存儲環境,對網絡附加存儲(NAS)及存儲區域網絡(SAN)進行了分析,研究了面向對象存儲技術。并且對海量數據存儲的數據庫策略進行了闡述,包括Oracle數據庫的表分區技術的策略、特性及應用;Oracle數據庫并行處理結構及特性。

關鍵詞:海量數據;對象存儲技術;分區技術;并行處理技術

1 問題提出

當今是一個信息大爆炸的時代,網絡的廣泛使用更加劇了信息爆炸的速度。信息資源的爆炸性增長,對存儲系統在存儲容量、數據可用性以及I/O性能等方面提出了越來越高的要求。信息技術正從以計算設備為核心的計算時代步入以存儲設備為核心的存儲時代。

海量數據是指數據量極大,往往是Terabyte(1012bytes)、Petabyte(1015bytes)甚至Exabyte(1018bytes)級的數據集合。存儲這些海量信息不但要求存儲設備有很大的儲存容量,且還需要大規模數據庫來存儲和處理這些數據,在滿足通用關系數據庫技術要求的同時,更需要對海量存儲的模式、數據庫策略及應用體系架構有更高的設計考慮。

2 海量數據存儲模式選擇

存儲系統的存儲模式影響著整個海量數據存儲系統的性能,為了提供高性能的海量數據存儲系統,應該考慮選擇良好的海量存儲模式。

對于海量數據而言,實現單一設備上的存儲顯然是不合適的,甚至是不可能的。結合網絡環境,對它們進行分布式存儲不失為當前的上策之選。如何在網絡環境下,對海量數據進行合理組織、存儲,并提供高效、高可用、安全的數據訪問性能成為當前一個研究熱點。適合海量數據的理想存儲模式應該能夠提供高性能、可伸縮、跨平臺、安全的數據共享能力。

2.1 現有存儲模式分析

目前磁盤存儲市場上,根據服務器類型存儲分類如圖1所示。

其中外掛存儲占目前磁盤存儲市場的70%以上。由于網絡技術的崛起,直連式存儲(DAS)已顯得非常力不從心,存儲模式從以服務器為中心轉向以數據為中心的網絡存儲模式,目前典型的代表是:網絡附加存儲(NAS)和存儲區域網絡(SAN) [1-3]。

2.1.1 網絡附加存儲(NAS)

NAS(Network Attached Storage,網絡附加存儲)是一種文件級的網絡存儲模式,結構如圖2所示。它擁有自己的文件系統,通過NFS或CIFS對外提供文件訪問服務。NAS將存儲設備通過標準的網絡拓撲結構連接到現有的網絡上來提供數據和文件服務。NAS管理簡單、擴容方便,統一的文件系統使數據共享變得非常簡單,所以其較大的優點是跨平臺性很好,但NAS服務器在網絡存儲中處于數據通路上,當服務請求激增時存在I/O瓶頸,性能是NAS的較大問題,因此基于NAS的存儲方案對于組建海量存儲共享系統來說并不是一種理想的方案。

2.1.2 存儲區域網絡(SAN)

SAN(Storage Area Network,存儲區域網絡) 結構如圖3所示。它是存儲設備與服務器經由高速網絡設備連接而形成的存儲專用網絡。SAN一般基于光纖通道FC(Fibre Channel)或iSCSI(internet SCSI )構建,它是塊級的存儲,系統性能非常優越。SAN的優點是高容量、高性、低延遲,缺點是SAN沒有一個統一的存儲系統接口,對存儲設備的共享訪問存在數據的完整性與安全性問題,設備的跨平臺性較差。

2.2 對象存儲技術

對象存儲技術提供基于對象的訪問接口,將NAS和SAN兩種存儲結構的優勢進行了有效地整合,通過高層次的抽象,使之既具有NAS的跨平臺共享數據和安全訪問的優點,同時又具有SAN的高性能和可伸縮性的優點。

2.2.1 對象存儲模式

對象存儲模式[4]一般由Client、MDS(Metadata Server)和OSD(Object Storage Device)三部分組成,如圖4所示。

Client為客戶端,用來發起數據訪問;MDS為服務器,用來管理對象存儲系統中的元數據并保障訪問的一致性;OSD為存儲對象數據的設備,它是一個智能設備,包括處理器、RAM內存、網絡接口、存儲介質等以及運行在其中的控制軟件[5]。

對象存儲設備(OSD)中,將對象(object)作為對象存儲的基本單元,每個對象具有惟一的ID標識符。對象由對象ID、對象數據的起始位置、數據的長度來進行訪問。對象提供類似文件訪問的方法,如Create,Open,Close,Read,Write,對象屬性等;對象的數據包括自身的元數據和用戶數據,其中,元數據用于描述對象特定的屬性,如對象的邏輯大小、對象的元數據大小、總的字節大小;用戶數據用來保存實際的二進制數據。

對象分為根對象、組對象和用戶對象。根對象定義了存儲設備以及存儲設備本身的不同屬性;組對象為存儲設備上對象提供了目錄;用戶對象存儲實際應用數據。

2.2.2 對象存儲模式用于海量數據存儲的優勢

對象存儲模式的特性使其在處理海量數據存儲請求時具有較大優勢,主要體現在:

1) 高性能數據存儲:訪問節點有獨立的數據通路和元數據訪問通路,可以對多個OSD進行并行訪問,從而解決了當前存儲系統的一個性能瓶頸問題。

2) 跨平臺數據共享:由于在對象存儲系統上部署基于對象的分布式文件系統比較容易,所有能夠實現不同平臺下的設備和數據的共享。

3) 方便安全的數據訪問:I/O通道的建立及數據的讀寫需要經過授權許可才能進行,從而保障了數據訪問的安全性;另一方面,任何Client都可以通過對象存儲系統提供的標準文件接口訪問OSD上的數據,統一的命名空間使Client訪問數據的一致性得到了保障。

4) 可伸縮性:對象存儲模式具有分布式結構的特性。由于OSD是獨立的智能設備,可以通過增加OSD數量,使存儲系統的聚合I/O帶寬、存儲容量和處理能力得到提高,這種平衡擴展模式使得存儲系統能夠具有良好的可伸縮性。

5) 智能的存儲設備:OSD中集成了部分的存儲管理功能,因此OSD具有一定智能的自主存儲功能。

3 數據庫策略

數據庫管理系統(DBMS)是海量數據存儲檢索系統的核心部件,所有對數據的控制都要通過DBMS來實現。Oracle數據庫管理系統應用十分普及,是目前高性能存儲檢索系統主要選擇的關系數據庫管理系統,因此本文海量數據的存儲基于Oracle數據庫管理系統來實現。

本文基于海量數據環境,對通用的數據庫管理策略不作研究,只針對海量數據找到有效存儲方法,設計并實現高性能面向海量數據存儲的數據庫關鍵策略。

實現高性能的海量數據存儲可采取的數據庫策略有:

1) 分區技術:為了更精細地對數據庫對象如表、索引及索引編排表進行管理和訪問。可以對這些數據庫對象進行進一步的劃分,這就是所謂的分區技術。

2) 并行處理技術:為了提高系統性能,可以讓多個處理器協同工作來執行單個SQL語句,這就是所謂的并行處理技術。

3.1 數據庫表分區技術

3.1.1 基本概念

本文研究的主要存儲對象為海量數據,數據庫的大小常常達到數百GB甚至用TB來計算。而單表的數據量往往會達到上億的記錄,并且記錄數會隨著時間而增長。當表和索引變得非常大時,分區可以將數據分為更小、更容易管理的部分來提高系統的運行效率。對表和索引進行分區的主要目的就是改善大型表的可伸縮性和可管理性。所以對大型表進行分區是處理海量數據的一種十分高效的方法。

由于本文研究的主要存儲對象為海量數據,存儲時數據庫中只存儲文件名、摘要及其它文字說明,源文件的內容存儲在數據庫以外的物理介質上。

3.1.2 分區策略

Oracle分區的表通過使用“分區關鍵字”分區,分區關鍵字是確定某個行所在分區的一組列。Oracle提供了三種基本數據分配方法:范圍(range)、列表(1ist)與散列(hash)。使用上述的數據分配方法,可以將表分成單一分區表或組合分區表。則Oracle提供的分區技術主要分為以下幾種: 范圍分區,列表分區,散列分區,組合范圍-散列分區,組合范圍-列表分區[6]。

此外Oracle還提供三種類型的分區索引,包括本地索引、全局分區索引和全局非分區索引。可以根據業務需求選擇相應的索引分區策略,從而實現最合適的分區,以支持任何類型的應用程序。

Oracle提供一套強健的技術用于表、索引和索引編排表的分區。海量數據的數據庫存儲可以選用以上分區技術中的一種或幾種,通過一組完整的SQL命令來管理分區表,從而達到高性能檢索的目的。

3.1.3 分區技術的應用

本文的研究對象是海量的文檔數據集,對文檔集進行分類處理,采用范圍分區技術的應用將使系統各方面得到改善:

1) 增強可用性:如果數據庫表的某個分區出現了故障,可以確保數據庫表在其它分區中的數據仍然可用。

2) 維護方便:如果數據庫表的某個分區出現了故障,則僅需修復該故障分區的數據即可,而不需要對整個數據庫表進行維護。

3) 均衡I/O:可以將數據庫表不同的分區映射到磁盤用以平衡I/O,可以使系統的整體性能得到改善。

4)改善查詢性能:用戶對分區對象進行查詢時,只需要搜索用戶關心的分區,從而可以提高查詢速度,改善查詢性能。

3.2 數據庫并行處理技術

3.2.1 基本概念

并行處理技術是數據庫的一項核心技術,是指利用多個CPU和I/O資源來執行單個數據庫操作,從而使得數據庫能夠高效地管理和訪問TB級的數據[7]。盡管目前主流的數據庫管理系統都表示可以提供并行處理能力,但在并行處理結構上都存在著關鍵的差異。

3.2.2 Oracle并行處理結構

所謂并行處理是指:將單個任務分解為多個更小的單元。不是將所有工作通過一個進程完成,而是將任務并行化,從而使得多個進程同時在更小的單元上運行,這樣做能極大地提高系統性能并且能地利用系統資源。

Oracle使用動態并行處理框架,數據操作可以依據當前工作特征、查詢及負載的重要性,使用1~N個真正應用集群節點并行運行。

3.2.3 并行處理技術的特性

Oracle數據庫并行技術能提高數據庫性能,并且能提高數據庫的較大運行速度和較大負載量。由于并行系統的每個節點都相互獨立,使得一個節點如果出現故障不會導致這個數據庫崩潰,剩余的節點可以在為用戶提供服務的同時對故障節點進行恢復,因此并行技術比單節點的性要高。Oracle數據庫并行技術還能根據需要隨時分配和釋放數據庫實例,數據庫的機動性高。還有一點就是并行技術可以克服內存限制,為更多的用戶提供數據服務。

4 結束語

對象存儲模式由于具有良好的可伸縮性、高性能、跨平臺、安全數據共享等能力,成為海量數據存儲模式的一個理想選擇;配合數據庫的分區技術和并行處理技術,可以實現高性能的海量數據存儲。

數據存儲技術論文:關于電網調控運行大數據存儲與處理技術的分析

摘 要:在新形勢下,電網調控運行大數據存儲與處理需要應用不同的技術方式,提高電網調控運行的質量和水平。文章主要就電網調控運行大數據分類及特征、電網調控運行大數據存儲與處理技術框架、電網調控運行大數據存儲與處理技術的應用三個方面內容進行論述。

關鍵詞:電網調控運行;大數據;分類及特征;存儲與處理;框架;應用

引言

隨著科學技術的進步和發展,為更好的滿足各種電力系統應用需求,提高電力系統的質量和水平,我國開展了智能電網的建設工作。其中,一個重要的工作是對于新型技術方式的應用。比如:具有更好質量、更大規模、更多數據信息來源的電網調控中心需要進行高質量的應用,對于電網調控運行大數據進行良好的存儲與處理,開展更好的應用,對于整個的電網系統運行進行數據信息保障。因此,我們針對電網調控運行大數據分類及特征、電網調控運行大數據存儲與處理技術框架、電網調控運行大數據存儲與處理技術的應用問題進行研究和分析工作,為加快我國的智能電網建設貢獻出一份力量,更好的滿足人們對電力資源應用的需求。

1 電網調控運行大數據分類及特征

電網調控運行大數據可以依據來源方式的不同分為電網調控運行大數據、基礎數據、外部信息數據、電網運行及設備狀態監測數據四種不同的類型。這四種不同類型數據在應用中具有緊密的關系。在電網調控運行的眾多數據中,計劃類的數據、負荷預測數據、電網運行的數據、基礎性的數據等屬于結構性的數據方式。同時,在應用中還存在一些非結構性的數據方式。比如:圖形圖像的處理、視頻的監控等漸漸在應用中發揮出重要的作用。

隨著電網調控規模的擴大、數據體積的變大、應用種類的增多、結構的漸漸復雜,進行高質量的數據處理和存儲已經變得比較困y。因此,需要對于系統運行的結構、方式等等進行性改變,提高存儲和處理的質量和水平[1]。

2 電網調控運行大數據存儲與處理技術框架

2.1 大數據的分類存儲

為提高電網調控運行大數據存儲質量,我們需要進行原始數據資源信息獲得,并且進行有效性預處理,通過開展高質量的原始數據信息過濾、篩選等等工作,提高存儲的質量和水平,為今后的分析提供保障。在智能化電網建設的背景下,為更好的滿足數據存儲的需求,我們需要應用合理化的方式來提高存儲的速度和水平。如:可以進行實時性的存儲工作,對于不同來源的數據信息進行分類的管理存儲。

2.2 大數據的分類處理

從不同類型數據的實時性出發,對于數據信息進行專業化整理工作,進行不同一次數據集和目標數據集之間關系的充分表示,形成關聯性的函數。然后應用合理化方式進行電網調控業務數據流程的優化。電網調控運行大數據存儲與處理的流程為:電網運行設備狀態監測數據――電網調控運行大數據――大數據預處理――實時數據存儲/非實時數據存儲――流處理/批處理――數據駁動――數據應用[2]。

3 電網調控運行大數據存儲與處理技術的應用

3.1 對電網狀態的智能化監控

通過對電網調控運行大數據分類存儲與處理,對于系統中的I/O優點進行有效性應用,對于系統的數據進行有效性監控和管理,開展分類的存儲。比如:對于系統中的電流、電壓、保護動作信號、諧波等開展有效性管理工作,最終可以構建高質量的數據驅動機組安全運行狀態模型,對于系統應用中存在的不穩定因素進行分析和研究,有利于檢修人員在最短時間中趕到現場進行專業化處理,提高電網狀態運行質量和水平,保障電網系統的安全,有利于電網系統的功能得到充分發揮[3]。(其主要的管理監控流程如圖1所示)

3.2 安全智能預警

通過對于變電站和調控中心的應用,系統主要是對于預想事故中典型運行方式進行專業化的離線計算。但是,這種方式在應用中存在明顯的缺點,即預警方式不、不及時。因此,我們對電網調控運行大數據存儲與處理技術進行有效性的應用,通過對高質量網絡信息技術、計算機技術等進行充分應用,建立起新型的全網一體化實時仿真計算方式,可以對系統應用中的故障和問題進行性、實時性的預警,提高了系統大數據存儲與處理的質量和水平,對于原有系統中的問題進行解決,可以對電網的整體性運行狀態進行了科學化評估,有利于電網調控中心內的工作人員依據實際情況需要,采取正確合理化的控制舉措。比如:將有關的問題通過智能化的溝通平臺及時通知有關維護人員,使得他們在最短的時間內趕到現場,應用專業化的手法來進行故障問題的處理,提高系統安全運行的能力,保障了電網系統在未來的應用中具有良好的應用價值和水平,更好的滿足人們對于高質量電力資源應用的需求[4]。(其主要的管理模式如圖2所示)

3.3 廣域源荷互動的優化調度

科學技術的發展,使得眾多的新型能源在電網中進行了并網應用。比如:風能(孝感電網包括:雷鼓臺、岳家山、江家山、仙居頂、界嶺風電場)、光伏能源(孝感電網包括:天紫、竹園、曹崗、楊畈、三汊光伏發電廠)、生物質能(孝感電網包括:金秋電廠)等等具有間歇性特點的新能源。在這種情況下,應用傳統的發電機組來進行電網的自動化智能化調節和控制無法實現。而應用大數據分類存儲和處理技術可以對全網電力資源的需求和負荷信息進行科學化調控監督工作,依據不同的時間、地點等進行電力資源的合理化配置,提高整個電網運行的質量和水平,通過科學性的調控決策、整體應用態勢的感知,在保障電網穩定和安全的前提下充分挖掘電網新能源的應用潛能,有利于實現我國電力能源的多樣化,降低了煤炭等傳統能源應用的數量,更好的開展節能環保工作[5]。

4 結束語

對于電網調控運行大數據存儲與處理技術進行分析,有利于我們開展電網調控運行大數據分類存儲和分類處理,然后對于原有的電網調控系統進行現代化、智能化的改造,提高電網調控大數據運行的質量和水平,保障電網系統的安全,更好的滿足人們對高質量、穩定安全電力資源應用的需求。

數據存儲技術論文:現代計算機數據存儲技術探析

摘 要 S著全社會科學技術的迅猛發展,在日常的工作和生活中,產生的信息越來越多,運行的程序也逐漸在臧鐸和復雜,需要存儲的信息量也是越來越大,對信息存儲載體的質量要求也越來越高。同時,所需要存儲的信息的重要性是不可否認的,所以對信息安全的要求也是非常高的。在這樣的社會背景下,需要非常有保障的安全保障的信息存儲技術,對現代計算機數據存儲技術的研究推動了存儲、網絡、計算機等多方面的發展。所以,對計算機數據存儲技術的研究是目前階段一個比較重要的問題。本文主要分析現代計算機存儲技術存在的重要性以及必然性,同時分析目前集中主要的技術。

關鍵詞 計算機 數據 存儲技術

0引言

現代社會,計算機是一種十分常見的事物,無論是在生活中、學習中還是工作中,計算機都隨處可見,計算機技術也無時無刻不在影響著我們的生活,計算機在最初的階段,所涉及和被應用的領域也不是非常廣泛,所以,計算機需要運行的程序和需要存儲的數據在有所增加,進而就需要計算的作出相應的完善。基于計算機的運行速度加快的需要和對信息存儲量的增加的需求,計算機需要在發展變化的過程中,逐漸完善有關軟件和硬件設施。尤其是現代社會,計算機的大部分工作的基礎都是用于數據的處理,處理數據量在增大的同時,數據的價值也在逐漸的提高。數據在逐漸發展的過程中,成為了一個獨立的實體,自由存儲,也不屬于其他任何的有關系統之內,就是相對獨立的實體。并且,數據在被處理的過程中,有著共享性的特點,也是一種存儲和保護的有價值的實體財富。由此可見,對數據的存儲設備的研究開發和保護也變得越來越重要,對信息存儲技術的研究也是一項有著極高價值的活動和行為。

1 計算機數據存儲技術的必要性

計算機數據是計算機主要運行的數據基礎,計算機的需要量很大,自然對出具的處理和存儲能力的需求就非常大,不難得出結論,計算機數據存儲技術的研究是一個十分重要,而且意義重大的研究問題。下面,從以下幾個方面,對現代計算機數據存儲技術的重要性進行分析。

1.1數據存儲技術是大數據時代的時代要求

隨著信息技術的飛速發展,數據產生的量非常大,數據產生的手段也非常先進,同時數據獲取的手段也是多渠道的。在這樣的背景之下,面對大量的數據,對數據處理的要求就自然而然的有所升高,大規模的數據密集型應用系統數據量也在呈指數級的上升趨勢,可以說是一個爆炸式的增長,目前被稱為是“大數據時代”。正是這樣的社會背景,大數據時代,顧名思義數據量是很大的,那么每個單位就需要一種可以處理大數據的程序和工具。在這樣的趨勢下,在未來的發展中,這樣的勢頭不會減少只會增加,數據量的增大,原有的數據處理的系統必然會在這時出現無法滿足目前大量數據的需求,這樣現代的計算機數據存儲技術的出現就是必然的事件了。時代的發展,科學技術的發展,數據的數量的變化,都是這個時代對計算機數據存儲技術的發展要求,計算機技術在這個變化的過程中起著非常重要的作用。

1.2方便了信息的管理

現在的社會的節奏非常快,每天的信息量都非常大,生活中是這樣,工作中就更是讓人手忙腳亂,在這個時代中產生的信息和需要處理的信息量也在逐漸的增大,那么對信息的處理工具和程序的要求自然也在提高。可以存儲大量、復雜種類信息的載體就是當前環境所需要的。信息的管理是一個復雜的過程,如果沒有很好的信息存儲的系統,那么就會嚴重影響信息的質量,就會為以后的工作帶來很多不必要的麻煩。現代計算機存儲技術的誕生,為信息管理系統的存儲帶來了方便,可以保障大量的信息可以有空間存儲、按照種類的不同分類存儲、根據信息的使用頻率分別存儲等,這些對于信息管理過程中信息的存儲都是有很大的益處的,現代計算機數據存儲技術為信息的管理提供了可以直接利用的技術支持和手段,為信息的有效管理提供了很大的方便。

1.3保障企業內部數據安全

現在的社會中,無論是什么樣的企業,一定會有很多電腦辦公的環境和情況,就是一種依賴計算機運行來處理公司一些事務的情況,那么計算機的的效率就對企業產生非常大的影響。在傳統的情況下,使用電腦辦公所占的比例相對較小,但是,現在這個時代,信息化辦公已經是一個主流的形式,面對著這樣的情況,依賴計算機,其實就是依賴計算機的對數據的處理,既然是這樣,對計算機數據存儲的需求就有所表現。現在計算機的使用非常多,那么也就是計算機的數據存儲和處理出現的非常頻繁。數據量大,就非常容易出現數據之間無法明確任務,對數據的安全性造成一定的威脅,現代計算機數據存儲技術就可以在更高的程度上避免這種數據安全性受到威脅限制。

2現代計算機數據存儲的有關技術

面對與日俱增的數據量,為了滿足這樣的數據量的存儲需求,多種存儲技術應著需求在逐漸的發展起來,各種技術有著各自的存在理由和各自的發展優勢,下文分析幾種技術的詳細原理和應用。

2.1磁盤陣列技術

磁盤陣列是由一個硬盤控制器來控制多個硬盤的連接,在讀寫的過程中,多個硬盤同時進行,降低了在讀寫過程中發生的錯誤,提高了技術處理的效率,和性。磁盤陣列技術主要針對的寸處對象是計算機的硬盤,磁盤陣列技術是目前很多領域應用的技術,主要是利用數據組的形式來作為磁盤,配合著數據分散排列的設計,有效提高數據的安全性。一個硬盤連接多個硬盤,進而多個硬盤一起進行讀寫的程序,不難理解,在對數據進行讀寫的過程中,效率是非常高的。磁盤陣列技術在對數據進行存儲時的存儲速度是非常快的,同時安全性在很大程度上可以得以保障,并且該技術的性也是非常高的。

2.2 NAS技術

NAS是一種特殊的專用數據存儲的服務器,有單獨的存儲處理核心,CPU、內存、操作系統等,也常被稱為是一種網絡附加的存儲技術。NAS技術通過網絡把文件系統和存儲系統連接在一起,控制器來運行和維護文件系統,判斷文件的流向。在使用的過程中,服務器與存儲設備互相分離,也就是說NAS是一個獨立于外的單獨個體。由于獨立性,當有一個設備或系統出現不能正常運行的狀況時,不會影響其他的系統的運行,不會因為以處的故障而影響整個存儲系統的正常工作,是一個比較適合應用于大范圍的技術,而且應用起來更加方便。

2.3 SAN技g

SAN是一種存儲的域網絡,是網絡存儲技術的核心,企業在業務系統方面的核心部分,可以借助于具有高性、高性能的數據訪問方式,這是SAN技術的好處所在。對于SAN技術而言,相關聯的存儲設備可以通過效率高的連接設備與多種服務器進行諒解,這種配置對于所有設備而言都可以進行連接,也就是在服務器和存儲器之間的連接提供了一個很好地紐帶。SAN技術可以滿足多客戶同時運行的需求,還可以在很大程度上保障應用性能的穩定性。隨著自身存儲容量的增大,SAN還可以允許用戶獨立增大自身的存儲容量,不僅可以很好的存儲數據,還可以實現對存儲資源進行集中的管理。SAN技術的應用具有很高的靈活性,存儲設備和數據的管理方式發生了一定的改變,在SAN網絡中,不再是某一個占據主導地位的設備可以連接,有效的提高了存儲數據資源的共享性。

2.4云存儲技術

云存儲是當今社會非常熱門的話題,我們身邊也有一些常見的應用,比如,我們自己日常的學習和工作中使用的百度云,就是一種云存儲的技術應用。云存儲,就是通過集群技術、網格技術等系統功能,把網絡中各種類型的存儲設備通過應用軟件集合起來,使之協同工作,一起對外提供數據存儲和業務訪問功能的一個系統。云存儲可以說不是一個單獨的存儲的技術手段,但是可以說是技術的結合體,也是一種技術的手法的表現,畢竟達到了存儲的效果,同時還可以很大程度上提高了存儲的效率,而且數據存儲技術的結合使用,滿足了不同類型數據存儲的需求。

3存儲技術的選擇使用細節

存儲的技術有很多種,那么作為一個獨立的單位在選擇存儲自己的內部數據信息的過程中,也不是盲目的選擇的,而是在作出選擇的時候,要有一定的選擇的理由,下面就是技術在實踐的使用中應該注意的幾點問題。

3.1科學合理的選擇和使用

多種計算機數據存儲的優勢已經明確,但是在選擇和具體的使用中,還是要非常注意一些問題的。在選擇使用之前,一定要認真分析自己企業內部數據存儲的要求,是否該項技術的應用可以滿足的,一定要結合實際情況,對自己的情況加以明確,確保做出的決策可以為企業內部數據的存儲帶來好處。

3.2使用者要了解該技術

技術的應用目的是提高數據存儲的效率和水平,那么前提一定是對技術有所了解,明確技術應用前的準備,以及在技術的應用過程中,需要注意什么問題。如果,使用者不了解技術,就盲目的引入應用,比較不好的情況就是技術的核心功能不能有效的發揮,不可以為企業提供方便。使用者要明確各種存儲技術的特點,確保在使用的過程中對該技術的操作得心應手,這樣才可以達到預想的技術引入的結果。

3.3使用過程中注重結合企業的實際情況

現代計算機數據存儲技術是一種固定的技術手段,有多重表現形式,如果應用到自身的數據存儲系統中,每一個企業的數據存儲的原有實際情況都是有一定差異的,所以,在使用的過程中,不要按照既定的思維模式和對該技術的認知來思考技術的使用,而是要順應技術的需求,調整對技術的理解和認識。確保技術的應用可以真正的實現企業內部數據的科學合理有效存儲。

4總結

在現代這個科學技術發達、計算機應用普遍、計算機數據量極大的社會環境中,計算機數據存儲的安全性、高效性、性等重要性能,越來越成為人們關注和討論的重點話題,當然技術的使用也成為了技術研究者研究的重點內容。現代計算機存儲技術的有效合理使用,很大程度上解決了上述部分問題。計算機存儲技術在逐漸的發展過程中匯總,已經衍生出了自己獨特的個性結構,保障的信息的存儲安全、獨立,提高信息存儲量,保障了數據存儲的目的實現。在以后的環境中,對計算機數據存儲技術的研究和開發仍然是一個重點的話題。

數據存儲技術論文:計算機數據存儲技術分析

摘 要:計算機技術現在已經得到了廣泛應用,但是因為運行環境特殊,需要面臨較大的安全風險,必須要對其進行綜合分析,采取有效措施來提高對數據存儲的安全性與性。就實際應用現狀來看,確定影響計算機數據存儲效果的因素,根據需求來確定最為合適的存儲技術,爭取從根本上來消除各類因素的影響,改善數據存儲效果。本文基于計算機數據存儲要求,對各類存儲技術進行了分析和對比。

關鍵詞:計算機;數據存儲;安全性

現在已經進入到信息化時代,產生和處理的數據更多,數據所具有的價值也越來越高。為充分發揮各類數據具有的應用優勢,必須要加強對安全存儲技術的分析,降低外界各項因素的影響,確保數據的完整性與性。積極結合各項新型技術,對信息存儲技術進行更新和完善,進一步促進行業的發展。

一、計算機數據存儲分析

1.大數據應用要求

在信息技術水平不斷提高背景下,數據產生與獲取的手段更為先進,面對大數據時代,想要充分發揮出各類數據具有的優勢,除了要對其應用技術進行分析外,還需要對其存儲技術進行研究,爭取為大數據處理提供保障。企業想要在市場內占據有利競爭位置,必須要有大量的數據作為支持,這樣就使得大數據技術與服務需求不斷升級,并且會在未來發展過程中,數據產生、處理以及存儲數據量會繼續增長。但是在數據快速增長背景下,很容易造成單機系統性能降低,即便持續對系統硬件進行更新,也難以與數據增長速度保持平衡,這樣就需要加強對數據存儲技術的研究,根據實際需求,來對現有存儲技術進行更新完善[1]。

2.文件管理需求

生產生活中均會產生大量的數據,雖然可以為下一階段活動提供依據,但是想要在大量數據內提取出有用信息,需要大量的時間作為支持,這樣為保障該階段內數據不會出現損壞、缺失等問題,就需要對其進行有效存儲。通過外圍設備將存儲在物理介質上的記錄與傳輸數據接收進來,經過專業處理后得到相應結果,然后對數據賦予意義,使其成為人們所需的信息。對比傳統紙質文件來對數據信息的存儲,現通過計算機語言編程以及處理軟件可以直接將各項數據制作成文檔,保存在計算機內,不僅可以降低管理工作難度,并且在查詢和利用上具有更大優勢。

3.企業發展需求

數據為促進企業進一步發展的重要依據,包括數字、文本以及圖表,根據實際需求對其進行匯總、分析和利用,為下一步工作規劃策略的制定提供數據支持。現在已經進入到信息化時代,企業所需要面臨的競爭更加激烈,需要面對的數據更多,除了自身數據外,還需要對市場內所有行業信息數據進行綜合分析,這樣如果依然應用傳統方式已經逐漸不能滿足應用需求。對數據存儲技術進行更新,經過對數據處理后,減少存儲容量,并降低成本,爭取更進一步滿足信息技術發展要求[2]。企業應對自身存儲系統進行更新,提高對數據保護的效率,提高數據存儲工作的性、靈活性以及實用性。

二、計算機數據存儲影響因素

1.物理安全

對影響計算機數據物理安全因素的分析,可以從主觀與客觀兩個角度進行,其中主觀因素為操作不當、管理不到位等,客觀因素則主要為自然災害和硬件損壞等。一方面,主觀因素。雖然現在數據存儲工作人員技能水平不斷提高,但是在實際操作中,很難保障沒有一點問題,尤其是計算機維護時,經常會因為失誤造成系統文件被刪除,或者是修改部分系統參數,造成系統運行錯誤,甚至會造成系統崩潰。同時,因為存儲系統復雜程度不斷提高,對維護人員的專業能力也有更高要求,要求其可以不斷更新自我知識結構,能夠靈活應對遇到的各類問題,降低數據破壞和丟失問題發生概率。另一方面,客觀因素。自然災害對數據存儲帶來的影響是不可控的,例如火災、地震等,如果在服務器運維階段遇到此種情況,將會直接對數據帶來毀滅性破壞,并且破壞是不可逆的,一旦丟失無法找回。因此必須要及時對稻萁行備份,爭取在災害發生后,將損失降到低。另外,現在市場上硬件數量與種類不斷增多,相互之間差異較大,如果所用硬件質量比較差,不僅無法滿足數據存儲要求,還容易產生故障造成數據損壞。

2.邏輯安全

及時,電磁波輻射。即計算機與通信部件產生的輻射,包括主機、顯示器、通信線路等,為降低此類因素影響,可以應用接收并解密電磁波的技術。第二,計算機聯網。互聯網運行環境特殊,受到黑客攻擊以及病毒感染的可能性比較大,如果不采取任何措施,會在根本上影響數據存儲安全性,出現數據損壞、丟失等問題。第三,計算機病毒。計算機病毒為一段可執行程序代碼,并且具有自我復制能力,可以感染計算機系統,并且不斷傳播和復制。同時病毒感染計算機系統后,能夠控制計算機完成一些隱蔽操作,嚴重威脅信息數據安全性。

三、計算機數據存儲技術要點

1.數據加密處理

數據加密是現在計算機數據存儲比較常見的保護技術之一,利用密碼技術來對信息進行加密處理,然后將加密后密文信息存儲在存儲介質內,對整個傳輸過程和存儲進行機密性保護。根據加密類型主要包括主機軟件加密、嵌入式專門加密、加密存儲安全交換機以及基礎存儲層存儲設備等,可以根據實際需求來選擇應用。

2.訪問控制技術

主要包括操作系統自身訪問控制、邊界訪問控制以及應用系統訪問控制三個方面。現在操作系統多為C1、C2級,安全操作系統可以達到B1級,且安全操作系統可以提高操作系統強制訪問控制能力、密碼存取能力、安全審計能力等,對文件、目錄以及文件進行有效保護[3]。而邊界訪問控制則是利用防火墻系統以及支持VLAN網絡設備,對數據存儲進行保護。另外,應用系統訪問控制的實現,一般需要通過應用系統的開發,或者是調用地層操作系統訪問控制功能來進行保護。

3.GFS技術

即Google File System文件系統,其為分布式且可擴展,可用于大型分布式以及大量數據的訪問,可提供硬件容錯性能。每個GFS均由一個master與大量chunkserver構成,可以支持多用戶訪問,且在資源不限情況下,chunkserver可與訪問同時進行[4]。GFS文件分成小塊,小塊標識為chunk-handle,創建chunk-handle需要由master進行分配,且每小塊可被幅值成多個chunkserver,由用戶決定保護的副本。

結束語:

為提高計算機數據存儲綜合效果,需要對各項影響因素進行分析,并根據實際需求來確定存儲和安全保護技術,爭取提高數據存儲質量,為實際應用提供保障,滿足生產生活需求。

數據存儲技術論文:云計算的數據存儲技術

摘 要

隨著計算機信息技術的發展,一種新型的計算模式――云計算逐漸興起,云計算具有超強的計算能力、性、虛擬性、通用性、按需付費等特點,因此云計算近年來發展迅速,已經成為未來計算機發展的方向。本文主要闡述了云計算和云儲存的概念,并分析了云計算環境下云計算數據存儲Google File System和Hadoop Distributed File System兩種存儲數據。

【關鍵詞】云計算 云儲存 數據存儲技術

21世紀是信息知識爆炸的年代,每天產生海量的信息,企業需要處理和存儲的數據信息越來越多。如果按照傳統計算機算法,企業為了存儲信息需要購置大量的硬件設施和軟件設施,并需要專人對數據信息進行管理,對設備進行維護,需要耗費大量的人力和物力成本。而云計算這種計算方式,省去了企業管理和維修的麻煩,企業可以將大量的數據信息放在服務器或者云端,企業只需要支付少量的管理費用,就能隨時調取云端的數據信息,并享受圖片處理、歸檔服務、音視頻轉碼等多種數據增值服務。

1 云計算與云存儲的概念

1.1 云計算

根據美國國家標準與技術研究院的定義:云計算是一種按使用量付費的模式,這種模式提供便捷的、可用的、按需的網絡訪問,用戶只需要進入到可配置的計算資源共享池,包括服務器、存儲、網絡、應用軟件和服務器等,云端管理人員只要通過少量的管理或者與服務商進行少量的交互,就能實現對云端的管理。云其實是互聯網的一種比喻說法,通過云計算可以將數據信息存儲在計算機中,這里的計算機指的是遠程服務器。然后企業根據自己的需求,對計算機存儲系統進行訪問,并將信息資源直接切換到實際應用方面。計算機直接將主機功能交給了云端,云端的計算能力就跟水電一樣,成為了一種商品,這就促使傳統計算機方式向現代計算機方式轉變。

1.2 云儲存

云儲存是在云計算的基礎上提出的,它與云計算有很多相同的地方。云計算主要是通過網絡技術、集群應用和分布式文件系統,利用應用軟件將網絡中大量不同類型的存儲設備連接起來,共同合作,對外提供業務訪問和數據存儲功能。云存儲與傳統的存儲模式相比,它是一種特殊的構架服務,它必須建立在互聯網基礎上,為用戶提供在線的存儲服務。用戶不需要考慮存儲器中的容量、數據存儲位置、安全等問題,只需要按時付費就可以了。

2 云計算的數據存儲技術

云計算存儲技術具有比較明顯的兩個特點:及時是高傳輸率,第二是高吞吐率。當前,云計算存儲技術比較主要有谷歌開發的非開源的GFS和Hadoop團隊開發的HDFS技術。不過后者在IT廠商應用的比較廣泛。

2.1 Google File System

Google File System簡稱GFS,這種存儲技術不僅開源擴展,而且是分布式的,廣泛應用在分布式的數據訪問。它的硬件價格比較低,但是卻提供了容錯的功能。每一個GFS都是由一個master和多個chunkserver構成,能夠提供多用戶的訪問權限,只要用戶的訪問資源不受限制。chunkserver可以和訪問同時進行。GFS系統文件被分成很多個小塊,每一個小塊的標識是chunk―handle,chunk―handle由master分配。為了保障數據的安全性和性,GFS系統文件會被復制在多個chunk―handle上,文件的副本由用戶決定,master會對系統文件進行維護。比如系統訪問控制、空間名字。此外它還可以控制系統的活動范圍,chunkserver間的遷移和單個模塊的垃圾收集等。master還會定期指令給chunkserver,讓chunkserver收集它的發展狀態。目前谷歌公司開發的GFS客戶代碼基本已經實現了系統文件的AP,所以用戶與master的數據交換,之限制元數據操作,存儲數據直接和chunkserver聯系,chunkserver和文件數據客戶不會緩存。

2.2 Hadoop Distributed File System(HDFS)

Hadoop分布式文件系統是HDFS由多個存儲數據的終點和管理節點構成的。它的中心服務器是namenode,客戶端和文件管理系統namenode對文件進行訪問。每一個namenode節點都有一臺普通的計算機對應,運行時與單機計算機文件系統類似,可以在文件系統常見名錄、更改文件名。其實系統的底層已經把文件分割成了Block,并⒄廡Block進行不同的存儲,從而達到容錯的目的。namenode是HDFS文件系統的核心內容,它可以維護一些數據結果,再把記錄文件分割成Block,并在namenode獲得相關的消息。

3 結語

云計算是一種新型的計算模式,它必須依靠大數據或者在大數據的基礎上,為計算機用戶提供服務和幫助。為了確保計算機數據的性和安全性,云計算對云端數據采取了分層存儲的方式,為用戶提供多層次的安全防護。但是如今云計算的安全問題依然是用戶關心的重點。云存儲已經是未來存儲的一種趨勢。當前各大云存儲運營商正在積極開發應用技術、搜索和云存儲相結合的技術,為用戶提供更加便利的服務,但是云存儲的發展還須加強云存儲的安全防護功能和技術研究。

作者單位

河南省師范大學附屬中學 河南省新鄉市 453002

數據存儲技術論文:大數據存儲技術及其標準化分析探討

摘 要:隨著現代化技術的不斷發展,在數據存儲上也發生了極大變化,各行各業均開始運用大數據存儲來保障系統運行有效性。本文基于這一背景,簡單闡述了大數據以及存儲技術的概念,分析了大數據存儲的幾項技術,并在此基礎上針對其標準化展開研究,旨在優化大數據存儲方式,提升數據使用有效性。

關鍵詞:大數據;存儲技術;標準化

大數據指的是一種存儲、積累以及挖掘的大文件達到400GB甚至TB存儲程度的現象,在現如今信息化、網絡化發展時代下,大數據已經并不罕見,且廣泛應用于各行各業。傳統數據存儲及管理中,面對海量的數據存儲,其無論是存儲能力還是存儲效率,甚至是存儲安全性方面,均呈現出滯后狀態。目前在存儲技術上通常分為網絡存儲以及直接附加存儲兩種,其中網絡存儲又分為存儲域網絡以及網絡附屬存儲兩種。不同存儲技術適用范圍不同,本文針對其存儲方式以及標準化展開分析,現報告如下:

1 大數據存儲技術研究

1.1 非結構化數據的處理

在這一方面,要數HDFS具代表性。HDFS主要服務于系統中的各項應用程序,其將一些POSIX接口開放,通過主/從結構讓流式訪問文件的數據被允許操作。它是由不同的數據節點以及一個名字節點所組成,能夠讓數據按照一定模式分割為不同的64位數模塊,并將其安排到不同分布式集群(由不同數據節點組成)中進行存儲。當然,若在使用過程中大數據存儲量不斷增多,只需要增加數據節點即可輕松實現存儲功能,擴展性能較強。另外,非結構化數據處理在數據吞吐量方面性能較好,海量的數據處理不會明顯影響到用戶體驗。

1.2 分布式并行數據庫

分布式并行數據庫主要用于處理海量的、結構化的數據,是一種無共享、并行處理架構的數據管理系統。這類型系統主要采用Slave或是Master架構。Slave在運用上較多,例如用戶數據的存儲方面,多是被通過散列方式存儲在不同的Slave服務器之中,且數據在Slave的不同節點上也具有副本,在系統適用性上較高。Master架構則只用于對元數據的存儲。

1.3 半結構化數據的處理

傳統數據處理由于沒有使用NoSQL數據庫,當遇到大數據存儲時往往表現出低性能、低擴展性以及低靈活性缺陷。使用了NoSQL數據庫之后,云計算得以適應,目前其數據庫類型主要有以下幾種:列存儲數據庫、鍵值存儲數據庫、圖形數據庫以及文檔型數據庫。

2 大數據存數的標準化分析

2.1 云存儲服務

目前在大數據存儲上,普通用戶使用的云存儲服務大多為基于對象類型,表現為以下幾種模式:⑴綁定。綁定對象為特定的編程語言,表現為API開發包,這類型的綁定處理利用了在REST接口上的一層封裝,讓編程語言在運行效率上能夠大大提升。⑵接口設置。接口設置方面,主要采用HTTP接口或是REST接口兩種,要想實現云存儲服務,就必須通過編程實現其交互功能,達到數據存儲的有效性。⑶非編程狀態下的存儲。這一種形式是由第三方軟件或是云存儲本身所在的運營商通過其門戶管理來完成的。對于使用者而言,它不需要再次編程,直接利用管理軟件調用REST接口或是圖形界面即可使用數據存儲功能。在這一形式中,使用者在后臺控制上會受到第三方軟件或者Portal的限制。

2.2 數據模型的設定及應用接口研究

在數據存儲管理方面,應注意對隊列對象、能力對象、域對象、數據對象以及容器對象這5個對象的管理,并實現對存儲數據的訪問功能。在這5個對象中,前三個屬于特殊容器對象的一種。在Key-Valuc幫助下,每個對象均能夠實現元數據描述功能。這里的元數據指的是使用者自定義數據、存儲管理數據以及安全元數據等。

應用接口方面,大數據存儲技術的應用系統可分為4種,即對象存儲系統、分布式文件系統、分布式關系型數據庫系統以及NoSQL數據庫系統,不同系統在應用接口類型、應用環境以及特性方面對比如下:⑴對象存儲系統。可適用REST或是HTTP接口,用于處理基于對象的設備操作以及數據存儲,可有效定義對象的屬性,為用戶提供基于數據對象的功能操作。⑵分布式文件系統。其應用接口可使用HTTP、CIFS或是NFS,主要應用于非結構化數據的管理以及存儲,能夠將元數據有效定義,同時為用戶提供應用及功能并管理相關數據。⑶分布式關系型數據庫系統。可適用SQL、JDBC、ODBC應用接口,應用于結構化數據的管理與存儲,能夠對關系型數據模型有效定義,訪問時基于數據組織結構狀態。⑷NoSQL數據庫系統。適用于API、REST或是HTTP接口,用于對半結構化數據進行管理與存儲,其不支持SQL,數據模型處理原則采用schema-free原則。

3 結束語

大數據存儲并非一項單純技術,而是多種不同存儲技術的綜合。在具體操作方面,其應用接口類型多樣化,目前應用最為成熟的算是分布式文件系統。NoSQL數據庫系統以及對象存儲系統在應用上尚未達到成熟階段,相信在今后的研究中會不斷完善,讓大數據存儲不斷趨近標準化,提升其使用可行性。

數據存儲技術論文:淺談網絡數據存儲技術及其應用

摘 要:現在網絡已經在人們的生活中得到普及,選擇良好的數據存儲方式已經越來越重要。目前存儲已經從主機系統中脫離出來發展成為了一個獨立的系統。網絡數據存儲技術的發展目標就是低成本、高智能。本文就將對現在出現的網絡存儲技術進行深入分析,分別研究傳統的網絡數據存儲技術和現代化網絡數據存儲技術的運用。

關鍵詞:網絡數據;存儲技術;運用分析

伴隨網絡快速的發展,對于用戶選擇一種能夠滿足需求的高性能網絡數據存儲方式變得尤其重要。怎樣做到保障數據的安全性、一致性、性。怎樣能夠集中的對網上數據進行訪問,做到集中管理不同的數據,又怎樣實現保護和訪問不同主機類型的數據等一系列問題,都是需要通過網絡數據存儲技術完成的。現在數據存儲中經常會出現數據災難,小到錯誤的操作和普通文件的損壞,大到由于病毒入侵或是黑客攻擊導致整個網絡出現癱瘓。所以現在的各個企業單位必須有完善的數據存儲和數據恢復計劃方案。現在人們普遍使用的就是采用網絡技術將數據信息進行異地儲存,也就是數據信息不直接儲存到本地的服務器上,而是采用相關網絡存儲技術將信息儲存在和服務器相連的專業設備上。現在主要使用的網絡信息存儲技術有:DAS、SAN、NAS,以下將對這三種技術進行分析。

1 傳統的網絡數據存儲技術分析

DAS存儲技術是指利用光纖通道或是SCSI接口將儲存設備直接連接到計算機上。當服務器所在的位置較為分散,無法使用遠程連接實現互聯時,就可以直接連接。直接連接需要投入的成本較少,而且需要的時間也很短,一般在集群環境中對存儲容量進行拓展。DAS已經有很長的發展歷史了,也是現在較為普遍的網絡儲存設備。但是伴隨用戶數據在不斷增長,也就在擴展、存儲等方面暴露出很多的問題。問題的出現主要有以下幾點原因:

1.1 DAS儲存方式。DAS在進行存儲維護管理和系統的I/O讀寫對服務器主機操作系統有很強的依賴性,數據設備和恢復需要占用CPU、I/O等服務器主機資源,數據流必須要流回到主機之后再到服務器連接著的磁帶機。一般而言數據存儲需要占用20%-30%的主機資源,這也就導致企業的數據日常存儲工作一般需要在業務系統不繁忙的情況下進行,防止由于占用到服務器主機資源影響企業業務系統的正常運行。當DAS儲存的數據量很大時,就需要花費很長的時間,而且對服務器硬件會有一定的影響。

(1)DAS的SCSI連接。采用SCSI連接DAS與服務器主機之間的連接通道。服務器的CPU不斷的加強,存儲硬盤空間就會變大,排列出來的硬盤數量也就越來越多,SCSI通道將會成為I/O瓶頸,由于服務器主機的SCSI的ID是有限的,所以SCSI連接通道也是有限的。(2)DAS的限制。將一臺服務器拓展成為由多臺服務器組成的集群或是拓展儲存陣列的容量,都有可能導致企業業務系統出現停機,給企業帶來不同程度的經濟損失,而且無論是DAS的存儲還是主機服務器的拓展都是需要原廠商提供,受到了一定的限制。

1.2 NAS儲存技術。NAS是一種數據存儲附加技術,在計算機網絡系統中有著重要地位,能夠將計算機網絡系統和計算機磁盤序列直接連接起來,由計算機操作系統和計算機服務器構成NAS技術的服務器,在實際運用中能夠發揮很強的拓展性,而且NAS也是帶有操作系統的存儲設備,就相當于一個專用的文件服務器,對文件系統能進行針對性的優化,具有安全、等優點,在電子出版、法律、教育等方面有廣泛的使用。

(1)NAS的關鍵特性。一是將一般服務器中沒有發揮作用的計算功能給去掉,只提供存儲服務需要使用的文件系統功能,減少了成本。對系統軟硬件的結構進行優化,使得存儲和網絡之間以最有效的方式發送數據,網絡操作系統內核具有多線程、多任務的特點,數據傳輸速率高、非常適合處理網絡的I/O請求。二是NAS主要以網絡為中心,直接運用現有的網絡資源接入到專用的存儲設備,而不需要再連接儲存設備

(2)NAS的技術性能。現在NAS得到非常普遍的需求主要因為它有以下優點:一是能夠共享和訪問大量的文件數據,很好的滿足企業的需求。二是企業在不斷的發展,大型的磁帶庫或是硬盤等產品雖然能夠解決儲存問題,但是由于成本過高,對于一些中小型企業可能很難接受,所以NAS能夠改善這個問題。三是文件數據能夠通過網絡傳輸到多臺客戶機上,方便部署。

(3)NAS的存在的缺陷。NAS本身有很大的網絡協議的開銷,因此在數據訪問上一些對訪問速度要求很高的場合是不適合使用NAS的,比如數據庫的一些運用等。NAS技術在使用時會對LAN相關帶寬有所占用,從而會有一部分的網絡資源被浪費掉,可能會造成用戶的正常使用。NAS還有一個限制因素就是很難統一集中管理多個相關設備,只能夠對單個儲存設備進行單一管理,目前還無法跨越不同的設備。

1.3 SAN。SAN采用光纖通道技術,在網絡服務群后端,使用交換機連接服務器主機和儲存陣列,形成專門用于區域網絡的存儲。

(1)SAN存儲性能。一是SAN和一般的網絡不同,是為了連接服務器、磁帶庫、磁盤陣列專門設計的網絡,并且具有很高的性能。二是由于具有很好的存儲連接,服務器能夠訪問磁盤陣列、磁帶等任何的儲存設備,而且儲存設備和SAN交換機以及儲存設備和儲存設備之都能進行信息間傳遞。三是非常適合一些數據恢復和服務器集群等需要傳輸大量數據的應用。(2)SAN的技術性能。現代企業對數據存儲的要求越來越高,所以有些企業采用SAN技術作為網絡基礎設施。SAN有以下優點:一是能過實現大容量存儲設備的數據共享。二是加強了數據存儲的性、開放性。三是利用光纖數據傳輸效率很快,還具有超強的拓展性。(3)SAN的缺陷。SAN技術在維護和構建時,需要具有很強專業能力、業務知識、豐富經驗的工作人員,這也就增加一筆人力費用。并且SAN在連接距離上受到了一定的限制。而且由于連接設備在價格上比較高昂,這也就阻礙了SAN技術的發展。

2 現代化新型網絡存儲技術

2.1 OBS。OBS是基于對象存儲的,它的數據塊長度是可以變化的,存儲屬性的基本容器也是具有可拓展性的存儲容器能夠提供和文件相似的訪問方式,比如能夠打開、進行讀寫等操作。NAS和SAN的一些優點在OBS上得到了綜合體現,由于是采用的對象接口,所以在很大程度上提升了網絡數據存儲技術的性能,具備了非常高的擴展性。OBS有一大顯著特點,就是能夠將網絡數據存儲的相關物理視圖下放到一些存儲設備當中,OBS的技術理念是人們關注的重點內容,它的高性能和極強的擴展性使其得到了人們的認可,也在網絡數據存儲技術領域占得重要地位。

2.2 云存儲。云儲存和云計算非常的相似,它的發展基礎就是云計算,主要是通過相關軟件將網絡各種存儲數據集合在一起,共同進行工作。使用網絡技術或是集群運用等功能,對外進行業務訪問或是對相關數據進行存儲。

3 結束語

現在NAS、DAS、SAN之間存在的差異正逐漸被模糊。目前所有的網絡存儲技術在社會經濟的不斷發展和用戶的各種需求下逐步的趨于完善。NAS、SAN都是在人們對網絡數據存儲的各種訴求中在之前DAS的基礎上發展起來的。在新時期又出現了OBS和云存儲,目前無論是傳統的網絡數據存儲技術還是現代化的網絡存儲技術,都還存在一些或多或少的問題,需要不斷的進行研究和完善。通過加強網絡數據存儲的安全性、拓展性、性,來促進網絡數據存儲技術的運用。

數據存儲技術論文:芻議海量數據存儲系統的高性關鍵技術研究與應用

【摘要】近些年,隨著存儲技術的日益發展,如何對海量的數據進行高效的處理和存儲,已經成為計算機信息技術中急需解決的問題,TB或PB級容量存儲系統的出現已經成為現實。本文介紹了海量數據的基本特征,分析了海量數據存儲的基本原則,提出幾種適用于海量數據的存儲方式來提升存儲的高性。

【關鍵詞】海量數據 存儲系統 性 技術

隨著信息技術的不斷發展,數據已經成為了越來越多人日常生活中的重要資源。據統計,全球信息化進程大步推進,2010年創建、存儲和復制的數據總數已達到1.2ZB,2011年又達到了一個新里程碑1.8ZB,根據這種增長速度,預計到2015年將達到近8ZB。與此同時,也有許多海量數據存儲單位,如國家地震局、國家氣象局、國家圖書館、中央電視臺等,每年可高達數幾十PB的數據存儲量。對于這樣的單位和企業,解決他們數據高效的存儲問題已經成為當下的主要問題之一。所以在數據爆炸式增長的大背景下,無論是個體還是單位和企業,數據的存儲量持續增加必然導致存儲設備的不堪重負。為了滿足人們日益擴大的數據存儲需求,對數據存儲的性、安全性提出了更高的要求,傳統技術和傳統手段已經無法應付目前的形式,如何實現高質量、性高的數據存儲已經成為整個行業面臨的巨大挑戰。

一、海量數據存儲的一般基本原則

海量數據是指數據量大、數據記錄多,具有非常復雜的不同類型。如何處理這樣一種特殊的信息,使其充分發揮作用,是我們關注的問題。出于全局考慮,存儲海量數據應遵循以下基本原則。首先,海量數據存儲應“分層存儲”,引入數據的綜合分析概念,區別數據的本質從而采取不同的存儲策略。讀取頻次較高的數據應當存儲在大容量磁盤陣列,低速磁盤陣列則應當儲存訪問頻次較低的數據,訪問頻次極低的數據則應當儲存在磁帶介質上。其次,配備足夠容量的高性能陣列,并輔之以相關的軟件將數據自動分層存儲管理。再次,考慮需要存儲的數據的復雜類型,應設計相對完整的解決方案,以確保數據儲存的性。

二、存儲系統及其性實現

(一)磁盤陣列存儲。

RAID(Redundant Array of Independent Disks) 是冗余的獨立磁盤陣列的英文縮寫。1988年提出由美國加州大學伯克利分校的David Patterson等人提出了這一概念。冗余是為了糾正錯誤,并采取有效方法提高性,獨立是指陣列不存在于主機內,而是自成一體的系統。一般可以分為多個不同的RAID級別,最常用的是RAID0到RAID6。

(1)RAID0:沒有任何冗余磁盤陣列。RAID0無法提供一個良好的冗余或奇偶校驗,但它能夠提供非常高的傳輸速率和I/O速率。

(2)RAID1:提供了非常高的性和安全性,適合存放重要數據。

(3)RAID2:并行處理陣列,提供鏡像和分段的數據存儲。

(4)RAID3:RAID2的基礎上,增加一個奇偶校驗驅動器,為每個I/O操作提供服務。

(5)RAID4:使用塊級拆分,一個單獨的磁盤為其他N-1個磁盤保留奇偶校驗塊。此等級很少使用。

(6)RAID5:RAID4的基礎上,將數據和奇偶校驗分布在所有N+1個磁盤中,是適合大型數據系統的等級。

(7)RAID6:RAID5的基礎上進行改進,提供一個安全網,防止多個磁盤發生故障的情況。

RAID技術為用戶提供了可以同時兼顧速度和良好數據安全的解決方案,磁盤陣列可避免單個磁盤故障帶來災難性的后果,從而保障了高性的數據存儲。但不同的RAID級別在完整性和性方面還有不同程度的缺陷。

(二)網格存儲。

和網格計算類似,是部署和管理分布在多個系統和網絡存儲的新模式,網格實際上是一個網狀網絡,它不控制單個集中式交換機或集線器的路由。網格提供了無限的可擴展性的大小和性能,因為它們不會受到集中的中央交換機的舒服。因此,降低了網格網絡部件的成本,以產生和靈活的結構。

(三)P2P 存儲。

P2P帶來的變化是改變“內容”所在位置,從“中心”走向“邊緣”,該內容將不再是存儲在在幾個主要的服務器上的,而是存儲在所有的用戶PC上。這為網絡存儲提供了可能,我們將提高網絡的剩余存儲空間的利用率。對存儲容量的需求是無止境的,提高存儲容量,在某種程度上也是保障了數據的高性。

(四)存儲容災。

存儲容災是指建立一個異地的數據系統,可以理解為是一個本地副本,可用于存儲關鍵數據。當本地數據及整個應用系統崩潰時,系統保存的異地數據系統可以提供至少一個可用的關鍵業務數據。該數據可以實時地與本地生產完整數據復制,也可以稍微落后于本地數據,但它是可用的。采用的主要技術是數據備份和數據復制技術。通過特定的容災機制,可以將崩潰發生后的傷害降到低,較大限度保護海量數據系統的正常應用以及不間斷服務。

三、總結

隨著互聯網技術的快速發展及普及,全球化數字時代已經到來,數據呈現出了飛速增長的趨勢,這樣就給數據的存儲工作帶來了大量的工作難度。在數據爆炸式增長的大背景下,無論是個體還是單位和企業,數據的存儲量持續增加必然導致存儲設備的不堪重負。為了滿足人們日益擴大的數據存儲需求,對數據存儲的性、安全性提出了更高的要求。通過以上四種信息存儲方式,可以有效提高海量數據的存儲,實現數據的安全性。

數據存儲技術論文:大數據時代數據存儲技術的發展

【摘要】數據存儲技術經歷了從手工管理到文件管理、再到數據庫管理系統三個階段,數據庫技術中關系數據庫占據了主要地位。互聯網絡的興起,促使用戶數據暴增,大數據時代已經來臨,對存儲介質容量和數據檢索速度都提出了更高的要求,傳統的關系數據庫難以勝任這一角色,NOSQL數據庫逐漸興起。本文在介紹大數據概念的基礎上,分析關系數據庫的優劣勢,并介紹NOSQL數據庫的理論基礎和當前NOSQL數據庫產品。

【關鍵詞】大數據;關系數據庫;NOSQL

一、大數據

1.大數據產生的背景

大數據(Big Data),也稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的資訊,通常被認為是PB或EB或更高數量級的數據。

互聯網絡從上世紀90年代開始,發展迅速,加快了信息傳播和共享的速度,尤其是一些社交網站的興起,數據量更是以前所未有的速度暴增,文字資料、聲音、視頻、圖像等多媒體數據鋪天蓋地。據資料顯示,上世紀90年代,互聯網資源不是很豐富的時代,網民月平均流量1MB左右,之后則快速增長,2000年后,逐漸發展為每月10MB、100MB、1GB,據估計2014年可能會達到10GB。淘寶網每日幾千萬筆交易,單日數據量達幾十TB,數據存儲量幾十PB,百度公司目前數據總量接近1000PB,存儲網頁數量接近1萬億頁,每天大約要處理60億次搜索請求,幾十PB數據。

隨著技術發展,大數據廣泛存在,如企業數據、統計數據、科學數據、醫療數據、互聯網數據、移動數據、物聯網數據等等。總之,大數據存在于各行各業,一個大數據的時代已經到來。

2.大數據時代的挑戰

大數據特點是容量在增長、種類在增長、速度也在增長,面臨如此龐大的數據量,數據的存儲和檢索面臨著巨大挑戰。比如2007年時,Facebook使用數據倉庫存儲15個TB的數據,但到了2010年,每天壓縮過的數據比過去總和還多,那時商業并行數據庫很少有超過100個節點以上的,而現在雅虎的Hadoop集群超過4000個節點,Facebook倉庫節點超過2700個。大量的數據現在已經開始影響我們整個的工作、生活、甚至經濟,如何存儲和高效利用這些數據是需要我們解決的。

二、關系數據庫

1.關系數據庫概述

關系型數據庫是支持關系模型的數據庫系統,他是目前各類數據庫中最重要,也是使用最廣泛的數據庫系統。關系型數據庫從上世紀70年代誕生到現在經過幾十年的發展,已經非常成熟,目前市場上主流的數據庫都為關系型數據庫,比較知名的有Oracle數據庫、DB2、Sybase、SQL Server等等。

2.關系數據庫優勢

關系數據庫相比其他模型的數據庫而言,有著以下優點:

模型容易理解:關系模型中的二維表結構非常貼近邏輯世界,相對于網狀、層次等其他模型來說更容易理解。

使用方便:通用的SQL語言使得操作關系型數據庫非常方便,只需使用SQL語言在邏輯層面操作數據庫,而不必理解其底層實現。

易于維護:豐富的完整性大大降低了數據冗余和數據不一致的概率。

3.關系數據庫存在問題

傳統的關系數據庫具有不錯的性能,穩定性高,歷經多年發展已日臻成熟,而且使用簡單,功能強大,也積累了大量的成功案例。上世紀90年代的互聯網領域,網站基本都是靜態網頁,主要以文字為主,訪問量也不大,當時用單個數據庫可以應對。可近幾年,動態網站隨處可見,各種論壇、博克、微博異常火爆,在大幅度提升交流方式的同時,用戶數據量迅速增長,處理事務性的數據關系數據庫得心應手,可面對互聯網的高并發、大數據量關系數據庫顯得力不從心,暴露了很多難以克服的問題:

數據庫高并發讀寫:高并發的動態網站數據庫并發負載非常高,往往要達到每秒上萬次甚至百萬次、千萬次的讀寫請求。關系數據庫應付上萬次SQL查詢沒問題,但是應付上百萬、千萬次SQL數據請求,硬盤IO就已經無法承受了。

海量數據的高效率訪問:一般大型數據庫在百萬級的數據庫表中檢索數據可達到秒級,但面對數億條記錄的數據庫表,檢索速度效率是極其低下,難以忍受的。

數據庫可擴展性和高可用性:基于web的架構當中,數據庫無法通過添加更多的硬件和服務節點來擴展性能和負載能力,對于很多需要提供24小時不間斷服務的網站來說,數據庫系統升級和擴展卻只能通過停機來實現,這無疑是一個艱難的決定。

三、NOSQL數據庫

1.NOSQL數據庫理論基礎

NOSQL作為新興數據庫系統概念,由于其具備處理海量數據的能力,近年來受到各大IT公司的追捧。Amazon、Google等大型網商已紛紛斥資進行研究并開發了適用的產品。談及NOSQL數據庫,首先應該了解支持NOSQL的理論:CAP理論、BASE思想和最終一致性。

(1)CAP理論

CAP理論由Eric Brewer在ACM PODC會議上的主題報告中提出,這個理論是NOSQL數據管理系統構建的基礎,CAP解釋為一致性(Consistency)、可用性(Availability)以及分區容忍性(Partition Tolerance)。具體描述如下:

強一致性(Consistency):系統在執行過某項操作后仍然處于一致的狀態。在分布式數據庫系統中,數據變更后所有的用戶都應該讀取到近期的值,這樣的系統被認為具有強一致性。

可用性(Availability):每一個操作都能夠在一定的時間內返回結果。“一定時間內”是指系統的結果必須在給定時間內返回,如果超時則被認為不可用,“返回結果”同樣非常重要,必須能提供成功或失敗的信息。

分區容錯性(Partition Tolerance):分區容錯性可以理解為系統在存在網絡分區的情況下仍然可以接受請求。

CAP是在分布式環境中設計和部署系統時所要考慮的三個重要的系統需求。根據CAP理論,數據共享系統只能滿足這三個特性中的兩個,不能同時滿足三個條件。因此系統設計者必須在這三個特性之間做出權衡。例如Amazon的Dynamo具有高可用性和分區容錯性但不支持強一致性,也就是說用戶不能立即看到其他用戶更新的內容。

(2)BASE思想

BASE(Basically Availble),基本可用,強調數據庫的最終一致(Eventually consistent最終一致,最終數據一致就可以,而不是時時高一致),不同于傳統關系數據庫基于的ACID模型。

ACID特性與高性能是不兼容的。比如,在網店買東西,每個客戶買東西時都會通過鎖來同步數據操作,操作完成每個客戶都可以看到一致的數據。也就是說,不允許多個客戶同時買的情況。很明顯對于大多數網上商城,尤其是大型網商來說,這個方法并不適用。

BASE思想實際上是CAP理論中AP的衍伸。通過犧牲高一致性,保障高可用性和分區容忍性。BASE思想的組成有以下3個部分:基本可用、軟狀態、最終一致性。BASE模式指的是一個應用在任意時間首先應該能完成最基本化的工作(即基本可用),并不需要總是一致(即軟狀態),但最終應該是一致(即最終一致性)的。

(3)最終一致性

數據一致性可分別從使用者和提供者角度看:從使用者的角度,如何觀察數據更新;從提供者的角度,也就是服務器端,更新如何在系統中實現。

一致性可分為強一致性和弱一致性兩種:強一致性要求更新過的數據能被后續的訪問都看到,根據CAP理論,強一致性無法和可用性、分區容忍性同時實現;弱一致性,指讀取操作能夠見到變化的數據,但不是所有變化的數據。

最終一致性屬于弱一致性的一種,即存儲系統保障如果沒有新的更新提交,最終所有的訪問都將獲得的更新。如果沒有故障發生,不一致性取決于通信時延、系統負載以及復制策略中涉及的副本數。

2.NOSQL數據庫產品

NOSQL(Not Only SQL)數據庫是指那些非關系型的數據庫。NOSQL數據庫分為Key-Value、Key-Document和Key-Column這3類。典型的NOSQL產品有Google的BigTable、基于Hadoop HDFS的HBase、Amazon的Dynamo、CouchDB、MongoDB、Redis等。

NOSQL數據庫遵循CAP理論和BASE原則,大部分Key-Value數據庫系統都會根據自己的設計目的進行相應的選擇,如Cassandra、Dynamo滿足AP,BigTable、MongoDB滿足CP。

四、結束語

本文首先介紹了大數據概念,分析了關系數據庫在存儲大數據量方面的不足,并介紹了當前NOSQL數據庫的基本理論和當前產品分類。大數據時代的來臨,我們忙于如何存儲和處理這些數據,但隨著計算機互聯網、移動互聯網、物聯網等網絡的快速發展,數據量會持續大幅增長,如何長期保存這些數據以及如何處理更大級別的數據量,都需要我們思考并解決。