基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合研究》引入關(guān)聯(lián)數(shù)據(jù)的理念與技術(shù)方法,在對(duì)非物質(zhì)文化遺產(chǎn)、資源聚合相關(guān)理論進(jìn)行系統(tǒng)梳理的基礎(chǔ)上,基于元數(shù)據(jù)與本體對(duì)非物質(zhì)文化遺產(chǎn)資源進(jìn)行了語(yǔ)義化標(biāo)注,并開(kāi)展了非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)構(gòu)建與的關(guān)鍵技術(shù)研究,建立了基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合與服務(wù)平臺(tái),同時(shí)選取具有地方代表性的非物質(zhì)文化遺產(chǎn)項(xiàng)目"楚劇"進(jìn)行實(shí)證研究。由此證明引入關(guān)聯(lián)數(shù)據(jù)的理論與技術(shù)方法,是實(shí)現(xiàn)非物質(zhì)文化遺產(chǎn)資源的規(guī)范化描述、語(yǔ)義化揭示、多維度關(guān)聯(lián)的有效途徑,對(duì)提高非物質(zhì)文化遺產(chǎn)資源聚合與保護(hù)、優(yōu)化知識(shí)服務(wù)質(zhì)量有著重要的作用。
基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合研究》內(nèi)容豐富,應(yīng)用性強(qiáng),可供數(shù)字圖書(shū)館、信息組織、信息資源管理等領(lǐng)域從事相關(guān)研究的專家學(xué)者及院校相關(guān)專業(yè)師生參考使用。
前
第1章 緒論1
1.1 研究背景及研究意義1
1.2 國(guó)內(nèi)外研究現(xiàn)狀3
1.2.1 關(guān)聯(lián)數(shù)據(jù)研究現(xiàn)狀4
1.2.2 非物質(zhì)文化遺產(chǎn)資源聚合研究現(xiàn)狀7
1.2.3 研究述評(píng)13
1.3 研究?jī)?nèi)容與技術(shù)路線14
1.4 研究的創(chuàng)新之處17
1.5 組織結(jié)構(gòu)18
第2章 相關(guān)理論基礎(chǔ)20
2.1 語(yǔ)義網(wǎng)及語(yǔ)義標(biāo)注相關(guān)理論20
2.1.1 語(yǔ)義網(wǎng)的發(fā)展20
2.1.2 語(yǔ)義標(biāo)注概述21
2.1.3 語(yǔ)義網(wǎng)環(huán)境下元數(shù)據(jù)、本體及語(yǔ)義標(biāo)注間的關(guān)系23
2.2 關(guān)聯(lián)數(shù)據(jù)有關(guān)理論24
2.2.1 概念解析25
2.2.2 類型劃分26
2.2.3 支撐技術(shù)26
2.2.4 關(guān)鍵實(shí)現(xiàn)技術(shù)30
2.3 非物質(zhì)文化遺產(chǎn)資源聚合概述37
2.3.1 有關(guān)概念的內(nèi)涵與外延37
2.3.2 相關(guān)理論38
2.3.3 維度分析40
2.3.4 聚合方式的演進(jìn)41
第3章 非物質(zhì)文化遺產(chǎn)資源描述及其語(yǔ)義標(biāo)注43
3.1 非物質(zhì)文化遺產(chǎn)資源分類體系43
3.1.1 分類現(xiàn)狀44
3.1.2 現(xiàn)有分類方法的局限46
3.1.3 分類體系的構(gòu)建47
3.2 非物質(zhì)文化遺產(chǎn)資源元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范53
3.2.1 常用元數(shù)據(jù)標(biāo)準(zhǔn)53
3.2.2 二維元數(shù)據(jù)框架構(gòu)建54
3.2.3 元數(shù)據(jù)結(jié)構(gòu)的實(shí)現(xiàn)57
3.3 非物質(zhì)文化遺產(chǎn)資源本體構(gòu)建73
3.3.1 本體構(gòu)建原則73
3.3.2 本體構(gòu)建方法與流程74
3.3.3 本體構(gòu)建的工具75
3.3.4 本體構(gòu)建的實(shí)現(xiàn)―以中國(guó)傳統(tǒng)戲劇為例76
3.4 基于本體的非物質(zhì)文化遺產(chǎn)語(yǔ)義標(biāo)注模型83
3.4.1 語(yǔ)義描述的層次83
3.4.2 語(yǔ)義描述模板84
3.4.3 語(yǔ)義標(biāo)注模型的構(gòu)建85
第4章 非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與88
4.1 非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與的基本原則88
4.2 非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與的流程89
4.3 基于語(yǔ)義的非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)模型構(gòu)建92
4.3.1 核心資源及其屬性93
4.3.2 項(xiàng)目類及其核心屬性98
4.3.3 機(jī)構(gòu)類及其核心屬性99
4.3.4 相關(guān)人員類及其核心屬性101
4.3.5 數(shù)據(jù)庫(kù)集類及其核心屬性102
4.3.6 相關(guān)事件類及其核心屬性106
4.4 非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與平臺(tái)的設(shè)計(jì)109
4.4.1 DHC在非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與中的應(yīng)用109
4.4.2 非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與架構(gòu)112
4.4.3 非物質(zhì)文化遺產(chǎn)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)114
第5章 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合方案設(shè)計(jì)126
5.1 非物質(zhì)文化遺產(chǎn)資源聚合的原則126
5.2 關(guān)聯(lián)數(shù)據(jù)在非物質(zhì)文化遺產(chǎn)資源聚合中的應(yīng)用優(yōu)勢(shì)分析129
5.3 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合框架131
5.3.1 非物質(zhì)文化遺產(chǎn)資源聚合宏觀模式131
5.3.2 非物質(zhì)文化遺產(chǎn)資源聚合微觀模式140
5.3.3 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源語(yǔ)義聚合框架構(gòu)建142
5.4 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合與服務(wù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)145
5.4.1 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合與服務(wù)平臺(tái)設(shè)計(jì)目標(biāo)145
5.4.2 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合與服務(wù)平臺(tái)整體設(shè)計(jì)思路147
5.4.3 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合與服務(wù)平臺(tái)關(guān)鍵功能實(shí)現(xiàn)149
第6章 基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合實(shí)證研究―以楚劇為例161
6.1 楚劇資源聚合的必要性與可行性分析161
6.2 楚劇資源采集及語(yǔ)義描述163
6.2.1 楚劇資源收集及元數(shù)據(jù)標(biāo)準(zhǔn)建立164
6.2.2 楚劇領(lǐng)域本體開(kāi)發(fā)167
6.2.3 楚劇資源語(yǔ)義標(biāo)注172
6.3 基于楚劇資源的關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與177
6.4 非物質(zhì)文化遺產(chǎn)資源聚合與服務(wù)平臺(tái)應(yīng)用實(shí)例―楚劇資源展示183
6.5 與傳統(tǒng)信息系統(tǒng)的對(duì)比分析196
第7章 總結(jié)與展望198
參考文獻(xiàn)202
彩圖
第1章緒論
本章在對(duì)當(dāng)前非物質(zhì)文化遺產(chǎn)資源聚合中所涉及的理論與方法進(jìn)行深入分析的基礎(chǔ)上,指出當(dāng)前非物質(zhì)文化遺產(chǎn)資源聚合中存在的一系列問(wèn)題,提出基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合方法,并對(duì)國(guó)內(nèi)外研究現(xiàn)狀、研究?jī)?nèi)容與技術(shù)路線以及創(chuàng)新之處進(jìn)行了闡述,后介紹了本書(shū)的組織結(jié)構(gòu)。
1.1研究背景及研究意義
本書(shū)的選題系"十二五"國(guó)家科技支撐計(jì)劃"荊楚文化遺產(chǎn)數(shù)字化公共服務(wù)關(guān)鍵技術(shù)研究及示范"(2012BAH83F00)、文化遺產(chǎn)傳承與數(shù)字化保護(hù)協(xié)同創(chuàng)新中心招標(biāo)課題"荊楚非物質(zhì)文化遺產(chǎn)數(shù)字資源知識(shí)聚合與應(yīng)用研究"(2015XT007)及教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目"基于用戶興趣挖掘的電子政務(wù)門戶知識(shí)整合研究"(BYJC870029)研究成果之一。
一方面,非物質(zhì)文化遺產(chǎn)資源建設(shè)依托于文化部文化共享工程,由國(guó)家牽頭、地方參與,對(duì)地方志、特色文獻(xiàn)、民風(fēng)民俗等一系列獨(dú)具地方特色的文化資源進(jìn)行加工整理。作為一類特殊的館藏資源,對(duì)其進(jìn)行聚合具有典型的示范意義;另一方面,非物質(zhì)文化遺產(chǎn)是人類創(chuàng)造力、想象力、智慧和勞動(dòng)的結(jié)晶,對(duì)其進(jìn)行有效的資源聚合和合理保護(hù)是當(dāng)前該領(lǐng)域亟待解決的實(shí)際問(wèn)題。所以,研究基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合具有重要的理論意義和實(shí)際應(yīng)用價(jià)值。
1.研究背景
非物質(zhì)文化遺產(chǎn)與物質(zhì)文化遺產(chǎn)一樣,都是人類偉大文明的結(jié)晶。兩者作為現(xiàn)存的文化記憶,物質(zhì)文化遺產(chǎn)的可見(jiàn)性,決定了其在保護(hù)和傳承上的優(yōu)勢(shì),而非物質(zhì)文化遺產(chǎn)的無(wú)形性和活態(tài)性,使其所包含的文化記憶更容易隨著時(shí)代的變遷和時(shí)間的推移而被人們忽略和遺忘。非物質(zhì)文化遺產(chǎn)的保護(hù),不僅僅關(guān)乎某項(xiàng)具體文化領(lǐng)域的生存問(wèn)題,更是對(duì)人類精神文明內(nèi)涵與意義的深刻理解。當(dāng)前,非物質(zhì)文化遺產(chǎn)保護(hù)面臨著一系列問(wèn)題,如消亡現(xiàn)象嚴(yán)重、工業(yè)化與城市化的影響較大、文化生態(tài)空間的異化等,在這種情況下,對(duì)非物質(zhì)文化遺產(chǎn)資源實(shí)現(xiàn)有效聚合就顯得十分重要。隨著多媒體技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,非物質(zhì)文化遺產(chǎn)資源聚合與保護(hù)有了新的方法途徑――數(shù)字化遺產(chǎn)保護(hù)技術(shù)。
我國(guó)文化遺產(chǎn)的數(shù)字化保護(hù)工作正在如火如荼地開(kāi)展,并已經(jīng)初見(jiàn)成效,尤其隨著互聯(lián)網(wǎng)的興起,非物質(zhì)文化遺產(chǎn)的數(shù)字化保護(hù)得到了進(jìn)一步的發(fā)展。概括起來(lái),非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù)的關(guān)鍵技術(shù)涉及數(shù)字化建模、遙感技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、數(shù)字化輔助設(shè)計(jì)系統(tǒng)、破碎文化修復(fù)及復(fù)原模擬技術(shù)、數(shù)字化舞蹈編排與聲音驅(qū)動(dòng)技術(shù)等,這些數(shù)字化技術(shù)的發(fā)展為非物質(zhì)文化遺產(chǎn)資源聚合與保護(hù)提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。然而,我們并不滿足其數(shù)字化的保護(hù)和保存,更要通過(guò)新的方法與手段對(duì)其進(jìn)行重新闡釋,賦予它們新的內(nèi)涵,并對(duì)其資源進(jìn)行合理組織與整合,更加有效的實(shí)現(xiàn)非物質(zhì)文化遺產(chǎn)資源的知識(shí)傳承與利用。
非物質(zhì)文化遺產(chǎn)資源的異構(gòu)性、多源性使其在聚合時(shí)存在較大的困難,主要表現(xiàn)為資源描述語(yǔ)義程度低、集成度不高、關(guān)聯(lián)深度與廣度不夠、服務(wù)質(zhì)量和水平有待提升等。一方面,不同的非物質(zhì)文化遺產(chǎn)相關(guān)信息機(jī)構(gòu)往往采用不同的硬件平臺(tái)、數(shù)據(jù)庫(kù)和數(shù)據(jù)描述標(biāo)準(zhǔn),且對(duì)內(nèi)部資源實(shí)行獨(dú)立管理,因而造成了大量的分布式異構(gòu)資源的存在。傳統(tǒng)的資源組織與整合方式只能解決這些資源在物理及邏輯結(jié)構(gòu)上的異構(gòu),而對(duì)資源間的語(yǔ)義異構(gòu)現(xiàn)象無(wú)法提供有效的解決途徑;另一方面,當(dāng)前的非物質(zhì)文化遺產(chǎn)資源聚合是基于數(shù)字化技術(shù)的,也就是資源聚合的對(duì)象往往是數(shù)字資源,如音頻、視頻、圖片等,但與非物質(zhì)文化遺產(chǎn)有關(guān)的其他資源卻沒(méi)有囊括其中,如某一領(lǐng)域的知識(shí)資源、非遺數(shù)據(jù)庫(kù)資源、人員/機(jī)構(gòu)數(shù)據(jù)等,更無(wú)法實(shí)現(xiàn)這些資源與開(kāi)放環(huán)境下的網(wǎng)絡(luò)資源間的關(guān)聯(lián)。此外,非物質(zhì)文化遺產(chǎn)資源聚合的目的就是保護(hù)與傳承,并限度地為用戶提供知識(shí)服務(wù),使用戶在獲取非物質(zhì)文化遺產(chǎn)資源的同時(shí),也能夠汲取資源所包含的文化知識(shí)及民族文化精髓,而當(dāng)前非物質(zhì)文化遺產(chǎn)資源聚合效果及其服務(wù)水平很難滿足用戶對(duì)知識(shí)獲取的迫切需求,人們雖處于信息海洋中,卻經(jīng)常面臨信息匱乏、知識(shí)匱乏的困境[1]。所以,目前非物質(zhì)文化遺產(chǎn)資源所能實(shí)現(xiàn)的聚合廣度、深度以及所提供的服務(wù)質(zhì)量并不盡如人意。
近年來(lái),國(guó)內(nèi)外研究人員利用元數(shù)據(jù)、本體及領(lǐng)域相關(guān)主題詞表等知識(shí)組織工具,面向網(wǎng)絡(luò)資源開(kāi)展了有效的組織和利用工作,開(kāi)啟了資源聚合的新篇章,而語(yǔ)義網(wǎng)的發(fā)展及關(guān)聯(lián)數(shù)據(jù)的提出,更是極大促進(jìn)了這項(xiàng)工作的開(kāi)展,目的就是實(shí)現(xiàn)資源的語(yǔ)義描述、關(guān)聯(lián)、聚合和利用,采用URI和RDF格式、鏈接各類數(shù)據(jù)。隨著關(guān)聯(lián)數(shù)據(jù)逐漸成為語(yǔ)義網(wǎng)的研究熱點(diǎn),也鑒于其自身所具有的技術(shù)特點(diǎn),使其能夠被應(yīng)用于資源聚合中。目前關(guān)聯(lián)數(shù)據(jù)用于資源融合的領(lǐng)域主要集中在企業(yè)信息融合、金融數(shù)據(jù)融合、圖書(shū)館信息融合等,而通過(guò)關(guān)聯(lián)數(shù)據(jù)組織、聚合和利用非物質(zhì)文化遺產(chǎn)資源的研究還很少見(jiàn)。因此,有必要引入關(guān)聯(lián)數(shù)據(jù)的理念,應(yīng)用關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)方法,加強(qiáng)網(wǎng)絡(luò)環(huán)境下非物質(zhì)文化遺產(chǎn)資源的深度組織、聚合和有效利用,提高其知識(shí)服務(wù)能力,并不斷創(chuàng)新服務(wù)內(nèi)容和面向用戶的服務(wù)功能,縮小與其他應(yīng)用領(lǐng)域的差距。同時(shí),也使得非物質(zhì)文化遺產(chǎn)資源中的知識(shí)內(nèi)容和文化精髓能夠通過(guò)這種方式進(jìn)行傳承和延續(xù)。
2.研究意義
鑒于非物質(zhì)文化遺產(chǎn)領(lǐng)域中的資源分布式異構(gòu)現(xiàn)象,通過(guò)現(xiàn)有的資源聚合方式不能解決其語(yǔ)義聚合的難題,且針對(duì)資源描述語(yǔ)義化程度低下、聚合程度不高、關(guān)聯(lián)深度與廣度不夠、服務(wù)質(zhì)量和水平較低等實(shí)際情況,本書(shū)旨在提出一種基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源語(yǔ)義聚合方法,選題具有重要的理論與實(shí)際應(yīng)用價(jià)值。
(1)理論研究意義:①本書(shū)系統(tǒng)深入的探索了語(yǔ)義網(wǎng)環(huán)境下,基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合相關(guān)理論,其研究成果對(duì)于建立和完善網(wǎng)絡(luò)環(huán)境下非物質(zhì)文化遺產(chǎn)資源聚合的理論體系具有重要價(jià)值,也是非物質(zhì)文化遺產(chǎn)保護(hù)與傳承的必然要求;②本書(shū)深入分析了元數(shù)據(jù)技術(shù)、本體技術(shù)及關(guān)聯(lián)數(shù)據(jù)技術(shù)在非物質(zhì)文化遺產(chǎn)知識(shí)揭示與描述、知識(shí)關(guān)聯(lián)與、知識(shí)聚合與集成、知識(shí)可視化展示與語(yǔ)義檢索等方面的應(yīng)用,對(duì)建立和完善網(wǎng)絡(luò)環(huán)境下非物質(zhì)文化遺產(chǎn)資源聚合的方法體系具有較大的借鑒意義;③本書(shū)采用了語(yǔ)義網(wǎng)、語(yǔ)義標(biāo)注、關(guān)聯(lián)數(shù)據(jù)、資源聚合、知識(shí)服務(wù)等相關(guān)理論與方法,構(gòu)建了基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源語(yǔ)義聚合框架,對(duì)促進(jìn)語(yǔ)義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)、資源聚合、知識(shí)服務(wù)等相關(guān)理論和方法的發(fā)展有一定的推動(dòng)作用。
(2)實(shí)際應(yīng)用意義:①本書(shū)針對(duì)非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù)及資源聚合的現(xiàn)狀與存在問(wèn)題,提出了基于元數(shù)據(jù)、本體及關(guān)聯(lián)數(shù)據(jù)的解決思路和方法,該方法可以較為充分的發(fā)揮人、資源聚合技術(shù)及語(yǔ)義網(wǎng)技術(shù)在知識(shí)標(biāo)注、組織、管理和服務(wù)上的優(yōu)勢(shì),具有一定的科學(xué)性與合理性,能夠?qū)崿F(xiàn)非物質(zhì)文化遺產(chǎn)資源的描述化(基于元數(shù)據(jù)與本體的語(yǔ)義標(biāo)注)、深度結(jié)構(gòu)化(明確知識(shí)對(duì)象、屬性及其關(guān)系)和語(yǔ)義關(guān)聯(lián)化(多維度揭示資源間的語(yǔ)義關(guān)聯(lián)關(guān)系),促進(jìn)非物質(zhì)文化遺產(chǎn)資源信息組織向知識(shí)組織的轉(zhuǎn)變;②本書(shū)針對(duì)非物質(zhì)文化遺產(chǎn)的資源類型及其特征,提出以關(guān)聯(lián)數(shù)據(jù)的形式對(duì)其進(jìn)行、集成與服務(wù),這對(duì)提升非物質(zhì)文化遺產(chǎn)資源聚合效率,改進(jìn)知識(shí)服務(wù)模式和質(zhì)量,拉近與網(wǎng)絡(luò)用戶之間的距離,傳承民族文化精髓來(lái)說(shuō),都起著非常重要的推動(dòng)作用,將更加凸顯非物質(zhì)文化遺產(chǎn)及其資源保護(hù)的重要性;③深度聚合與開(kāi)發(fā)利用非物質(zhì)文化遺產(chǎn)資源,探索面向用戶的非物質(zhì)文化遺產(chǎn)知識(shí)服務(wù)與語(yǔ)義檢索,以楚劇為應(yīng)用示范,將該領(lǐng)域內(nèi)多種類型的信息資源進(jìn)行整合并建立豐富的語(yǔ)義關(guān)聯(lián)關(guān)系,并基于關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)楚劇資源的應(yīng)用與服務(wù),為實(shí)現(xiàn)非物質(zhì)文化遺產(chǎn)其他領(lǐng)域資源聚合積累了寶貴經(jīng)驗(yàn)。
1.2國(guó)內(nèi)外研究現(xiàn)狀
國(guó)內(nèi)外研究現(xiàn)狀的闡述主要從關(guān)聯(lián)數(shù)據(jù)及非物質(zhì)文化遺產(chǎn)資源聚合兩個(gè)方面展開(kāi)。首先對(duì)關(guān)聯(lián)數(shù)據(jù)研究現(xiàn)狀進(jìn)行概括,其次從數(shù)字化技術(shù)、理論、方法、應(yīng)用四個(gè)方面對(duì)非物質(zhì)文化遺產(chǎn)資源聚合的研究現(xiàn)狀進(jìn)行了梳理,然后聚焦于基于關(guān)聯(lián)數(shù)據(jù)的非物質(zhì)文化遺產(chǎn)資源聚合研究中存在的不足,并提出了本書(shū)所研究的科學(xué)問(wèn)題。
1.2.1關(guān)聯(lián)數(shù)據(jù)研究現(xiàn)狀
國(guó)外學(xué)者對(duì)關(guān)聯(lián)數(shù)據(jù)的研究主要集中于學(xué)術(shù)會(huì)議、項(xiàng)目研究、語(yǔ)義關(guān)聯(lián)模型、技術(shù)工具、實(shí)際應(yīng)用方面,國(guó)內(nèi)則更加關(guān)注理論層面的研究。
(1)國(guó)外研究現(xiàn)狀
2006年萬(wàn)維網(wǎng)創(chuàng)始人Tim在《關(guān)聯(lián)數(shù)據(jù)筆記》中次提出了關(guān)聯(lián)數(shù)據(jù)的概念,即將以前沒(méi)有進(jìn)行關(guān)聯(lián)的數(shù)據(jù)鏈接起來(lái),并構(gòu)建一個(gè)能夠被機(jī)器所理解的富含語(yǔ)義關(guān)系的數(shù)據(jù)網(wǎng)絡(luò)(webofdata),在此基礎(chǔ)上實(shí)現(xiàn)更加智能的應(yīng)用[2]。同時(shí),Tim又提出了關(guān)聯(lián)數(shù)據(jù)的四個(gè)基本原則,得到了學(xué)術(shù)界和各應(yīng)用領(lǐng)域的廣泛認(rèn)同,并針對(duì)關(guān)聯(lián)數(shù)據(jù)創(chuàng)建、及應(yīng)用開(kāi)展了大量的研究與實(shí)踐。
學(xué)術(shù)會(huì)議方面。截至2014年9月已經(jīng)召開(kāi)了七屆LDOW(LinkedDataontheWeb)研討會(huì),會(huì)議主要圍繞關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與、關(guān)聯(lián)關(guān)系自動(dòng)構(gòu)建、關(guān)聯(lián)數(shù)據(jù)應(yīng)用、關(guān)聯(lián)數(shù)據(jù)融合等方面展開(kāi)[3]。此外,2010年召開(kāi)的DC元數(shù)據(jù)年會(huì)[4]、2011年的語(yǔ)義網(wǎng)技術(shù)大會(huì)、DC與元數(shù)據(jù)應(yīng)用研討會(huì)等都涉及關(guān)聯(lián)數(shù)據(jù)研究的多個(gè)領(lǐng)域。
項(xiàng)目研究方面。Dbpedia項(xiàng)目從Wikipedia詞條里提取出結(jié)構(gòu)化數(shù)據(jù),可以將其他數(shù)據(jù)集與Wikipedia在數(shù)據(jù)節(jié)點(diǎn)上相鏈接,開(kāi)發(fā)多種創(chuàng)新應(yīng)用[5];OREChem項(xiàng)目[6]將現(xiàn)有化學(xué)類數(shù)據(jù)源到LOD云中,應(yīng)用于化學(xué)領(lǐng)域的知識(shí)本體構(gòu)建;Linkingopendrugdata項(xiàng)目[7]將不同數(shù)據(jù)源的醫(yī)藥數(shù)據(jù)進(jìn)行關(guān)聯(lián),并提供相關(guān)的醫(yī)藥服務(wù);在農(nóng)業(yè)領(lǐng)域方面,聯(lián)合國(guó)糧農(nóng)組織(FAO)將AGROVOC敘詞表為關(guān)聯(lián)數(shù)據(jù),并建立了多個(gè)詞表之間的關(guān)聯(lián)關(guān)系,以此作為農(nóng)業(yè)領(lǐng)域關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與的依據(jù)[8];2010年歐盟又啟動(dòng)了LOD2項(xiàng)目,其目標(biāo)是研究面向企業(yè)級(jí)的關(guān)聯(lián)數(shù)據(jù)創(chuàng)建、、瀏覽工具[9]。
語(yǔ)義關(guān)聯(lián)模型方面。目前已經(jīng)有一些較為成熟和通用的本體模型(領(lǐng)域本體、規(guī)范的詞匯集詞表等)可以復(fù)用,如LOD社區(qū)的LOD數(shù)據(jù)云中,收錄了多種知名數(shù)據(jù)集,諸如DBpedia、FOAF、GeoNames、MusicBrainz等,這些數(shù)據(jù)集涉及地理、醫(yī)學(xué)、媒體、社會(huì)網(wǎng)絡(luò)等眾多領(lǐng)域。相關(guān)領(lǐng)域本體或者通用詞表在構(gòu)建關(guān)聯(lián)數(shù)據(jù)語(yǔ)義模型、語(yǔ)義聚合和互操作等方面發(fā)揮了重要作用。
技術(shù)工具方面。關(guān)聯(lián)數(shù)據(jù)已經(jīng)逐漸從理論走向應(yīng)用,也已經(jīng)出現(xiàn)了大量關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與的工具,大致可以分為三類:①關(guān)系型數(shù)據(jù)庫(kù)RDF轉(zhuǎn)化工具。有代表性的是D2R,其作用是將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)轉(zhuǎn)化為虛擬RDF數(shù)據(jù),由于這一關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與工具較容易更新,且數(shù)據(jù)空間復(fù)雜度較低,所以成為一種使用率極高的關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與工具。此類型的關(guān)聯(lián)數(shù)據(jù)工具還有Triplify,其作用是將關(guān)系型數(shù)據(jù)庫(kù)為真實(shí)的RDF數(shù)據(jù)[10]。②直接生成RDF數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)工具。Virtuosouniversalserver是一種商業(yè)級(jí)關(guān)聯(lián)數(shù)據(jù)工具,可以通過(guò)一個(gè)SPARQL端點(diǎn)將數(shù)據(jù)轉(zhuǎn)化為RDF數(shù)據(jù)[11];SparqPlug則是從HTTP文本中直接抽取關(guān)聯(lián)數(shù)據(jù)并以RDF格式序列化輸出[12]。③其他RDF數(shù)據(jù)的工具。這類工具應(yīng)用較多的是Pubby和Talisplatform。Pubby能將URI請(qǐng)求轉(zhuǎn)化為潛在RDF數(shù)據(jù)查詢語(yǔ)言SPARQ[13],Talis則是一個(gè)能夠提供RDF或關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)的軟件服務(wù)平臺(tái)[14]。
應(yīng)用研究方面。關(guān)聯(lián)數(shù)據(jù)自2006年產(chǎn)生以來(lái)得到了廣泛的認(rèn)同和應(yīng)用,越來(lái)越多的組織與個(gè)人加強(qiáng)了對(duì)關(guān)聯(lián)數(shù)據(jù)的應(yīng)用研究,涉及大眾傳媒、商業(yè)企業(yè)、政府部門、圖書(shū)館等眾多領(lǐng)域。Michael將關(guān)聯(lián)數(shù)據(jù)的應(yīng)用分成內(nèi)容再利用、語(yǔ)義標(biāo)簽、綜合提問(wèn)應(yīng)答系統(tǒng)以及事件數(shù)據(jù)管理系統(tǒng)四個(gè)方面[15]。在圖書(shū)館領(lǐng)域,作為信息收集、組織與服務(wù)的專門性機(jī)構(gòu),圖書(shū)館的書(shū)目數(shù)據(jù)、主題標(biāo)目等都可以為關(guān)聯(lián)數(shù)據(jù)供用戶使用。2010年W3C成立了圖書(shū)館關(guān)聯(lián)數(shù)據(jù)孵化小組,其職責(zé)就是為了幫助圖書(shū)館創(chuàng)建和關(guān)聯(lián)數(shù)據(jù),增強(qiáng)圖書(shū)館數(shù)字資源的互操作。美國(guó)國(guó)會(huì)圖書(shū)館則是通過(guò)SKOS將傳統(tǒng)的主題標(biāo)目轉(zhuǎn)化成Web可以理解、處理和使用的形式[16]。20 ……