本書為國家文化產業項目“基于大數據架構的中國古村落文化保護與傳承云服務平臺建設”的階段性研究成果。進入大數據時代,如何有效發揮數字化技術在古村落保護與傳承中的作用,已成為學界關注的焦點。本書從大數據分析與知識挖掘的角度來研究古村落保護問題,利用廣東省古村落實際數據,進行大數據分析與挖掘,對古村落文化遺產保護與傳承提供新思路。以廣東200多個古村落為示范,針對傳統文字、圖片、視頻資源數字化處理的難題,提出了古村落文化資源數字化處理模式,對古村落文化大數據進行挖掘整理,包括資源整理、標注、檢索、分類、構建知識圖譜以及資料深度關聯分析等。
古村落是歷史文化遺產的重要組成部分,反映了不同歷史時期、不同地域、不同社會經濟發展形成和演變的歷史過程,古村落保留著豐富多彩的物質文化遺產和非物質文化遺產,凝聚著中華民族生生不息的精神,是維系華夏子孫文化認同的紐帶,是中華民族文化的源頭和根基。
大數據、云計算等新一代信息技術的迅猛發展,為古村落文化遺產保護與傳承提供了新的思路與工具。利用大數據技術以及網絡眾包模式來研究古村落保護與傳承問題,是一種“跨界”和“混搭”,其探索意義在于“去粗取精”和“合縱連橫”,終實現1 1遠大于2的信息化價值目標。古村落文化遺產的數字化保護與傳承,獲得大量的古村落數據信息是步。有了古村落大數據,還需要利用大數據分析技術把碎片化的數據進行分析和挖掘,從而產生有價值的信息和知識。大數據分析技術包括描述性分析、預測性分析和規范性分析,本書主要應用描述性分析方法,特別是應用聚類分析方法對古村落大數據分析與挖掘進行了初步嘗試,得到了部分有意義的結果,現將這些方法與結果整理出來,希望能夠為古村落研究者提供一種新的思路與方法。
本書共有十章,各章的內容、主要觀點和結論如下:
章“中國古村落文化遺產保護”介紹了古村落與傳統村落的概念辨析、古村落物質文化遺產與非物質文化遺產以及古村落文化遺產的數字化保護。古村落保護和發展是一項復雜的系統工程,提出了將古村落文化遺產的數字化保護問題看作由三個空間耦合關聯而成的古村落復雜系統綜合集成問題,借助于信息技術和相關設備,采用不同類型的數字化方法,將古村落物質文化遺產和非物質文化遺產的各種信息數字化,并長期存儲于信息世界中,以實現三個空間的有機融合,進而達到對古村落文化遺產的搶救保護與弘揚。
第二章“中國古村落文化保護與傳承云服務平臺”介紹了古村落大數據和“基于大數據架構的中國古村落文化保護與傳承云服務平臺建設”文化產業專項資金項目。古村落數據涵蓋了大量歷史、人文與社會經濟信息,呈現出容量大、多來源、多格式、多類型等特點,是典型的大數據,包括古村落物質文化遺產大數據、非物質文化遺產大數據和古村落網絡大數據。基于大數據架構的中國古村落文化數字化保護與傳承云服務平臺是一個知識服務系統,因而項目組提出以知識系統工程方法論為指導來開展研發、構建和運營活動。
第三章“基于網絡眾包模式的古村落大數據采集”介紹了如何應用網絡眾包模式開展古村落大數據采集工作。網絡眾包模式是一種大眾化知識生產模式,基于網絡眾包模式的古村落大數據采集及處理方法,可以實現海量文字資料、圖片資料、音頻和視頻資料的數字化采集、分類、標引等工作。通過網絡眾包模式,將更多的閑置資源充分集結到一起共同完成同一項事情,使得任務量龐大的古村落大數據采集工程的實現成為了可能。
第四章“古村落文獻知識圖譜分析與主題發現”從知識圖譜和主題發現兩個方面對古村落文獻進行計量分析,探索國內對古村落研究的現狀和特點,得出古村落知識圖譜領域主題,為古村落研究領域的科學研究提供參考。在進行古村落文獻主題發現時,針對傳統共詞分析方法存在的缺陷,提出了基于AP聚類的GMAP共詞分析方法,數據預處理階段使用g指數和互信息概念,在聚類分析階段使用AP聚類方法,后得出領域主題。
第五章“古村落領域文獻主題演化分析”在第四章“古村落文獻知識圖譜分析與主題發現”基礎上,進一步深入研究古村落領域文獻的主題動態演化情況,提出了基于GMAP共詞分析法的主題演化框架,從而探究廣大學者們對古村落進行哪些方面的研究,古村落領域的主題又是隨著時間如何演化的,并將研究結果用ThemeRiver模型進行可視化,終將主題演化結果直觀地展示出來,并從宏觀和微觀兩個層面對主題演化狀態進行分析。
第六章“傳統村落地理位置可視化與空間分布特征”以入圍中國傳統村落名錄的廣東省160個傳統村落為研究對象,運用空間統計分析和數據挖掘中的聚類分析方法,對廣東省傳統村落的密度分布、地理集中指數、空間自相關性、地理位置可視化和村落群聚類結果進行研究,以期能對廣東省傳統村落的合理開發、利用和保護提供參考。研究發現廣東省傳統村落主要集中于珠三角地區和粵北地區,在地理分布上呈現珠三角、粵北分布多,粵東、粵西分布少的規律;傳統村落較集中分布于某些地級市,且前三批隨批數增加,集中程度越大,前四批的集中程度比前三批的稍有降低。
第七章“古村落網絡資源評價方法與網絡傳播力”提出了一種古村落網絡信息資源評價流程框架,通過評價古村落網絡信息資源來衡量古村落的網絡傳播力。以廣東省204個古村落為計算實例,使用古村落網絡資源評價方法得到了一個相對合理且具有管理參考價值的綜合評價結果。通過探究發現排在前十名的古村落較多位于廣州市,廣東省古村落在百度百科詞條和數字地圖方面的資源相對豐富,在旅游網站和新聞數量上的資源豐富程度一般,在古村落主頁和中國知網上的資源相對匱乏。
第八章“古村落特征提取與古村落畫像”介紹了如何從大量古村落網絡信息資源中抽取能反映和代表古村落特征的有用信息,并依據這些有用的信息完成古村落的畫像。在廣泛的古村落網絡信息資源中,文本數據是為普遍的一種數據類型,對于挖掘古村落特征具有重要價值。首先,通過制定古村落候選特征的篩選原則,采用文本挖掘方法進行古村落特征抽取;然后,依據古村落特征,總結村落的特點,生成古村落畫像,并分別從兩個不同方面對村落畫像進行特征維度分析和特征相關性分析;后,以小洲村為例進行了實例計算及相關結果分析。
第九章“基于AP聚類的古村落視頻與圖像數據挖掘”介紹了如何通過AP聚類等技術對古村落視頻和圖像兩類重點的影像資料進行挖掘和分析。將增量式AP算法應用于古村落視頻數據聚類,生成的視頻摘要可以幫助歷史學家和民俗專家在短時間內把握大量視頻的內容概要,進而把握古村落的總體特征以及古村落之間的區別和聯系。將基于AP聚類的任意形狀簇聚類應用于聚類古村落圖像數據,通過圖像分割的方法,描繪出圖像的大致輪廓,從而便于民俗專家研究工藝品的藝術風格。
第十章“廣東省古村落信息管理原型系統設計與實現”介紹了廣東省古村落信息管理原型系統的需求分析、系統設計與系統實現。利用信息系統分析與設計的相關理論,對廣東省古村落獨有的特性進行需求分析;在需求分析的基礎上,確立了廣東省古村落信息管理原型系統的采集目標和系統的使用對象,根據古村落現有的建筑、藝術、民俗、活動等信息進行表格的設計,并根據不同類型用戶的需求進行相應的數據庫設計。在數據庫和目標設計基礎上,利用現有的HTML5網頁開發技術、JSP動態網頁開發技術以及數據庫技術,完成了廣東古村落信息管理系統的原型系統的設計與開發。
郭崇慧,大連理工大學,教授、博士生導師,系統工程研究所所長,大數據分析與挖掘、知識管理、復雜系統建模與優化、決策理論與方法;出版《信息與知識管理》《管理決策方法》《面向產品生命周期的知識協調管理理論與方法》等多部專著與教材。
本書是“基于大數據架構的中國古村落文化保護與傳承云服務平臺建設”項目成果之一。
本書于2017年6月15日在廣州華南理工大學12號樓,被新華網、中國新聞網、光明網、中國藝術報、廣州日報、羊城晚報、南方都市報、新快報、信息時報、羊城地鐵報、廣東電視臺等媒體重點報道。
新華網報道www.gd.xinhuanet.com/newscenter/2017-06/16/c_1121155645.htm#10006-weixin-1-52626-6b3bffd01fdde4900130bc5a2751b6d1
中新網報道 dw.chinanews.com/chinanews/content.jsp?id=8252012 classify=zw pageSize=6
新快報app.myzaker.com/news/article.php?pk=594264b41bc8e0e54500053d
廣東衛視新聞聯播v.gdtv.cn/star/gdxwlb/2017-06-15/938126.html?from=timeline isappinstalled=0
信息時報ycp.ycwb.com/ycpFront/content/news_streets/2017061521260052819.html
南方都市報epaper.oeeee.com/epaper/G/html/2017-06/16/content_37809.htm?from=singlemessage isappinstalled=0 本書是“基于大數據架構的中國古村落文化保護與傳承云服務平臺建設”項目成果之一。
本書于2017年6月15日在廣州華南理工大學12號樓,被新華網、中國新聞網、光明網、中國藝術報、廣州日報、羊城晚報、南方都市報、新快報、信息時報、羊城地鐵報、廣東電視臺等媒體重點報道。