一、結(jié)構(gòu)化數(shù)據(jù)在知識(shí)服務(wù)中的作用
作為知識(shí)服務(wù)的基石,結(jié)構(gòu)化數(shù)據(jù)為知識(shí)庫(kù)的建設(shè)、語(yǔ)義出版的支持和信息聚合提供了必要的原材料。縱覽國(guó)際科技出版商 20 多年的發(fā)展之路,可以說(shuō)它也是結(jié)構(gòu)化數(shù)據(jù)從構(gòu)想、實(shí)踐到成熟的一段歷程。早在 20 世紀(jì) 90 年代,國(guó)外出版商開(kāi)始嘗試應(yīng)用 SGML/XML 對(duì)文檔進(jìn)行描述,以便實(shí)現(xiàn)內(nèi)容的存儲(chǔ)和交換,2000 年初以美國(guó)醫(yī)學(xué)圖書(shū)館(NLM)為核心的工作組開(kāi)始研制科技期刊的數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)并制定了及時(shí)個(gè)被廣泛接受的全文數(shù)據(jù)標(biāo)準(zhǔn) NLM DTD 1.0。此后該標(biāo)準(zhǔn)不斷迭代升級(jí),隨著應(yīng)用范圍的擴(kuò)大和影響力的延伸,現(xiàn)已成為國(guó)際科技出版領(lǐng)域公認(rèn)的數(shù)據(jù)標(biāo)準(zhǔn),被科技出版商、大型圖書(shū)館和知識(shí)存儲(chǔ)機(jī)構(gòu)所認(rèn)可[13]。2012 年,該標(biāo)準(zhǔn)升格成為美國(guó)的國(guó)標(biāo) NISO JATS,美國(guó)也成為及時(shí)個(gè)將科技論文的存儲(chǔ)和交換標(biāo)簽集作為國(guó)標(biāo)的國(guó)家。NLM DTD 標(biāo)準(zhǔn)的構(gòu)建為PMC 數(shù)據(jù)庫(kù)的數(shù)據(jù)收集解決了出版商之間數(shù)據(jù)的差異化問(wèn)題。作為目前世界上最著名的全文 OA數(shù)據(jù)存儲(chǔ),PMC 已經(jīng)成為全球醫(yī)學(xué)生物科研人員文獻(xiàn)訪(fǎng)問(wèn)和新知發(fā)掘的寶庫(kù)。
中國(guó)學(xué)者對(duì)于結(jié)構(gòu)化數(shù)據(jù)(XML)的研究始于21 世紀(jì)初,但真正將其應(yīng)用在科技期刊的傳播活動(dòng)還是近些年的事情。結(jié)構(gòu)化數(shù)據(jù)之所以能成為知識(shí)服務(wù)的基礎(chǔ)性元件,筆者認(rèn)為主要原因有以下幾點(diǎn)。首先,結(jié)構(gòu)化數(shù)據(jù)的目標(biāo)是實(shí)現(xiàn)內(nèi)容與樣式的分離,XML只描述論文的內(nèi)容,而非其表現(xiàn)的樣式。其次,結(jié)構(gòu)化數(shù)據(jù)的層級(jí)結(jié)構(gòu)和語(yǔ)義描記性能更適合對(duì)論文實(shí)體結(jié)構(gòu)的解析,NISO JATS定義了271 個(gè)元素和 136 個(gè)屬性,可進(jìn)行語(yǔ)義描記的實(shí)體超過(guò)550個(gè)。換言之,用該標(biāo)準(zhǔn)進(jìn)行標(biāo)引的文檔,最多可定義550多個(gè)知識(shí)點(diǎn)/信息點(diǎn),較大限度地保持了知識(shí)內(nèi)容以及知識(shí)鏈接擴(kuò)展的潛力,它也因此成為知識(shí)服務(wù)的基礎(chǔ)性數(shù)據(jù)格式[14]。再次,結(jié)構(gòu)化數(shù)據(jù)另一個(gè)優(yōu)勢(shì)是其“穿透力”,它可以在不同的操作系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)間進(jìn)行傳輸,實(shí)現(xiàn)了在不同出版商、圖書(shū)館和倉(cāng)儲(chǔ)機(jī)構(gòu)間數(shù)據(jù)的傳輸和交換。,結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)了“一次制作、多元”的功能,出版商可通過(guò)該文檔進(jìn)一步轉(zhuǎn)換成為PDF、HTML、e Pub 等多種格式的數(shù)據(jù),也可以實(shí)現(xiàn)在 PC端、手機(jī)端、移動(dòng)應(yīng)用的不同形式的表現(xiàn)。
二、集約化生產(chǎn)出版平臺(tái)對(duì)于知識(shí)服務(wù)的意義
從上述科技期刊集約化生產(chǎn)平臺(tái)的改造來(lái)看,其對(duì)知識(shí)服務(wù)的意義可以總結(jié)為以下幾點(diǎn):
及時(shí),集約化生產(chǎn)出版平臺(tái)是科技期刊做強(qiáng)做大的基礎(chǔ)性服務(wù)平臺(tái)之一,通過(guò)流程改造,可將分散的內(nèi)容資源匯聚,通過(guò)譬如專(zhuān)業(yè) / 專(zhuān)科集群的模式,打造具有一定規(guī)模的專(zhuān)業(yè)性知識(shí)文庫(kù)。
第二,結(jié)構(gòu)化文檔成為集約化生成平臺(tái)的基礎(chǔ)性數(shù)據(jù)格式,使得知識(shí)服務(wù)系統(tǒng)可隨時(shí)隨地獲取具有高度知識(shí)標(biāo)引的原生數(shù)據(jù),該過(guò)程不單是服務(wù)于完成傳統(tǒng)出版流程,也完成了對(duì)內(nèi)容的細(xì)粒化知識(shí)標(biāo)引過(guò)程。
第三,集約化生產(chǎn)出版平臺(tái)提供了智能化工具,使得內(nèi)容組織工作與排版生產(chǎn)工作得以分離,讓學(xué)術(shù)編輯無(wú)需過(guò)多關(guān)注內(nèi)容的生產(chǎn)流程,工作重心回歸到品質(zhì)內(nèi)容的發(fā)現(xiàn)與遴選上。在工業(yè)化模式下編輯解放了勞動(dòng)力,專(zhuān)業(yè)價(jià)值受到更多的尊重,有可能培養(yǎng)出編輯的產(chǎn)品意識(shí),更多地參與到知識(shí)服務(wù)的策劃和創(chuàng)作中來(lái)。
第四,高效能的智能化工具讓排版成為過(guò)去,極大地釋放了編輯部的勞動(dòng)力。通過(guò)上述的生產(chǎn)出版平臺(tái),編輯部可以隨時(shí)將定版的文檔上傳至平臺(tái),通過(guò)平臺(tái)上架設(shè)的工具流水式作業(yè),快速獲取校樣文檔,加快了知識(shí)上線(xiàn)的速度。
第五,集約化生產(chǎn)平臺(tái)連同前后的采編和知識(shí)發(fā)現(xiàn)系統(tǒng),支持分布式的工作,使得稿件從投稿開(kāi)始就在為后續(xù)的知識(shí)服務(wù)提供協(xié)作的空間。作者在采編環(huán)節(jié)即參與到文獻(xiàn)的知識(shí)標(biāo)引工作,再通過(guò)學(xué)術(shù)編輯的提升,技術(shù)編輯的加工,以及輔助的自動(dòng)化知識(shí)標(biāo)引和知識(shí)發(fā)現(xiàn)系統(tǒng)可以大大提升文章的知識(shí)附加值。
總之,集約化生產(chǎn)平臺(tái)讓出版流程變得更加可控,社會(huì)分工更加明確,協(xié)同作業(yè)成為可能。這種全新的出版生產(chǎn)平臺(tái)從根本上變革了中國(guó)科技期刊現(xiàn)有的出版生產(chǎn)模式,必將成為中國(guó)科技期刊向工業(yè)化革命邁進(jìn)的重要標(biāo)志。
三、結(jié)語(yǔ)
隨著數(shù)字技術(shù)與媒體融合的發(fā)展,學(xué)術(shù)文獻(xiàn)的傳播方式日益多元化。同時(shí),受閱讀需求變化、學(xué)術(shù)評(píng)價(jià)體系誤導(dǎo)、品質(zhì)稿件外流等因素影響,中國(guó)科技期刊的發(fā)展遭受了巨大沖擊。中國(guó)科技期刊想突出重圍,必須直面互聯(lián)網(wǎng)時(shí)代下讀者對(duì)知識(shí)的個(gè)性化需求趨勢(shì),快速實(shí)現(xiàn)從傳統(tǒng)出版商向知識(shí)服務(wù)商的轉(zhuǎn)變,不斷提升期刊的傳播力和知識(shí)服務(wù)能力。
盡管近些年國(guó)內(nèi)科技期刊進(jìn)行了一些探索,得到了一些有益的啟示。但期刊界同仁需清楚知識(shí)服務(wù)沒(méi)有捷徑可言,科技期刊生產(chǎn)流程的重塑是目前較為迫切的一次革新。好風(fēng)送我上青云,冀望通過(guò)集約化生產(chǎn)平臺(tái)這一創(chuàng)新技術(shù)使科技期刊出版實(shí)現(xiàn)新的騰飛。
免責(zé)聲明以上文章內(nèi)容均來(lái)源于本站老師原創(chuàng)或網(wǎng)友上傳,不代表本站觀(guān)點(diǎn),與本站立場(chǎng)無(wú)關(guān),僅供學(xué)習(xí)和參考。本站不是任何雜志的官方網(wǎng)站,直投稿件和出版請(qǐng)聯(lián)系出版社。