摘要:
可發現性是針對學術界學者的搜索行為進行的調查研究,也是近2年國際學術出版界新興的研究方向。本文總結現階段可發現性研究的主要結論;并利用這一新興的研究結果,提出了相應的技術策略。采用這些策略,學術期刊可以從傳統的總結閱讀量、下載量等數據間接了解讀者行為的方式,變為從直接解讀讀者興趣、習慣入手,提高學術期刊在目標讀者群中的顯示度。學術出版從一開始就有對論文和圖書進行檢索、分類的良好傳統。但是,面對每年海量遞增的論文數量、百花齊放的數字出版平臺,以及越來越豐富的論文展現形式,傳統的檢索分類方式已不能有效地支持學術生態的運行。了解信息時代的學者的搜索習慣,對學術期刊、出版商、圖書館等整個出版行業的各環節都有至關重要的作用。因此,很多學術出版從業者不約而同地展開了論文的“可發現性”(discover-ability)研究,旨在了解讀者搜索意圖,為學術論文的出版布局提供新的發展方向。學術期刊長久以來都著重關注以影響因子為首的統計分析,通過統計數字論文的下載量、閱讀量等信息,制定相應的策略,提高期刊的可見度及影響力。而借助“可發現性”這一新的形勢,可以變被動為主動,從學術期刊的根本目標———讀者入手,深入解讀讀者行為,有效地助力學術期刊論文的精準投放,提高論文在數字海洋中的可見度。“可發現性”是指如何定位到一篇搜索發起人需要的文章;或者站在期刊的角度,“可發現性”是指一篇文章如何在眾多文獻中脫穎而出,出現在該出現的人面前。本文總結最近幾年國際上的研究成果,然后針對這些研究結論,為學術期刊,特別是英文學術期刊在國際出版數字化時代的可見度的提升,提出相應的技術上的對策。
1.可發現性研究現狀
“發現”(discovery)這一行為在學術出版界歷史悠久,但是其定義卻從來沒有統一、確定過。本文采用大多數業內人士默認的意義,定義如下:“發現”是指研究人員如何尋找并且使用電子資源的方法,以及這一過程帶給出版商、圖書館及其他服務提供商的機會與挑戰。在“可發現”的行為研究中,需要著重區分2個概念,即“尋找”(lookingfor)和“獲取”(find-ing或者delivery)的區別。“尋找”是指尋找文獻的過程;“獲取”是指當搜索人需要一篇文獻時,如何定位到該篇文獻,獲取全文。往往“尋找”文獻的平臺和“獲取”文獻的平臺不是同一個。因此,可發現性的研究基本都是按照這2個階段分別展開的。
1.1尋找:Google和圖書館發現系統受歡迎盡管科研人員的搜索習慣會受到工作資歷、學科及所在地區等不同因素的影響,但是各種調查研究都指出,科研人員,尤其是年輕的學者,更傾向以Google和GoogleScholar為首的搜索引擎開始尋找文獻。文獻發現本科生、研究生、博士生和事業剛剛起步的青年學者對搜索引擎有更熱烈的偏好;針對研究生(主要是博士研究生)的調查也表明對搜索引擎的喜好是近十年的發展趨勢。以往的這些調查研究的對象主要都集中在美國,開展的調查問卷涉及包括中國在內的8國家,雖然樣本體量較小(116位),但是也提供了一個跨國家的年輕學者的搜索傾向,他們都傾向于使用Google作為信息搜索的起點。展開了一項針對美國本科生長達4年的跟蹤調查,發現隨著研究的深入和成熟,學生會逐漸從Google過渡到圖書館發現系統,與針對其他博學的科研人員、青年學者的調查暗暗吻合。幾乎所有的文獻都強調,雖然搜索引擎(主要是Google)是受歡迎的起點,圖書館發現系統依然緊隨其后,也是十分受歡迎的搜索起點。在2015年對發達國家的各個學科的科研人員調查發現,博學研究員、講師這些在學術上已經有所成就的科研人員,是除了圖書館員之外,最傾向于使用圖書館發現系統的學者。在針對各個群體的研究中發現,講師及教授更傾向于從圖書館發現系統和特定的專業數據庫中開始查找,這一傾向在教授中更加突出。因此,在發起尋找的最開始,學者們打開的是Google,隨著研究年限的增長,他們逐漸傾向于圖書館發現系統。由此可見,學術期刊在進行數字出版時,應當著重注意其論文在搜索引擎和圖書館發現系統中的可見度。
1.2題名中出現“搜索詞”是確定目標的關鍵因素
“搜索詞”是指搜索人發起搜索時輸入的文字,它可能是一個詞或者詞組,或者是幾個無語義關聯的單詞。當查詢結果出現在眼前時,研究人員是通過哪些信息確定這就是自己要找的相關文獻的呢?或者說,什么相關信息會引起讀者的興趣從而點開鏈接呢?列出了題名中的關鍵字、文中關鍵字、是否能獲得全文、引用率、作者姓名、出版日期、期刊名和關鍵字在全文中出現的次數這8個選項供受訪人選擇。結果表明,題目中出現相關的搜索詞是研究人員確定相關文獻時最重要的指標,作者姓名對于博士以上級別的研究人員是第二重要的指標,出版時間和期刊也是搜索者考慮的要點。令人意外的是,引用次數是所有指標中最不重要的。由此可見,學者更加注重的是內容的相關性,而不是計量數據。學術期刊應當把重點放到如何精準地確定關鍵詞匯,維護特定作者群上,才能增大論文的閱讀率。
1.3獲取:圖書館授權的數據庫平臺是途徑
在發現一篇需要的文章后,幾乎所有的人都會去圖書館平臺,通過圖書館的授權,登陸各大出版商、數據庫的網站,獲得全文。因為幾乎沒有其他選擇。但是,隨著近年來一些科研社交網站(如researchgate)和一些免費的文獻數據庫的興起,也吸引了部分學者,尤其是來自發展中國家的學者。文獻總結發現來自低收入國家的學者有接近75%的概率在免費資源中尋找全文;而來自高收入國家的學者的這一概率有60%。這說明免費資源的吸引力還是非常強大的,這應當促使期刊思考如何在OA環境中更好的生存。
1.4可發現性研究的不足
1)中國數據嚴重缺失。從2005年可發現性研究萌芽開始,迄今為止,絕大多數研究幾乎都是針對發達國家和地區,比如美國、英國、歐洲等的科研人員進行的。只有有限的幾個調查中明確說明有來自中國的受訪者,受訪人數非常少。2)缺少針對特定期刊群體的調查。由于推動可發現性研究的機構大多是數據出版平臺及大型出版商,甚至最有力的研究來自財力雄厚的咨詢公司,因此,這些研究的目的大多是站在出版商的角度;在組織調查時,雖然考慮到了期刊各特征對學者的影響,但是依然是站在學者的角度,根據學者的特征進行調查。所有這些研究都缺少站在某個期刊的視角,對某些特定目標群體來制定特定的可發現性策略。
2.學術期刊可見度提升策略
2.1特別關注文章的主題詞如前所述,在可發現性的研究中,“搜索詞”是指引讀者尋找文章的關鍵因素。因此,整理文章中“主題詞”與“搜索詞”相對應,以適應學者的搜索行為,是提高期刊可發現性的最基本的因素。由于讀者在輸入“搜索詞”時沒有固定規則及固定語法,因此,與之對應的主題詞不能簡單等同于文章的關鍵字。本文將主題詞定義為:最能體現文章創新,最能定義文章所屬方向的1個或幾個關鍵詞匯。主題詞通常需要包括文章提出的新算法、新觀點的名稱,文章所屬的專業小方向的名稱,文章所可能應用的領域及工業方向等。主題詞編輯加工時要特別注意以下幾點:1)主題詞出現在文章題名、摘要、關鍵字和章節標題中時,應盡量使用全稱。一般的搜索算法會將文章的關鍵部分———文章題名、摘要、關鍵字和章節標題———賦予更高的權值。也就是說,在以上幾個部分中被檢索到將會大大提高文章的可見度。而現在的語義搜索還不成熟,搜索算法更容易理解全稱的名稱,而難以區分各種縮寫的意義。當讀者了解到這一特征時,他們會輸入全稱以期得到更的結果。所以,文章的重點部分的主題詞使用全稱,文件被檢索到和在檢索結果中排名靠前的概率比較大。比如,CFD(計算流體力學)雖然在航空航天領域是一個不需解釋的縮寫、但是,搜索引擎不僅會理解成computationalfluiddynamics,還會理解成人名的縮寫,機構名稱等。如果題名中使用CFD,在讀者搜索computationalfluiddy-namics時,該篇文章將難以出現在結果中,或者出現在讀者很難看到的第2頁之后的搜索結果中。2)文章題名中一定要出現重要主題詞。如前所述,如果搜索詞出現在文章題名中,讀者點開鏈接的可能性較高;因此,文章題名與搜索詞的匹配度是重中之重。所以,題名中的用詞一定要能體現文章的核心創新。化學名稱也盡量使用文字名稱,盡量避免非文字形式的數學表達式出現在題名中。現在的搜索算法還很難達到智能語義搜索的水平,因此,需要編輯盡較大可能地將題名處理成搜索算法最容易理解和排序的模式。3)主題詞在文章中一定要保持一致。搜索算法會考慮搜索詞出現的頻率;因此,文章主題詞的英文表達一定要前后一致,確保在全文中出現時是相同的形式,這樣會增加主題詞的頻率,進而增加文章在搜索結果中的排名,提高可見度。
2.2提高期刊文章在搜索引擎中的排名
如前所述,鑒于Google及GoogleScholar在科研人員,尤其是有巨大潛力的青年學者的心目中有不可撼動的地位,期刊文章在搜索引擎的搜索結果中排名靠前的話,也會大大提高文章的關注度。英文期刊應當重視Google學術搜索的索引與排名,首先應當申請加入Google學術的索引。同時,搜索引擎也有相應的技術特點。搜索引擎優化(searchengineoptimization,SEO)技術特別推薦了提高搜索排名的方法,尤其針對如何提高Google算法中權重較高的PageRank(PR)值。結合期刊的特點,除了2.1節針對主題詞的特殊加工外,我們從技術上還可以做到以下幾點:1)盡可能多地以HTML格式在各大論文出版平臺投放文章。比如知名的開放獲取平臺及目錄。這些大型出版平臺本身的PR值很高,被檢索的排名也會靠前。2)盡可能多地為期刊文章建立高質量的外部鏈接。比如:與其他同類期刊的之間建立相關鏈接;與其他相關期刊、專業性的數據出版平臺建立互相指引鏈接;鼓勵作者、讀者在社交網絡上分享文章的全文鏈接。外部鏈接的質量與數量對PR值也十分重要。3)在HTML出版的文章網頁的HTML源碼中,注意在title域中放入文章的題名。在Google搜索結果的排名中,HTML中的title域的權值排名也較高;所以,當單篇文章的HTML網頁打開時,網頁頭部出現文章題名。比如,《TransactionsofNanjingUniversityofAeronauticsandAstronautics》(TNUAA)的HTML的出版網頁中,就在頭部域中加入了標題(即在網頁的標題欄中顯示的是文章題名)。這將會提高文章在搜索結果中的排名。
2.3提高期刊文章在圖書館發現系統的可發現性
圖書館發現系統實際上是基于元數據聯合預索引的網絡級發現系統。它可以在前端給讀者提供一個類似搜索引擎的界面,在后端讀取原本獨立的各大數據出版平臺的元數據,從而提供一個界面親切、具有搜索功能的整合系統。圖書館發現系統與搜索引擎較大的不同就在于,它是一個相對封閉、相對客制化的平臺。每個圖書館都會針對本館訂購的數據庫及館藏內容建立屬于自己的聯合預索引數據庫。盡管它們都聲稱使用“相關性”作為結果排序的規則,但是具體的算法仍各有不同。換句話說,在不同的圖書館的發現系統上,某篇文章在搜索結果中的排名有可能是不一樣的。例如,搜索TNUAA近年被引用最多的一篇文章是《Progressofgreysystemmodels》,不同的圖書館得到的結果是不同的。我們在這里不使用任何搜索技巧,僅僅按照文章題名在電子資源里搜索。在清華大學基于Primo的“水木搜索”圖書館發現系統中,該篇文獻出現在第11位的位置,而使用南京航空航天大學圖書館的“智周搜索”搜索時,該篇文章排在首位。“智周搜索”是基于EBSCO圖書館發現系統的。不僅不同的圖書館發現系統的排序結果不同,即便是基于相同的發現系統,每個圖書館也會選擇屬于自己的分面排序優先級。比如同為基于Primo的發現系統,清華大學圖書館水木搜索平臺將按學科“定制檢索結果”放在首位,波士頓大學圖書館則將“精煉檢索結果”放在首位,牛津大學信息發現平臺則將主題放在首位等。既然每個發現系統的排序不同,我們就需要做到:1)期刊要了解自己的目標人群主要集中在哪些大學和學術機構,以及這些機構的圖書館訂購了哪些數據庫,使用的哪一個圖書館發現系統。圖書館在安裝使用發現系統時會有些客制化的操作,這些操作有可能會嚴重影響排序結果。因此,跟期刊讀者所在的圖書館建立聯系,了解他們購買的服務及相關服務的具體技術細則,從而有針對性地提高自己的文章的相應部分的曝光率,達到從圖書館入手,提高搜索結果的排序的目的。2)加入大型的全文檢索數據出版平臺,深耕專業性強的小平臺。3大圖書館發現系統Summon、Primo、EDS,基本上都囊括了各大主流的全文數據出版平臺;而購買發現系統的高校或者研究院所的圖書館,一般也會訂購這些大型的數據庫出版平臺。因此,想要在發現系統的結果中出現,英文期刊的文章就勢必要加入各大型數據庫出版平臺,如Elsevier、WebofScience、Scope等。3)編輯加工元數據,特別注意統一性及出現頻率。每一個發現系統的分面選項中,都有“主題詞”這個重要選項,其中Summon最多,默認顯示的主題詞為100個左右;因此,要想在圖書館發現系統中突顯,也必須整理文章的“主題詞”,使之較大可能地與相關學科接近。另外,圖書館發現系統建立在各大數據庫的元數據基礎上,因此,在編輯加工時要特別注意元數據的處理。元數據一般包括文章的題名、摘要、關鍵字、作者、基金以及參考文獻等。注意各名稱在這些位置出現的頻率,頻率越高,相關性也越高;注意各名稱的統一性,以便提高相關搜索結果的排名。
2.4深入了解具有中國特色、期刊特色的讀者閱讀行為
如前所述,現在的可發現行為的研究都是由國外學者開展的,針對的也都是國外的讀者群,這固然對中國的英文期刊拓展海外受眾大有益處,但是我們對中國學者的搜索行為還一無所知,這也會導致國內期刊的發展立于無本之地。并且,國內的學者跟國外的學者的生態環境有很多不同,期刊的推廣環境也與國外期刊大為迥異。我們不能簡單地將國外學者的行為類推至國內。因此,針對不同的期刊,若想提高期刊在國內讀者群中的可見度,還要認真研究以下幾點:1)了解國內學者的搜索行為。由于語言的不同,國內學者的搜索習慣可能會與國外讀者傾向使用Google不同;并且國內的百度學術搜索在中文搜索中確實有可取之處。因此,國內作者是否會更多地使用中文搜索引擎,并且中文搜索引擎的排序算法是否跟Google不同,都是亟待解決的問題。只有掌握國內的本刊目標群體,由此為基點,制定相應文章投放和推廣策略,才能在不丟失國內受眾的基礎上,走向國際。2)深入了解期刊目標群體人口分布及其搜索行為。國外研究顯示,不同的學科,不同的研究階段,學者的搜索行為都會有差異。因此,建立每個期刊的目標群體的側寫,分析專屬本期刊的讀者的行為,為期刊提高可發現性提供最、最基本的數據證據。3)不同的新媒體環境給期刊的可發現性帶來了新的機會。現在的研究中無一例外地都指出越來越多的讀者在搜索文章時會轉向新媒體社交平臺。雖然數量無法跟搜索引擎及圖書館發現系統相比,但仍是一個有吸引力的方向。國內新媒體生態跟國外不同。例如,國內的微信公眾號平臺是很多期刊推廣文章的陣地。如何在了解讀者的基礎上更好地利用這個平臺,以及其他微博、知乎等平臺,也是期刊推廣下一步需要深入研究的方向。現階段,南京航空航天大學學報編輯部下屬3刊均注冊了微信公眾平臺的服務號,定期推送當期目錄、期刊專輯約稿等信息,作者可以在公眾號內查詢投稿文章的進度,讀者可以在公眾號內查閱過刊。這些舉措也要跟讀者搜索行為的調查結合,更深入地挖掘內部信息,以便期刊更好地利用國內新媒體發展的東風,提高期刊文章的可見度。
3.結束語
可發現性的研究是一個由市場催生的新的研究領域。雖然提供了一些十分珍貴的研究結果,比如搜索引擎、圖書館發現系統等的重要性出乎想象,并且對學術期刊提高可見度提供了相應的策略思路;但是仍需要更多國家比如中國,及更多期刊的融入和參與。對于國內的學術期刊來說,展開對本刊受眾的可發現行為的研究,對期刊可見度的提升至關重要。
免責聲明以上文章內容均來源于本站老師原創或網友上傳,不代表本站觀點,與本站立場無關,僅供學習和參考。本站不是任何雜志的官方網站,直投稿件和出版請聯系出版社。