來源:社科學術圈,原載于《編輯學報》2020年第4期
近年來,中國學者每年發表的科技論文有數百萬篇,如何在浩瀚的論文海洋中脫穎而出,吸引讀者的注意力,提高論文傳播力和顯示度,關鍵詞起着十分重要的作用。關鍵詞是能夠明确表達學術論文的主體研究内容或中心思想的詞或詞組,其最初是為了滿足計算機系統編制各種文獻索引的需要而産生。作為文獻檢索的重要依據,關鍵詞應具有專指性、全面性、規範性等特點。但實際情況是,科技論文中存在大量的含義寬泛、無實質内容的無效關鍵詞,如“應用”“分析”“問題”“研究”等等,大大降低了科技論文的檢索效率和傳播效果。此前,已有學者對無效關鍵詞展開研究,但其主要針對高校社科學報論文以及農業科技類論文,針對更廣泛領域内的科技論文中常見無效關鍵詞的計量學研究較少。
為此,本文以中國知網為文獻來源數據庫,結合文獻[3-5]及編校實踐經驗,選取10個科技論文中出現頻率較高、指向性不強、含義空泛的關鍵詞,分别檢索其在2015—2019年發表的科技論文中的出現頻率,分析其年度分布規律及關鍵詞共現網絡。随後分别限定“大學學報”和“學院學報”以及“博士論文”和“碩士論文”(即博士和碩士的學位論文)為文獻來源,對比分析常見無效關鍵詞在不同類型期刊以及不同學曆作者所著科技論文中的詞頻分布。最後分析常見無效關鍵詞産生的原因及應對措施,以期提高科技論文作者和審讀編校人員對關鍵詞标引質量的認識。
檢索範圍和方法檢索範圍:文獻來源限定為中國知網“基礎科學”“工程科技Ⅰ輯”“工程科技Ⅱ輯”“農業科技”“醫藥衛生科技”“信息科技”6類目錄下的期刊、會議、學位論文等(即本文所指科技論文),“大學學報”和“學院學報”,“博士論文”和“碩士論文”;文獻語種限定為中文;關鍵詞限定為“應用”“對策”“問題”“管理”“設計”“措施”“影響”“現狀”“研究”“發展”;發表時間限定為2015-01-01—2019-1-31。
檢索方法:以“關鍵詞 發表時間”“關鍵詞 發表時間 文獻來源”為組合檢索條件,在中國知網6大類科技文獻目錄下進行檢索,獲得各關鍵詞在不同檢索條件下的詞頻分布。為确保檢索結果的有效性,每檢索一次均随機選取若幹篇論文,并核對這些論文中是否包含目标關鍵詞。最後,将所得結果輸入Excel軟件進行統計分析(檢索時間為2020-03-07—03-09)。
無效關鍵詞的定義和分類2.1無效關鍵詞的定義
無效關鍵詞是指詞義寬泛、不能準确傳達論文主題内容、不利于檢索的詞或詞組,或是未經公認的縮寫詞等。它們與論文主題相關性不大,不能反映單篇科技論文的特點,不具檢索價值。
2.2無效關鍵詞的分類
無效關鍵詞的分類目前尚無統一标準。本文根據文獻[3.6]将無效關鍵詞分為以下3類:1)表示國别或地域的泛而不專的名詞,如“中國”“美國”“德國”等;2)“不能表示所屬學科專用概念的不足以反映實質内容的詞”,如“方法”“問題”“試驗”“研究”“分析”等;3)加了限定詞的複雜短語或是未經公認的縮略詞等,如“新型甘藍型油菜品種”“AP”等,它們雖然能反映文章主題,但不利于計算機檢索、識别。
10個無效關鍵詞計量學分析3.1不同年份科技論文中10個無效關鍵詞頻率分布
結合已有研究及編校實踐經驗,本文針對第2類無效關鍵詞展開研究。分别選取“應用”“對策”“問題”“管理”“設計”“措施”“影響”“現狀”“研究”“發展”這10個科技論文中出現頻率較高的無效關鍵詞,限定文獻來源為科技論文,在中國知網進行檢索。10個無效關鍵詞在2015—2019年發表的科技論文中的頻率(以檢索記錄表示)及其累計詞頻(10個無效關鍵詞檢索記錄條數之和與當年發表的科技論文總篇數的比值)分布如表1所示。由表1可見,整體看,不同年度無效關鍵詞頻率分布相對穩定,按檢索記錄數排序,從高到低依次為“應用”“對策”“問題”“管理”“設計”“措施”“影響”“現狀”“研究”“發展”,呈現出明顯規律性。2017年,科技論文發表總量為2017727篇,這10個無效關鍵詞檢索記錄之和達82732條(未排除有2個或多個無效關鍵詞同時出現在同一篇科技論文中的情況),每100篇文章裡就有約4篇文章的關鍵詞裡包含這10個無效關鍵詞之一,可見無效關鍵詞的使用相當普遍。2015—2019年,“應用”這一關鍵詞出現頻率最高,且其檢索記錄在2017和2018年分别達20267和20203條,明顯高于其他9個無效關鍵詞的出現頻率,說明科技論文作者選擇“應用”作為關鍵詞的比例較高。縱向來看,2015—2019年這10個無效關鍵詞檢索條數随年度的變化并無明顯規律性,累計詞頻範圍為3.7%~4.1%,其中2015和2019年的無效關鍵詞累計詞頻均為3.7%左右(表1),說明科技論文作者并未有意地減少無效關鍵詞的使用,無效關鍵詞将會伴随着科技論文作者的寫作習慣而長期穩定地存在。
▼ 表1 2015—2019年科技論文中10個無效關鍵詞頻率及累計詞頻分布
3.2 10個無效關鍵詞共詞分析
共詞分析法是指通過分析共同出現在同一篇文獻中的關鍵詞或主題詞,從而鑒别某一學科知識結構和研究熱點的方法。目前,基于關鍵詞的共詞分析法已被廣泛應用于文獻計量、信息系統、人工智能等領域。
本文以10個無效關鍵詞為研究對象,分析其在2015—2019年共現關鍵詞(即2個關鍵詞同時出現在同一篇文獻中的現象)分布情況,結果如圖1所示。圖1中,2015—2019年10個無效關鍵詞“應用”“對策”“問題”“管理”“設計”“措施”“影響”“現狀”“研究”“發展”的檢索記錄總數分别為94100、50287、41644、37074、34989、30565、26275、23 905、22225和18448條。數據來源于中國知網,本文僅展示頻率排序第1~15的共現關鍵詞。
▼ 圖1 2015—2019年10個無效關鍵詞共詞分析
從圖1可以看出,2015—2019年同一篇科技論文中同時出現2個無效關鍵詞的現象相當普遍。例如,以“問題”為檢索關鍵詞,與其共現頻率最高的關鍵詞為“對策”,共現頻率達15 223(圖1(c)),也就是說,在一篇以“問題”為關鍵詞的科技論文中,有大于1/3的概率會同時出現“對策”這一關鍵詞。分析其餘9個無效關鍵詞的共詞分布情況也可發現,與這些關鍵詞共現頻率較高的往往為無效關鍵詞。例如,按照關鍵詞共現頻率排序,2015—2019年與關鍵詞“應用”共現的無效關鍵詞依次為“發展”“設計”“研究”,共現頻率分别為2188、1878和1642(圖1(a));與關鍵詞“現狀”“研究”“發展”共現頻率較高的幾乎均為“對策”“問題”“應用”等無效關鍵詞(圖1(h)~(j)),可見無效關鍵詞共現網絡不僅不能反映學科知識結構和研究熱點,而且造成了信息資源的浪費。值得一提的是,在本文選取的10個無效關鍵詞排名前15的共現關鍵詞中,有7個共現關鍵詞中出現了“建築”或“建築工程”,這可能與該領域的科技論文發文總量較大有關:以“建築”為主題詞進行檢索,2015—2019年累計發文306196篇,約占科技論文總發文量9890018篇的3%。
3.3不同期刊科技論文中10個無效關鍵詞頻率分布
以本文篩選出的10個無效關鍵詞為檢索條件,同時限定文獻來源為“學院學報”和“大學學報”,檢索得到2015—2019年不同類型期刊發表的科技論文中的10個無效關鍵詞頻率分布及其累計詞頻分布如表2所示。由表2可見,2015—2019年,發表于“大學學報”的科技論文明顯比“學院學報”的科技論文多,但“學院學報”科技論文中無效關鍵詞的出現頻率明顯比“大學學報”科技論文的高。例如,2015年,“大學學報”共檢索到67 598篇文獻,其中以“應用”為關鍵詞的文獻為100條;“學院學報”共檢索到42 620篇文獻,其中以“應用”為關鍵詞的文獻為305條,二者差異顯著。由表2還可看出,2015—2019年,“大學學報”科技論文中的無效關鍵詞累計詞頻分别為0.73%、0.72%、0.69%、0.58%和0.54%,“學院學報”科技論文中的常見無效關鍵詞累計詞頻分别為3.36%、3.34%、2.89%、2.65%和2.56%,二者均随着年度的變化而逐漸降低,呈現出明顯的規律性。同時,“大學學報”科技論文無效關鍵詞累計詞頻明顯比同期“學院學報”科技論文的低,說明前者關鍵詞标引質量比後者的高。
▼ 表2 2015—2019年不同類型期刊科技論文中的10個無效關鍵詞頻率及累計詞頻分布
3.4不同學曆作者所著科技論文中10個無效關鍵詞累計詞頻分布
以本文篩選出的10個無效關鍵詞為檢索條件,同時限定文獻來源為“碩士論文”和“博士論文”,檢索2015—2019年不同學曆作者所著科技論文中無效關鍵詞頻率分布及其累計詞頻(即10個無效關鍵詞檢索條數之和與“博士論文”和“碩士論文”總篇數的比值)分布,如表3所示。
▼ 表 3 2015—2019 年不同學曆作者所著科技論文中的 10 個無效關鍵詞頻率及累計詞頻分布
由表3可見,2015—2019年“碩士論文”總篇數顯著高于“博士論文”總篇數,前者為後者的8.1~10.5倍;同時,“碩士論文”中10個無效關鍵詞出現頻率明顯比“博士論文”的高,如2019年“碩士論文”中以“設計”為關鍵詞的檢索記錄為203條,而“博士論文”中的檢索記錄僅為1條。由表3還可見,2015—2019年“碩士論文”中的無效關鍵詞累計詞頻明顯降低,分别為10.43‰、8.84‰、8.32‰、6.93‰和5.32‰,與2015年相比,2019年“碩士論文”無效關鍵詞累計詞頻降幅達48.9%。2015—2019年“博士論文”中的無效關鍵詞累計詞頻整體上也呈下降趨勢,分别為2.39‰、1.70‰、1.71‰、1.57‰和1.40‰,5年間“博士論文”無效關鍵詞累計詞頻降幅達41.4%。同時,“博士論文”中無效關鍵詞累計詞頻明顯比同期“碩士論文”中的低,說明無效關鍵詞的出現頻率與論文作者學曆有一定關系。
10個無效關鍵詞出現原因及應對措施4.1 10個無效關鍵詞出現的原因分析
綜合分析結果可知,雖然在2015—2019年博士和碩士作者群體已逐漸減少無效關鍵詞的使用,但是在2015和2019年發表的科技論文中,這10個無效關鍵詞累計詞頻并無明顯變化(約為3.7%),說明無效關鍵詞存在此消彼長的現象。本研究認為無效關鍵詞出現的主要原因包括以下幾個。
一是多數科技論文作者未接受有效的指導,不知道如何撰寫合适的關鍵詞。有研究表明,多數高校學生承認自己未接受過系統的科研寫作訓練。屈李純等針對328名碩士研究生展開調研,發現僅有17.39%的研究生熟悉關鍵詞的選取。其實早在1987年,我國GB/T 7713—1987《科學技術報告、學位論文和學術論文的編寫格式》明确規定:每篇論文應選取3~8個詞作為關鍵詞,如有可能,盡量用《漢語主題詞表》等詞表中提供的規範詞語。2019年,國家新聞出版署發布了針對關鍵詞的行業标準CY/T 173—2019《學術出版規範關鍵詞編寫規則》,其中闡述了關鍵詞的定義和基本要求。遺憾的是,高等院校中有關科技論文寫作的課程和培訓仍然較少,很多作者甚至從未聽說過《漢語主題詞表》,其他企事業單位中的作者接觸到最新的标準、規範、寫作培訓和指導的機會更少,這也就導緻了低質量科技論文和無效關鍵詞的穩定存在。例如,在未包括“質量”“分析”“技術”“原因”等無效關鍵詞的情況下,2015—2019年,僅本文選取的10個無效關鍵詞檢索記錄總數達381 295條;進一步分析這些無效關鍵詞的累計詞頻可發現,其整體呈先增加後降低的趨勢,但變化幅度不大,可見科技論文作者使用無效關鍵詞的現象依然普遍。
二是部分作者未從思想上重視關鍵詞對于論文檢索的重要作用。有些中文科技論文作者隻在乎論文是否能發表,是否能助其拿到學位或晉升職稱,而對論文的關鍵詞标引質量以及論文發表後的學術影響并不關心,這就導緻科技論文中存在大量無檢索價值的關鍵詞。進一步分析圖1還可以發現,作者在選取關鍵詞時,往往隻是根據刊物要求,簡單地将論文題目拆分為3~8個關鍵詞,而未仔細鑒别這些關鍵詞是否能夠準确地反映該篇論文的特點,導緻同一篇論文中無效關鍵詞共現的情況也相當普遍。例如,2015—2019年篇名中同時含“應用”和“研究”的科技論文檢索記錄達199841條,篇名中同時含“影響”和“研究”的科技論文檢索記錄達128358條,這也反映了部分作者從論文标題中選取關鍵詞的随意性。
三是論文審讀編校群體(包括論文指導教師和同行評議人員)把關不嚴。目前,仍然有相當一部分的編校人員秉持着“改錯不改好”的理念,在審讀科技論文時僅僅關注變量符号和單位使用不規範、圖表和公式編排不合理等,而針對論文關鍵詞等能體現文章亮點的内容就抱着無所謂的态度,雖然也是“為他人做嫁衣裳”,但難免有不夠走心之嫌。例如,2015—2019年來源于“學院學報”的科技論文總數為180674篇,其中10個無效關鍵詞的累計詞頻為14.80%;而來源于“大學學報”的科技論文總數為322564篇,其中10個無效關鍵詞的累計詞頻為3.26%(表2),前者累計詞頻約為後者的4.5倍,可見“學院學報”的編校群體對關鍵詞的标引質量控制嚴格程度比“大學學報”編校群體的低。同時,高等院校教師忙于申請項目、開公司,疏于指導學生進行學術研究及寫作的現象依然存在,論文作者因學術不端而被撤稿或是撤銷學位的報道也屢見不鮮,可見高等院校中部分導師和同行評議人員對學生學術論文的主體内容審讀尚不夠仔細,遑論論文中的關鍵詞了。例如,2015—2019年“博士論文”總數為116093篇,其中10個無效關鍵詞的累計詞頻為8.78‰;而“碩士論文”總數為1016061篇,其中10個無效關鍵詞的累計詞頻為39.84‰,後者約為前者的4.5倍(表3),可見“碩士論文”的審讀群體對關鍵詞的标引質量控制嚴格程度比“博士論文”審讀群體的低。
4.2無效關鍵詞的應對措施
我們認為降低科技論文中的無效關鍵詞出現頻率的措施主要包括以下幾個方面。
一是進一步加強對科技論文作者的指導與培訓。這就要求高等院校、各科技期刊編輯部以及其他企事業單位形成合力,建立合理的培訓機制,定期開設寫作課程或開展寫作培訓,對作者進行系統而全面的科技論文寫作訓練,使其加深對論文結構、論文要素、論文寫作标準及規範的認識,提高綜合寫作能力,減少論文無效關鍵詞的選取。例如,吉林大學《中國獸醫學報》編輯部針對科技論文寫作者開展“移動課堂”網絡教學,取得了較好的效果。
二是科技論文作者應從思想上重視關鍵詞對于文獻檢索的重要作用,同時在操作上嚴格執行關鍵詞的編寫規則。作者應充分認識到關鍵詞是科技論文檢索的信息點,是表達論文主要學術觀點的關鍵性因素,在論文寫作中應避免使用無效關鍵詞。CY/T 173—2019規定:關鍵詞編寫一般包括論文審讀、主題分析、選詞和編排;關鍵詞應準确并充分揭示論文主題内容,重要的可檢索内容不應遺漏。科技論文作者根據編寫規則選取适宜的關鍵詞後,還應以讀者的身份進行反推:要檢索這一研究領域的科技論文,是否會選擇這樣的關鍵詞?合理、科學地标引關鍵詞有助于提升文獻利用率。
三是論文審讀編校群體需對無效關鍵詞進行嚴格把關。關鍵詞能夠反映期刊研究熱點和發展方向,關系着期刊的學術質量。論文審讀編校群體應重視關鍵詞的标引工作,選取合适的關鍵詞有利于學術文獻的有效傳播和充分利用,從而有助于提高論文和期刊的學術影響力。例如,已成功入選“中國科技期刊卓越行動計劃梯隊期刊”的《中南大學學報(自然科學版)》嚴把期刊學術質量關,2015—2019年共發表論文2 385篇,其中10個無效關鍵詞的出現頻率為0;而《湖南城市學院學報(自然科學版)》同期共發表論文933篇,其中10個無效關鍵詞的檢索記錄為68條,累計詞頻達7.3%。可見,論文審讀編校群體在關鍵詞的标引質量控制過程中發揮着重要作用。
結束語在科學技術日新月異的今天,通過關鍵詞檢索相關研究領域的最新文獻早已成為科研工作者最常用的檢索方式之一。一方面,科技論文作者應主動學習科研寫作标準和規範,參加科研寫作課程學習或培訓,根據論文主題選取恰當的、指向性強的關鍵詞;另一方面,作者和審讀編校人員都應從思想上重視關鍵詞的标引,進一步加強對關鍵詞标引質量的控制,避免使用無效關鍵詞,以期實現科技論文快速而廣泛的傳播,提高科技論文的檢索利用率和學術影響力。
▷本文來源中國知網,載于《編輯學報》2020年第4期,原題《科技論文10個無效關鍵詞計量學分析》。
▷引文格式:伍錦花,陳燦華.科技論文10個無效關鍵詞計量學分析[J].編輯學報,2020,32(04):403-408.
▷本文為節選,為閱讀及排版便利,本文删去了注釋與參考文獻等内容,敬請有需要的讀者參考原文。
▷作者:伍錦花,陳燦華老師,《中南大學學報(自然科學版)》編輯部。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!