CiteSpace是陳超美教授使用Java語言開發的一款信息可視化軟件。它着眼于分析科學分析中蘊含的潛在知識,并在科學計量學,數據和信息可視化中有着重要的用途。
CiteSpace:引文空間是一款眼着與分析科學分析中蘊含的潛在知識,是在科學計量學、數據可視化背景下逐漸發展起來的一款引文可視化分析軟件。由于是通過可視化的手段來呈現科學知識的結構、規律和分布情況,因此也将通過此類方法分析得到的可視化圖形稱為“科學知識圖譜”。(摘自 李傑.CiteSpace中文版指南) 對于我個人而言,學習使用CiteSpace的目的是快速了解所研究方向的“論文圖譜”,被引用數是論文是否優質的重要标志,故通過論文引用圖譜,我可以知道哪些論文是優質的,哪些論文是具有開創性的,并且具有開創性質的論文一般不會那麼複雜,較容易理解,為日後學習打基礎。
一、數據分析關鍵步驟1、運用盡可能廣泛的專業術語來确定所關注的知識領域。這是為了所得到的結果盡可能地涵蓋所關注領域的全部内容。該步驟要求用戶對自己所關注的領域比較熟悉。在此前提下用戶才能确定出合理的術語,以及需要重點關注的術語問題。2、收集數據。在上一步确定好要檢索的術語以後,接下來則要選擇數據庫來獲取所要分析的 數據。當前CiteSpace所分析的數據類型基礎是Web of Science格式,從Web of Science中下載的數據,CiteSpace可以直接讀取和分析,從其他數據庫所收集的數據則要通過轉換器進行格式轉換才能進行分析。該步驟對用戶的信息檢索素質要求比較高。因此,具備一定的信息檢索技能以及檢索技巧是必須的。
3、提取研究前沿術語。從數據庫文獻的題目、摘要、關鍵詞、系索詞和表示符中檢索N元文法或專業術語,出現頻次增長率快速增加的專業術語将被确定為研究前言術語。4、時區分割。在CiteSpace中需要明确要分析的時間跨度以及這個時間跨度的分段長度。5、阈值的選擇。CiteSpace允許用戶使用7種方法來設定阈值。6、網絡精簡和合并。在CiteSpace中提供兩種網絡精簡算法,分别為Pathfinder和MST。在對數據進行初始分析時,一般不做任何精簡。通過初步得到的結果,再決定采用何種精簡方法。
7、可視化顯示。CiteSpace的标準視圖(默認)為網絡視圖,此外還有Timeline(時間線圖)和Timezone(時區圖)視圖。8、可視化編輯和檢測。得到圖譜之後借助CiteSpace可視化界面提供的網絡可視化編輯功能美化圖形,也可以利用提供的網絡計算功能對網絡進一步分析。9、分析結果的驗證。使用CiteSpace得到分析結果後需要與熟悉本專業學者、專家進行溝通。特别地,建議對網絡中突出的關鍵節點的作用進行咨詢。
二、分析結果的解讀CiteSpace的核心功能是産生由多個文獻共被引網絡組合而成的一種獨特的共被引網絡,以及自動生成的一些相關分析結果。每個文獻共被引網絡對應于一個曆時一年或幾年的時間段。最終顯示的網絡不是各個網絡之間的簡單疊加,而是要滿足一些條件。解讀這樣的遞進式知識領域分析的要點包括:網絡整體結構、網絡聚類、各聚類之間的關聯、關鍵節點(轉折點)和路徑。解讀時可以從直觀顯示入手,然後再參照各項指标。1、結構。是否能看到自然聚類(未經聚類算法而能直觀判定的組合),觀察通過算法能得到幾個聚類,是否包括一些重要的節點,如轉折點(Pivot node,再CiteSpace中為有紫色外圈的節點,是具有高的中介中心性的節點)、标志點(Landmark node,如每個節點大小代表它的總被引次數,節點越大則總被引頻次越高)和具有高的度中心性的點的(Hub node,樞紐節點,具有高的度中心性)。
2、時間。每個自然聚類是否有主導顔色(出現時間相對集中),是否有明顯的熱點(節點年輪中出現紅色年輪,即被引頻率是否曾經或仍在急速增加),通過各個年輪的色彩可判斷被引時間分布。時間線顯示将每一聚類按時間順序排列,相鄰聚類常常對應相關主題(聚類間共引)。聚類之間的知識流向也可從時間(色彩)上看到(由冷色到暖色)。
3、内容。每個聚類的影響(被引時涉及到的主題,摘要,關鍵詞)和幾種不同算法所選出的最有代表性的名詞短語。4、指标。每個聚類是否具有足夠的相似性(Silhouette值是否足夠大,太小則無明确主題可言),整個聚類是否有足夠節點。
(學習資源來自網絡,侵删)
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!