原創 eryun 雲生信學生物信息學 關注我們
01✦✦常規篩選
在GEO數據庫搜索所需數據集的時候,條目太多,一個個點進去篩選耗時耗力,效率不高。
通常我們可以通過geo界面左右兩側給的一些選項進行篩選
數據記錄類型:atasets、series、samples和platforms
選擇來源物種
測序平台:DNA、mRNA、SNP、甲基化等等
限定作者
限定樣本類型
限定數據上傳時間
02✦✦檢索式搜索
上述是網上經常提到的篩選方法,但今天我發現一個有意思的地方,感覺可以探索一下
當我以“undifferentiated carcinoma”為關鍵詞進行搜索時
它右側輸入框顯示"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]
當我們點擊See more出現以下界面
Query Translation這裡提示我也可以在GEO使用檢索式進行檢索
針對"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]這一命令進行解讀
它是在關鍵詞MeSH Terms中對carcinoma進行精确搜索,OR 或 ,在所有字段[All Fields]中搜索undifferentiated carcinoma。
而我們在搜索框中輸入的undifferentiated carcinoma,我是想對undifferentiated carcinoma進行一個精确的搜索,通常使用雙引号””便可進行精确搜索
我們可以看到在進行精确搜索前我們得到了238298條數據,而精确搜索後就隻有64條數據,有量級的差别
這也說明了我們是可以在GEO數據庫使用檢索式進行搜索
而我們也可以使用All Fields,Title,MeSH Terms,Description這些限定檢索字段
上圖顯示[Description]是被正常識别的
當然一些常規的符号也是能識别的,比如:
“|”或——并行搜索、
“-”非——消除無關性、
“ ”加号 —— 強制包含關鍵詞
這裡|就被識别為了OR,當然你也可以直接輸入OR。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!