FASTQ格式是一種文本形式的格式,主要用于保存核酸序列和測序質量。序列和質量都用ASCII編碼來表示,是目前的高通量測序結果的标準。
序列編号和描述信息,用@開頭
序列,包括ATGC和N
以加号開頭,是序列标示和描述
質量信息,與第二行的序列對應
質量評分是一個堿基錯誤概率的對數值,質量得分和錯誤概率關系在下列表中:
Phred 質量分數
堿基錯誤概率
序列準确性
10
1 in 10
90 %
20
1 in 100
99 %
30
1 in 1000
99.9 %
40
1 in 10000
99.99 %
比如我們常說的Q30,就是指的質量分數在30分以上,就是序列準确性在99.9%以上的堿基在測序數據中的比例。
之前我們分享了SAM格式,回顧:生信必會的SAM格式,該怎麼看?如果文章對你有所幫助,請轉發給你身邊需要的人噢!如何用Pathview畫出高大上的基因與代謝通路熱圖?
使用PAML計算選擇壓力
測序數據到手後,如何高效的進行質量統計?
用DOGMA對葉綠體或線粒體基因組進行注釋
對物種祖先形态進行重建,專業級的Mesquite也太好用了
如何使用CAMERA對代謝物加和峰進行注釋
關注我Get更多科研小工具!!!
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!