投稿

4月, 2016の投稿を表示しています

Error: qual length () differs from seq length () for fastq record !

CAGE-seqのマッピングをするときに、 Cutadapt, rRNAdust, removeNをかませるとたまに長さがあわない配列や、クオリティスコアのない配列が混ざってきて、結果タイトルのエラーに出くわす。 しかもなったりならなかったりして大変困るので、長さがあっている配列(とスコア)だけ抜き出すワンライナーとスクリプトを書いたのでおいておきます。 check_read.pyを保存して、ターミナルにcheck_qs.shをぺたっとしてくだし。 @SRRから始まる4行を抽出して、長さが違うものはpythonスクリプトで捨てます。 SRRXXXXXX_extracted.fastqが訂正されたfastqファイルになる予定です。