Error: qual length () differs from seq length () for fastq record !
CAGE-seqのマッピングをするときに、
Cutadapt, rRNAdust, removeNをかませるとたまに長さがあわない配列や、クオリティスコアのない配列が混ざってきて、結果タイトルのエラーに出くわす。
しかもなったりならなかったりして大変困るので、長さがあっている配列(とスコア)だけ抜き出すワンライナーとスクリプトを書いたのでおいておきます。
check_read.pyを保存して、ターミナルにcheck_qs.shをぺたっとしてくだし。 @SRRから始まる4行を抽出して、長さが違うものはpythonスクリプトで捨てます。 SRRXXXXXX_extracted.fastqが訂正されたfastqファイルになる予定です。
Cutadapt, rRNAdust, removeNをかませるとたまに長さがあわない配列や、クオリティスコアのない配列が混ざってきて、結果タイトルのエラーに出くわす。
しかもなったりならなかったりして大変困るので、長さがあっている配列(とスコア)だけ抜き出すワンライナーとスクリプトを書いたのでおいておきます。
check_read.pyを保存して、ターミナルにcheck_qs.shをぺたっとしてくだし。 @SRRから始まる4行を抽出して、長さが違うものはpythonスクリプトで捨てます。 SRRXXXXXX_extracted.fastqが訂正されたfastqファイルになる予定です。
コメント
コメントを投稿