RefSeqのばーじょんというものに苦しんだ話
研究のときに遺伝子アノテーションはRefSeqとEnsemblを使っています。 そのうちRefSeqはucscの方でそれぞれのゲノムに対してRefSeqをマッピングして、 ポジション情報を含んだrefGene.txtというファイルがgoldenpathで提供されています。 一方RefSeqのデータベースでは種を大まかにわけたfastaファイルによってcDNA情報が保管されています。
生物と無生物の狭間でプログラミング