投稿

12月, 2014の投稿を表示しています

RefSeqのばーじょんというものに苦しんだ話

研究のときに遺伝子アノテーションはRefSeqとEnsemblを使っています。

そのうちRefSeqはucscの方でそれぞれのゲノムに対してRefSeqをマッピングして、
ポジション情報を含んだrefGene.txtというファイルがgoldenpathで提供されています。


一方RefSeqのデータベースでは種を大まかにわけたfastaファイルによってcDNA情報が保管されています。


成績発表

応用情報の結果が発表になりましたー。



Rでボックスプロットの順番を固定する

factorを数字で入れると辞書順にされてしまうので
data$variable <- factor(data$variable, levels = c(0:dim(data)[2], ordered = TRUE)
とすると、挿入したそのままでplotしてくれる(๑´ڡ`๑)
ついでにカラムごとにグループわけされているdata.tableをdata.frameに変換して boxplotするスクリプト。 ハイパーめんどくさいのでtableからそのままできるようにして欲しいものです。
(普段手抜きでpngで作っていることがばれる...)



Golangでシークエンスロゴ

名付けて
seqLoGo

(まんまだ)



必要が生じたので作ってみました。

https://github.com/carushi/seqLoGo


塩基頻度・GC含量を出力したり
あとはWebLogoに投げられるサイズまで配列を圧縮する機能があります。
詳しくはREADMEを参照!


モチーフの画像を出す部分も書いてしまおうと思ってpostscriptいじってますが、
文字をたてにのばすのが思いのほか大変そう。。


今年中にとりあえずのところまでできたらいいかな!



githubってついコミットしまくっちゃうんですけど、
本当は一回一回のコミットをもっと丁寧にやらないといけないんですよね。。

私には無理だ(๑´ڡ`๑)

Beamerで背景変更&白文字

イメージ
Beamerをかっちょよくするために、背景画像セット&基本文字を変更しました。

背景変更
プリアンプルに

¥setbeamertemplate{background}{
    ¥includegraphics[width=¥paperwidth,height=¥paperheight]{test.eps}}
を追加。
ずっとpng画像を追加しようとしていてなんで入らないんだろう?と思ってました。

基本文字変更
プリアンプルに
¥setbeamercolor{whitetext}{fg=white}
を追加しておき、スライドごとに
¥begin{center} { ¥usebeamercolor[fg]{whitetext} テキスト } ¥end{center}
とやれば完了。 見出しの色の変え方なんかはわからず。。 カラーテーマをアルバトロスでやれば問題なく読めるのですが。
ともかくこれでシャレオツビーマーの完成です(๑´ڡ`๑)


Ensemblのダウンロード

wgetはアカウント承認がうまくできず、
FTPだとまったく動きやがらないので調べていましたら
rsyncは使えるそうなので


rsync -av rsync://ftp.ensembl.org/ensembl/pub/current_embl/homo_sapiens/ .

これでやったらなんとか進みました。
ucscのダウンロードはすごく快適なのに! APIがいっぱいある分、一括ダウンロードは不便でした(´;ω;`)ブワッ