生命系学生のゲノム解析覚え書き

大抵インフォ、時々バイオ、稀にアグリな日記

samtoolsの使い方色々

samtoolsの使い方をまとめます #インストール 基本的にはcondaを使ってインストールするのが良いです。 condaはOSを考えなくていいし、何よりウェブサイトに飛ばなくてもいいうえにコンパイルしなくて良い。 コンパイル時に必要なツールがイモ蔓式に出てきて…

RNA-seqアセンブリについて

年度初めということでまた書き始めようと思います。いつまで続くのでしょうか。 さて、これまでひたすらゲノムが読まれていないニッチな生物でRNA-seq解析を行っていました。 流れとしては図の通り。多分ゲノムが読まれていない生物でのRNA-seq解析で一番困…

久保緑本 レビュー

久保緑本読み終わりましたー 日曜日の集中力が地に堕ちていたので結局月曜日までかかってしまった。 まあ自分の今やっている分野にはあまり必要はないかなー、という感じだった。Rの勉強がてらとか言ってたけどRは別の本で勉強してから読んでね、とのことで…

選ばれるのには理由がある

お久しぶりです。最近は応用情報技術者試験の対策だったり細胞の分子生物学(鈍器)と格闘したりしてました。 ダメもとで応募してた基生研の情報解析講習会の選考通ったので、NGS解析もまた本腰入れてやっていこうと思います。 ということでRを学んでおりま…

やっぱりLinux

自分で機械学習させることもないのでしばらくPythonは趣味にとどめておくことにする。ただ機械学習自体は、さらに深層学習自体は何らかに使いたいという願望はあるので、継続はする。 バイオ系でPython使えるイメージがまだまだないので、今後新しいツールが…

RNA発現解析

次にマッピングしたデータを処理する。 参照配列の塩基にどれだけのリードがあったかを集計・整理する。リードを集計・整理できたら(リードカウント数として確認出来たら)そのカウント数をTPMなどで補正してそれぞれの出現量とする。 さらに出現量の違いを…

ubuntuでAnaconda3を入れた話

はい、とうとうubuntuでAnaconda3を入れました。 別にubuntuではAnacondaの縮小バージョンminicondaでいいかな、と思ってたけど、minicondaからだとどうもpythonがバージョン2しか稼働しないぽく。。。 するとpython3以降からのみ対応しているパッケージが全…

ついにubuntuに移行した

これまでjupyternotebook便利すぎてwindows環境にこだわってたけど明らかにLinuxのが使いやすいしwindows対応してないパッケージ多すぎるしで結局RNAの発現解析調べるのはubuntuでやることにした。 BashもLinuxのが整ってるし。 まずBiocondaをインストール…

numpy np.r_/np.c_の使い方

numpyのnp.r_とnp.c_が便利そうだったのでまとめます。 下の記事の内容まんまです。 多次元配列の結合を行うオブジェクトnp.c_とnp.r_の使い方 - DeepAge 配列を結合したい際、次元数が違う時がある。そこでnp.r_を使えばちがう次元でも結合可能。 数値の文…

WindowsからGraphviz利用

Graphvizを使うのに手間取ったので覚え書き。 決定木を書こうと思い、pydotplusを使いデータの読み込み、pydotplus内のgraphvizでデータの書き出しをしようとしたがここでエラー。 graphに決定木の学習データclfを入れてgraph.write_png('DecisionTree.png')…

IGVの使い方

IGVの使い方について少し。 pythonのigv Jupyter Extensionを使えばどうやらpythonでも使えるらしいけど、リファレンスゲノムが多分サーバー上にあるやつしか使えないんじゃないかな。ということでサーバー上にない生物種を使うために結局アプリをインストー…

BioPythonまとめ その2

その1が長くなったのでその2です。 ~NGS処理ツール~ まずはおなじみSAM・BAMファイルからの抽出をpythonでもやってしまおうというもの。できるんですね。Linuxでやると調べるのに苦労するからpythonで実装してくれていてとてもありがたい。ちなみにこいつ…

getattr使い方

もう完全にpythonのことしか書いてない・・・(笑) getattrで苦戦したので書き残しておく。 問題のコードは下。recordはオブジェクト。 for u in dir (record): if u[0] != '__' : print(u,getattr(record,u)) これが意味わからんかった。record内の属性をd…

Biopythonまとめ その1

日記風に書いていたが、BioPythonの難易度がpython初心者にとって高いので、これはまとめ用の記事。備忘録。じぶんのレベルが上がるにつれて適宜更新していきます。 ちなみに参考した本はオーム社の「Pythonによるバイオデータ・解析入門」山内長承著である…

Linux環境はじめました

さすがに入れなきゃなあということでubuntu使ってLinux環境にしました。早速samtools入れようと思ったが、unable to locate packageてでてきて、apt アップデートすればいんじゃねと思ったら次はaptのアップデートもファイルがロックされてますやらなんとや…