生命系学生のゲノム解析覚え書き

大抵インフォ、時々バイオ、稀にアグリな日記

選ばれるのには理由がある

お久しぶりです。最近は応用情報技術者試験の対策だったり細胞の分子生物学(鈍器)と格闘したりしてました。

ダメもとで応募してた基生研の情報解析講習会の選考通ったので、NGS解析もまた本腰入れてやっていこうと思います。

ということでRを学んでおります。Rを学んで思ったこと。

 

いやあ、Rって便利!

 

Pythonじゃ必要なパッケージを呼び出して、テキストファイルを読み込んで、またさらに別のパッケージを呼び出して、matplotlibでもいちいちxとyを指定して、メソッド使って要素追加して、、、とするのをRじゃ2、3行で終わってしまう。

あとRのデータ構造が表形式(行列)に適しているからわざわざNumpyとか使わんでも操作が直観的にわかる。

バイオ系でRばっかり使われているのにはちゃんと理由があるんですねー、という感じ。plotで一発で図形描いてくれるなんてありがたすぎるんですよね。

 

ということでRの使いやすさに感動しているこの頃です。もちろんPython機械学習、深層学習が非常に得意な言語なので、データ解析の最先端では使っていくことにはなると思うけど。scikit-learnとかね。でもpythonはやっぱりcsvとかテキスト形式にあんまり適応してない。RはBioconductorに代表されるように、そういったデータ処理する人々向けにわかりやすく作られているので、そりゃR使った方が効率いいよな。

 

Rの勉強は基生研のGithubとか久保緑本生態学データ解析 - 本/データ解析のための統計モデリング入門 (kuboweb.github.io)を使ってやってます