火曜日, 1月 26

Rで数える







最近、自分の話をしすぎた感があるので、解析で直面したRのお話をひとつ・・・。


上のデータは、遺伝子の発現量の値だと思って下さい。cont1-3はコントロール飼育、exp1-3は実験処理をした個体です。データは、コピペコマンド(x<-read.delim("clipboard") #windonws)で、持ってきました。実際は5万データとか扱うので、データ読み込みは、data.tableパッケージのfreadとかを使います。


何がやりたいか?

遺伝子が重複していないか調べたいんです。
→UCSCでもensembleでも、ダウンロードしたデータの遺伝子名に重複があることがあります。IDは違うんだけど、遺伝子名は同じなのよ、みたいな。

で、plyrパッケージのcountコマンドを使って、重複している遺伝子があるのか数えてみたわけです。



ふむ。なるほど。この場合、gene4-8に重複があったのだな。


で、いろいろ検索していたら、plyrパッケージ後続に、dplyrパッケージというのがあるらしくて、へーと思って、インストールしようとしたら・・・・。

パッケージ→パッケージのインストール・・・、で、示されるパッケージの中にdplyrがない(苦笑)
仕方がないので、手動で入れようとしたら、


 警告メッセージ: 
package ‘dplyr’ is not available (for R version 3.1.1) 




あれっ?
うちのRが古かったのねん・・・。


というわけで、うちのR3.11をR3.23にアップグレードしました。


まずは、installrパッケージをインストール(→そこからかい・・・)。
インストールするために、パッケージ→パッケージのインストール→リストからinstallrを選ぶ。

で、

library(installr)

で、読み込み。

updateR()

で、アップグレードしてもらう。


再起動などなどがあって、R3.2.3が立ち上がったら、dplyrパッケージのインストールに再チャレンジ。
再々再で、インストール→インストールするパッケージ・・・・で、dplyrを選ぶ。
インストールが完了するのを待って、

count関数。





ありゃ?りゃ?
いや、ワタクシはそういう答えは、求めてない・・・・。
--;)

同じ関数でも、パッケージが違えば、使い方も違うのか~・・・、いや、でも、後続のパッケージって話なのに。こんなちょっとしたことでごねるとは。


ぶつぶつ言ってもしょうがないので、カウントしたい列名の""を消してみた。





そうこれ。それぞれの遺伝子のデータ数を数えてほしかったの。

どうやら、dplyrの場合は、カウントしたい列名を""でくくる必要はないみたい。
マニュアルを読めば、分かったことなんですが、だって、ねぇ。





ちなみに両方のパッケージが入っていると、count(x,gene) のコマンドでは
”geneなんてオブジェクトはないけど?”的エラーが出てしまいます。


count(x,"gene")の方であれば、先出のリストを返してくれます。


ふぅん。

plyrとdplyrはどちらかをインストールしていれば、ことたりると思うのですが、もしかしたら、この関数のようにちょいちょい使い勝手が違う可能性があるよ。


コピペでRを使いこなす者は、オリジナルの方がどちらを使っているかに、左右されてしまい・・・・


解析をつらつら続けていると、読み込んだライブラリのことなんて忘れている頃に、なんでこんな簡単なところでエラーが出るのか、3日くらいわからない・・・という、哀しい目にあうんですよ。

しくしく。
T_T)

るまんどの消えた3日が、どなたかの糧となりますように。



最初に出てきたdata.tableパッケージのfreadについては、こちらなど。
https://oku.edu.mie-u.ac.jp/~okumura/stat/datatable.html


読み込むデータサイズが小さいならこちらのコピペコマンドを参考に
(Macとwinでコマンドが違うことに注意して下さい)
http://riseki.php.xdomain.jp/index.php?R%E3%81%A7%E3%82%AF%E3%83%AA%E3%83%83%E3%83%97%E3%83%9C%E3%83%BC%E3%83%89%E3%81%8B%E3%82%89%E3%83%87%E3%83%BC%E3%82%BF%E3%82%92%E8%AA%AD%E3%81%BF%E8%BE%BC%E3%82%80


ちなみに元素手帳の今週の異人の言葉は、

「私たちが相手にしているのは、無限なんだからね。ポール・エルディッシュ」

ポール、ちょっとおねぇ言葉・・・?
ポール・エルディッシュは数学者オイラーに次ぐ、論文数の多さで有名です。
エルディッシュ数、いいなぁ・・・。たとえ1るまんどあっても、別にたいした名誉ではないもんね。

http://dic.nicovideo.jp/a/%E3%83%9D%E3%83%BC%E3%83%AB%E3%83%BB%E3%82%A8%E3%83%AB%E3%83%87%E3%82%B7%E3%83%A5

0 件のコメント:

コメントを投稿

けものドラマ見てます。

ええと、研究と関係のない話です。 ドラマを見ています。 2018年12月現在。 獣になれない私たち。 もう、好きだ!というしかない。 松田龍平も新垣結衣も。好きな役者さんで。田中圭も黒木華も! 全然、スパッと行かない展開も、ものすごいリアルで鳥肌が立ちます。...