金曜日, 8月 30

tcsからigraphへ、だけど。

 本日の業務は、Tcsで作ったgmlファイル(でも拡張子は、graph)を、R(igraph)に読み込ませ、ラベルとか、ノードの大きさとか、エッジとかを自由にすること。


結論から申しますと、
Rには読み込めた!v(^^)


・・・しかし自由にはならない・・・というところです。


昨日は、読み込みすらできなかったので、まぁ、進展したってことですかね。

ファイルが読み込めなかった原因は、おかしな小細工をしていたことで、
小細工しないで、ファイル名の拡張子がgraphのままで、read.graphを使って、ファイル形式はgmlにすればよかったのだよ、ということでした。



はぁぁぁ~。これで、すんなりデータを読みこんでくれました・・・。



くれました?

・・・じつは、くれてなかった。
(T_T)

何を読み込んでくれたのか、”属性”を確認したら、

list.graph.attributes(g)
#この場合返された結果:character(0)

list.vertex.attributes(g)
#この場合(ノードの属性)返された結果:"data"      "id"        "label"     "graphics"  "vgj"   "label.cex" "size"      "color"     "shape"

list.edge.attributes(g)
#この場合(エッジの属性)返された結果:"linestyle" "label"     "data"      "color"     "width"


え?ってかんじ。
Tcsでできていた”frequency”とか、” Weight ”とかはどこね?
o(゚Д゚ = ゚Д゚)o キョロキョロ?

・・・ない。読み込めてない。
しかも、"label.cex" "size"      "color"     "shape"はRのデフォルトの数値が入っていると思われる。

さらに、vgjの中身は、””だけ、とか。


なんじゃこりゃぁ~

ヽ(`Д´#)ノ ムキー!!


うちのつつましい願いは、かなえてもらえないようです。
(・頻度に応じて、ノードの大きさを変えたい、グループごとにノードの色付けを変えたい)

いや、手打ちすれば、いーんですけどね。
しかしだね、40近くもノードがあるのに、手打ちするの?
エクセルの検索と置換とソート機能を駆使して、データを作り直すのかぃ?

・・・それは~、Rの利便性に反する、ちゅうーか、るまんどエラーが大頻発すると思われる。


とほほほほ。


そんな中でも、いろいろお世話になったHPを今日もご紹介いたします。

igraphのグラフオブジェクトの解説。とても親切です。
http://d.hatena.ne.jp/Rion778/20100406/1270553715

昨日紹介した竹本さんの解説をさらに、別の方が噛み砕いた感じの内容。
http://deta.hateblo.jp/entry/2013/05/01/053426

igraphのコマンド例。これ、これ。るまんどの場合は、これだったようです。
http://sphericalharmonics.blog110.fc2.com/blog-entry-13.html



ん~、igraphで、どこまで粘ればよいのだらおう?
( ´Д`)=3 フゥ





木曜日, 8月 29

お絵描きがうまくできなくて、

今日の業務は、Tcsで描いたネットワーク図を美しくすること。

・・・しかし、できませんでした、というのが今日の報告です。
(T_T)


Tcsで描いたネットワーク図を美しくするにはCytoscopeというソフトを使えばよいらしいのですが、このような(自分にとって)未知のソフトに手を出すよりも、R(igraph)でできたほうが、かっこいいかもという色気が出まして、いろいろ試してみたのですが、・・・できませんでした。

ま、まったく最初の、TcsでOUTPUTされるgraph拡張子のファイルを、Rで読み込めないという現象が解決できないのでございます。

「拡張子はgraphだども、そもそもはgml形式だから」とTcsの説明書にあるので、んだらば、拡張子を書き換えればいいだけじゃんと思って、

拡張子をちょいちょいっと変えてRに読み込ませようとしたのですが、「いや知らんし、こんなファイル。ってゆーか、フォーマット違うと思う」というエラーが出てしまうのです。

OrL

あの~、これは、gmlと違うのですか?
マニュアルからとんだHPに記載されていたexampleをみる限り、違わないと思うのですよ?


とんと、わかりかねる。

( ゚д゚ )


そんな中でも、本日お世話になったHP

igraphのことがかなり詳しく載っています。スライドショーへのリンクもあります。
https://sites.google.com/site/kztakemoto/r-seminar-on-igraph---supplementary-information

gmlファイルのこと
http://www.fim.uni-passau.de/en/fim/faculty/chairs/theoretische-informatik/projects.html

水曜日, 8月 28

網はかけても・・・。

今日の業務実績をご報告。

TCSでハプロタイプネットワークがかけました!
やったね!
v(^^)v

とにもかくにも、原因は、phyファイルやNEXUSファイルが、Tcsの読めるように書けない、ということでした。原因と解決法の覚書は、以下。

・塩基数が間違っていた→
 なんでか、MEGAで確認した塩基数や、phyで書きだされる塩基数が間違っていて、結局、ワードでカウントした文字数を入れたら、ランできた。

・読めない文字が入っているとのエラー→
 gap(fasファイルだとハイフン)のある個体とない個体は混在しないように、解析の配列の選び方を工夫する
 ・・・readmeには、
「Version 1.21 (30 June 2005)
  • Fixed the mapping code to deal with gaps correctly as defined in the GUI, either as 5th state or as missing (IUPAC ambiguity characters are always treated as missing data).」
って。ちゃんと最初から読めば、ヨカタ。でも、るまんどのデータでは、このGAPが、個体差を示すのに結構、重要な時もあるんだけど・・・これは、後々、NETWORKと比較するとかで、要検討です。


・また、配列名は9文字以内にし、配列名と配列との間にスペースを入れること(ちゅまり、最低限最後に1スペースを入れて、合計で10文字を配列名とすること)



最初は、phyファイルや、NEXUSファイルを作成すればよいのだな~と思って、web上のReadseqやClustalWを利用しましたが、彼らからoutputされる各ファイルは、どれもTcsには嫌われました・・・。あと、MEGA5もphyファイルの作成は可能でしたが、Tcsは知らん顔。
(;´д`)トホホ…。

だもんで、exampleのファイルデータを開いて自分のデータと並べて、間違い探しをすることに・・・、

するってぇと、上記のミスの他、なんか、どちらも、同じ形式なのに中身が違う・・・。んで、それらには、”方言”があることが判明(下記のURLを参照)しました。


んもー、しょうがないので、fasファイルをワードパットで開いて、exampleのphyファイルと同じになるように、文字検索・置換とかしちゃいまいした、です。


つまり、るまんどは、結局は力づくでファイル作成をやってしまっちたのですが、そこにいたるまでには、多くのHPにおせお世話になりました。

感謝の気持ちを込めて、ここに紹介いたします。


web上のreadSeq

ファイル変換のいろいろ。今回に限らず、いつもお世話になっています。


DDBJはデータベースだけでなく、ClustalWもweb上で使わせてくれることが分かりました。


他にもソフトのことなど。



さてさて、ハプロタイプ網の図は書けたけど、これがなにゃら意味不明で。
(;´д`)トホホ…。


旅は~、まだ~、終わら~ない~ぃ♪
へ~どら~い、ているら~い~♪

と言うわけで、次は、NETWORk、Cytoscape、Spritstreeにも挑戦しようと思います。

ファイル変換なんか、怖くない~、ぞと。

火曜日, 8月 27

ハプロタイプの網がかけない。

あ。どうも。

ハプロタイプネットワークが書けなくて困っています。

Tcsか、NetWorkを使えばいいことは分かったのですが、どちらを使うにも、適した形式での”ファイル作成”が欠かせません。


ところが・・・・
Tcsでは、phy形式のファァいる作成まではできたのに、Tcs上では「塩基配列の数が違うし」とか、「変な文字が入っているから読めない」とか、いろいろ嫌がってファイルを読み込んでくれません。塩基の長さ、違わないし。文字も変換してなおしたし。

うむむ。

NetWorkでは、rdfファイルしか受け付けないみたい?で、rdfファイルの変換の仕方がわかりかねている。


むむぅぅぅ。


今日一日で、なんかもっと考えないとできないということが分かった。
(何にもできなかった、なんていうよりは、ポジな方向で)


つーか、こんなにみんな使っているんだから、るまんどだけが使えない、なんてことが、あるはずがない。


ないですよね?
(>_<)



月曜日, 8月 26

QIAGEN Multiplex PCR Kitの注意点

あ、どうも。

QIAGEN Multiplex PCR Kitには、良く似た製品がいくつかあるのをご存じでしょうか?
・・・うちはみごとに、さっきまで、ご存じなかったです。

つーか、みんな同じもの(後続品とか)だと思っていました。
(T_T)

QIAGEN のHPで、Multiplexを検索すると、9種類くらいのPCR酵素が検索されます。

以下、こんな感じで。

1)QIAGEN Multiplex PCR Kit
至適化なしに特異性および感度の高いマルチプレックスPCR


2)QIAGEN Multiplex PCR Plus Kit
高度なアプリケーションで良好な結果を簡便に実現するマルチプレックスPCR

 
3)Type-it Microsatellite PCR Kit
マイクロサテライト遺伝子座の迅速で確実なマルチプレックスPCR解析

 
4)dNTP Set and dNTP Mix, PCR Grade
For sensitive and reproducible PCR and RT-PCR

 
5)miScript Microfluidics PCR Kit
For real-time PCR profiling of miRNAs using the Fluidigm BioMark System

 
6)miScript Microfluidics PreAMP Kit
For preamplification of cDNA from low-RNA samples prior to real-time PCR miRNA analysis using the Fluidigm BioMark System



7)miScript PreAMP Pathway Primer Mix
For use with the miScript PreAMP PCR Kit


8) miScript miRNA PreAMP PCR Kit (12)
miScript PreAMP PCR Kit
For preamplification of cDNA from samples containing low RNA amounts prior to real-time PCR analysis of miRNA

 
9)Type-it Mutation Detect PCR Kit
マルチプレックスPCRにより変異を高い再現性で正確に解析


で、るまんどは、リアルタイムPCRとかはやってないので、4)以下はほとんど関係ないのです。
問題は、1)~3)・・・。うちは、きちんと使い分けていなかった可能性があ、る・・・。
およよよ、(@_@;)


ダウンロードできるプロトコルを比較してみたところ、
 ・ premixの配合割合 同じ
 ・ 推奨のプライマ濃度、アニリング温度 同じ
 ・ 推奨のテンプレートDNA量 1)と2)は300~0.1/PCR反応、3)は200~0.1
 ・ 推奨のサイクル数 1)と2)は30~45、3)は20~32(テンプレート量に依存)
 ・ 最初の活性化ステップ 1)は95℃、15 分間、2)は95℃、5 分間、3)は95℃、5 分間
 ・ 推奨の最終エクステンション キャピラリーシーケンサーを使う場合、同じ
 ・ 推奨の反応系 1)と2)は50μL、3)は25μL
 ・ Q-solution いずれも添付
 ・ 価格 1)は(100×50μL)3.6万、2)は(100×50μ)3.05万、3)は(200×25μL)3.05万
 ・ 1)でもマイクロサテライトに使用可能、3)はマイクロサテライトに最適化されている、2)はマイクロサテライトを推奨していない(プロトコルを良く読むと、3)を使うように注意書きがこそっとしてる!)
 ・ 最大マーカー数の成功例 1)は16(ただしマイクロサテライト領域なのかどうかは不明)、2)は19、3)は10

ざっと、こんな感じ。

マイクロサテライトのみ、解析する場合には3)を使えばよいだろう、
1)の汎用性は高いので、一般的なフラグメントとマイクロサテライトを混在した解析(やったことないけど)には良いと思われるが、最初の活性化に多少時間がかかる、なんかちょっと単価が高いなど、が難点


マイクロサテライトはつまり繰り返し配列なので、3)で最適化してあるのは、繰り返し配列のPCRでエラーを起こさないように、酵素になにがしかの魔法をかけているんじゃない?


しかし、まぎらわしいわ~っ!


と怒りつつも、自分の不注意さを反省・・・。


(T_T)


火曜日, 8月 20

KOD-FXとシーケンス

ほんとに久しぶりの更新です。
実験の小箱としてお役にたてられるかも?の情報をお知らせします。

KOD-FXでPCRしたテンプレートを、そのままシーケンシング(BigDye3.1)すると、うまく配列を読んでくれない、という悩みは、あちこち(主に多細胞生物)から聞こえていたので、

うちだけではないのか~と、でも、解決はできないのか~と、もんもんとしていたのですが、

このたび、なんとなく解決できたうちのプロトコルを紹介します。

1)各生物にあった条件通り、KOD-FXでPCRする
2)PCR後のテンプレートを5~10、もしくは20倍程度に希釈する。
3)希釈したテンプレートをExo-SAP(もしくはillustra ExoProStar)で、プロトコルどおりにインキュベートする。
4)3)をシーケンス用テンプレートとして使って、あとは、BigDye3.1のプロトコルどおりにサイクルシーケンスする。


という感じです。

うちの扱っているサンプルでは、この方法で95%くらい解決しました。


KOD-FXでPCRしたテンプレートは、そのままだとなぜシーケンシング失敗率が高いのか、の理由については、

あ)PCR効率があがる(=PCR産物がたくさんできる)ので、テンプレートをシーケンス用に適切な濃度にする必要がある

い)KOD-FXの粘性の高いバッファーが、ExoもしくはBigDye3.1の邪魔をしている。


なんじゃないかと推測しています。

あ)については、BigDye3.1のマニュアルにも「テンプレートの濃度はちゃんとしてね」と書いてますが(そしてその場合のピークパターンの例も紹介されている)、経験的には、KOD-FXの場合はどうもテンプレートの濃度が濃すぎるだけの理由ではないようなので、プライマーを非活性化させる段階から希釈してやってみたら、あたり~な感じでした。



他の方は、PCR後にエタ沈するとか、TOYOBO推奨の精製キット(MagExtractorTM-PCR& Gel Clean up-)を使うとか試行錯誤されているようです。
けど、とにかくうちは簡単に(安く)できないものかと思って、希釈という方法にたどりつきました。
それに、他の試薬を使うと、さらになんの相性が悪いのかわかんなくなりそうなので・・・。



成功率が95%は、低い?

たぶん・・・、個々の濃度に合わせて希釈をしていけば、シーケンスの成功率は上がるのではないかと思います。
うちはめんどくさかったので、アガロースで濃度確認して、まーこんなもんかーと毎回一律で、5倍とか、10倍とか、20倍希釈でやったのが原因ではないかと思っています。

結局こりずに・・・、またそういうてきとうなことを・・・やってます、すいません~。
^^;)


けものドラマ見てます。

ええと、研究と関係のない話です。 ドラマを見ています。 2018年12月現在。 獣になれない私たち。 もう、好きだ!というしかない。 松田龍平も新垣結衣も。好きな役者さんで。田中圭も黒木華も! 全然、スパッと行かない展開も、ものすごいリアルで鳥肌が立ちます。...