水曜日, 8月 28

網はかけても・・・。

今日の業務実績をご報告。

TCSでハプロタイプネットワークがかけました!
やったね!
v(^^)v

とにもかくにも、原因は、phyファイルやNEXUSファイルが、Tcsの読めるように書けない、ということでした。原因と解決法の覚書は、以下。

・塩基数が間違っていた→
 なんでか、MEGAで確認した塩基数や、phyで書きだされる塩基数が間違っていて、結局、ワードでカウントした文字数を入れたら、ランできた。

・読めない文字が入っているとのエラー→
 gap(fasファイルだとハイフン)のある個体とない個体は混在しないように、解析の配列の選び方を工夫する
 ・・・readmeには、
「Version 1.21 (30 June 2005)
  • Fixed the mapping code to deal with gaps correctly as defined in the GUI, either as 5th state or as missing (IUPAC ambiguity characters are always treated as missing data).」
って。ちゃんと最初から読めば、ヨカタ。でも、るまんどのデータでは、このGAPが、個体差を示すのに結構、重要な時もあるんだけど・・・これは、後々、NETWORKと比較するとかで、要検討です。


・また、配列名は9文字以内にし、配列名と配列との間にスペースを入れること(ちゅまり、最低限最後に1スペースを入れて、合計で10文字を配列名とすること)



最初は、phyファイルや、NEXUSファイルを作成すればよいのだな~と思って、web上のReadseqやClustalWを利用しましたが、彼らからoutputされる各ファイルは、どれもTcsには嫌われました・・・。あと、MEGA5もphyファイルの作成は可能でしたが、Tcsは知らん顔。
(;´д`)トホホ…。

だもんで、exampleのファイルデータを開いて自分のデータと並べて、間違い探しをすることに・・・、

するってぇと、上記のミスの他、なんか、どちらも、同じ形式なのに中身が違う・・・。んで、それらには、”方言”があることが判明(下記のURLを参照)しました。


んもー、しょうがないので、fasファイルをワードパットで開いて、exampleのphyファイルと同じになるように、文字検索・置換とかしちゃいまいした、です。


つまり、るまんどは、結局は力づくでファイル作成をやってしまっちたのですが、そこにいたるまでには、多くのHPにおせお世話になりました。

感謝の気持ちを込めて、ここに紹介いたします。


web上のreadSeq

ファイル変換のいろいろ。今回に限らず、いつもお世話になっています。


DDBJはデータベースだけでなく、ClustalWもweb上で使わせてくれることが分かりました。


他にもソフトのことなど。



さてさて、ハプロタイプ網の図は書けたけど、これがなにゃら意味不明で。
(;´д`)トホホ…。


旅は~、まだ~、終わら~ない~ぃ♪
へ~どら~い、ているら~い~♪

と言うわけで、次は、NETWORk、Cytoscape、Spritstreeにも挑戦しようと思います。

ファイル変換なんか、怖くない~、ぞと。

0 件のコメント:

コメントを投稿

けものドラマ見てます。

ええと、研究と関係のない話です。 ドラマを見ています。 2018年12月現在。 獣になれない私たち。 もう、好きだ!というしかない。 松田龍平も新垣結衣も。好きな役者さんで。田中圭も黒木華も! 全然、スパッと行かない展開も、ものすごいリアルで鳥肌が立ちます。...