ddbj supercomputer 2

今日もhttp://cell-innovation.nig.ac.jp/wiki/tiki-index.php?page=Spraiのまねをする。

とりあえず、spraiのインストールまではうまくいったようなので、ラボのLinuxではどうやってもうまくいかなかったpbcoreのインストールに挑戦。

$ cd
$ git clone https://github.com/PacificBiosciences/pbcore
$ cd pbcore
$ python setup.py install
まったく躓くことなくうまくいった。何故だ・・・

$ which pythonとして、起動しているpythonを確認しても、やはりラボと同じくsmrtanalysis内のpythonにパスが変わっている。となると、PCのせいだとか、OSのせいだとか、そういうのを理由として考えてしまうのだが結局よくわからんです。そのうちわかるのだろう。(こればっかりですが)

その次のbash5toolsも無事アップデートが進み、いよいよspraiが動かせる(はず)。ただし、スパコンの利用には、やりたいことをスクリプトで作文(?)して、それをジョブとして投入する必要があるらしい。これは要予習、要練習。

あと、よくわかってないのがgit cloneってとこ。これも要勉強。

で、ジョブ投入用のリードファイルをダウンロードしておくことにする。
Mycobacterium kansasii 662
http://www.ncbi.nlm.nih.gov/sra/SRX305946
PacBioのデータらしい。・・・でもsraに入ってるってことは少なくともfastqになってる気もする。どうなんでしょう。よくわかりませんね。

$ mkdir kansasii_sra
$ cd kansasii_sra
$ wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR900/SRR900991/SRR900991.sra

540Mとかこんなでかいのダウンロードしていいんだろうか。怖いので一日2つずつダウンロードすることにした。