ngoto-bio 1.2.9.9501 → 1.3.0
Sign up to get free protection for your applications and to get access to all the features.
- data/ChangeLog +201 -4
- data/KNOWN_ISSUES.rdoc +24 -2
- data/README.rdoc +29 -0
- data/Rakefile +44 -5
- data/bin/br_pmfetch.rb +4 -3
- data/bioruby.gemspec +11 -3
- data/bioruby.gemspec.erb +40 -5
- data/doc/Changes-0.7.rd +7 -0
- data/doc/Changes-1.3.rdoc +17 -0
- data/doc/Tutorial.rd.html +1031 -0
- data/doc/Tutorial.rd.ja +111 -45
- data/doc/Tutorial.rd.ja.html +2225 -0
- data/doc/bioruby.css +281 -0
- data/lib/bio/appl/blast/format0.rb +7 -2
- data/lib/bio/db/gff.rb +2 -2
- data/lib/bio/db/lasergene.rb +3 -3
- data/lib/bio/db/soft.rb +3 -3
- data/lib/bio/io/togows.rb +458 -0
- data/lib/bio/shell/core.rb +2 -2
- data/lib/bio/shell/plugin/entry.rb +27 -4
- data/lib/bio/shell/plugin/ncbirest.rb +27 -29
- data/lib/bio/shell/plugin/togows.rb +40 -0
- data/lib/bio/shell.rb +1 -0
- data/lib/bio/util/color_scheme.rb +2 -2
- data/lib/bio/util/contingency_table.rb +2 -2
- data/lib/bio/util/restriction_enzyme.rb +2 -2
- data/lib/bio/version.rb +25 -0
- data/lib/bio.rb +4 -1
- data/test/functional/bio/io/test_togows.rb +267 -0
- data/test/runner.rb +7 -0
- data/test/unit/bio/db/test_gff.rb +63 -0
- data/test/unit/bio/io/test_togows.rb +161 -0
- metadata +11 -3
data/doc/Tutorial.rd.ja
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
=begin
|
2
2
|
|
3
|
-
$Id
|
3
|
+
# $Id:$
|
4
4
|
|
5
5
|
Copyright (C) 2001-2003, 2005, 2006 Toshiaki Katayama <k@bioruby.org>
|
6
6
|
Copyright (C) 2005, 2006 Naohisa Goto <ng@bioruby.org>
|
@@ -39,12 +39,13 @@ Windows
|
|
39
39
|
|
40
40
|
ruby 1.8.2 (2004-12-25) [powerpc-darwin7.7.0]
|
41
41
|
|
42
|
-
�Τ褦�ʴ����ǥС������ɽ������ޤ����С������ 1.8.
|
42
|
+
�Τ褦�ʴ����ǥС������ɽ������ޤ����С������ 1.8.5 �ʹߤ��ᤷ�ޤ���
|
43
43
|
|
44
44
|
Ruby ɸ�������Υ��饹���åɤˤĤ��Ƥϡ�Ruby �Υ�ե���ޥ˥奢���
|
45
45
|
���Ȥ��Ƥ���������
|
46
46
|
|
47
47
|
* ((<URL:http://www.ruby-lang.org/ja/man/>))
|
48
|
+
* ((<URL:http://doc.okkez.net/>))
|
48
49
|
|
49
50
|
���ޥ�ɥ饤��ǥإ�פȤ���ˤϡ�Ruby ɸ��ź�դ� ri ���ޥ�ɤ䡢
|
50
51
|
���ܸ��Ǥ� refe ���ޥ�ɤ������Ǥ���
|
@@ -66,16 +67,15 @@ RubyGems
|
|
66
67
|
=== BioRuby �Υ��ȡ���
|
67
68
|
|
68
69
|
BioRuby �Υ��ȡ�����ˡ�� ((<URL:http://bioruby.org/archive/>)) ����
|
69
|
-
|
70
|
+
�ǿ��Ǥ�������ưʲ��Τ褦�˹Ԥ��ޤ�(��1)��Ʊ������Ƥ��� README �ե�����ˤ�
|
70
71
|
�ܤ��̤���ĺ�������ΤǤ���������ʤ��ȣ���������ˤʤ� BioPerl ����٤�
|
71
72
|
BioRuby �Υ��ȡ���Ϥ����˽����Ϥ��Ǥ���
|
72
73
|
|
73
74
|
% wget http://bioruby.org/archive/bioruby-x.x.x.tar.gz
|
74
75
|
% tar zxvf bioruby-x.x.x.tar.gz
|
75
76
|
% cd bioruby-x.x.x
|
76
|
-
%
|
77
|
-
|
78
|
-
# ruby install.rb install
|
77
|
+
% su
|
78
|
+
# ruby setup.rb
|
79
79
|
|
80
80
|
RubyGems ���Ȥ���Ķ��Ǥ����
|
81
81
|
|
@@ -157,13 +157,13 @@ BioRuby
|
|
157
157
|
|
158
158
|
=== ����, ���ߥλ����������
|
159
159
|
|
160
|
-
---
|
160
|
+
--- getseq(str)
|
161
161
|
|
162
|
-
|
163
|
-
|
162
|
+
getseq ���ޥ��(��2)��Ȥä�ʸ�����������䥢�ߥλ�������뤳�Ȥ�
|
163
|
+
�Ǥ��ޤ�������ȥ��ߥλ��� ATGC �δ��̤� 90% �ʾ夫�ɤ����Ǽ�ưȽ�ꤵ��ޤ���
|
164
164
|
�����Ǥϡ��Ǥ������������ dna �Ȥ����ѿ����������ޤ���
|
165
165
|
|
166
|
-
bioruby> dna =
|
166
|
+
bioruby> dna = getseq("atgcatgcaaaa")
|
167
167
|
|
168
168
|
�ѿ�����Ȥ��ǧ����ˤ� Ruby �� puts ��åɤ�Ȥ��ޤ���
|
169
169
|
|
@@ -176,14 +176,14 @@ GenBank, EMBL, UniProt, FASTA
|
|
176
176
|
�ʲ��� UniProt �ե����ޥåȤΥ���ȥ��ե����뤫���ɤ߹���Ǥ��ޤ���
|
177
177
|
������ˡ�Ǥϡ�ʣ���Υ���ȥ꤬������ǽ�Υ���ȥ�������ɤ߹��ޤ�ޤ���
|
178
178
|
|
179
|
-
bioruby> cdc2 =
|
179
|
+
bioruby> cdc2 = getseq("p04551.sp")
|
180
180
|
bioruby> puts cdc2
|
181
181
|
MENYQKVEKIGEGTYGVVYKARHKLSGRIVAMKKIRLEDESEGVPSTAIREISLLKEVNDENNRSN...(ά)
|
182
182
|
|
183
183
|
�ǡ����١���̾�ȥ���ȥ�̾��ʬ���äƤ���С������ͥåȤ��̤���
|
184
184
|
�����ưŪ�˼������뤳�Ȥ��Ǥ��ޤ���
|
185
185
|
|
186
|
-
bioruby> psaB =
|
186
|
+
bioruby> psaB = getseq("genbank:AB044425")
|
187
187
|
bioruby> puts psaB
|
188
188
|
actgaccctgttcatattcgtcctattgctcacgcgatttgggatccgcactttggccaaccagca...(ά)
|
189
189
|
|
@@ -194,28 +194,61 @@ GenBank, EMBL, UniProt, FASTA
|
|
194
194
|
EMBOSS �� USA ɽ���Ǥ⥨��ȥ������Ǥ��ޤ���EMBOSS �Υޥ˥奢��Ȥ�
|
195
195
|
~/.embossrc ��Ŭ�ڤ����ꤷ�Ƥ���������
|
196
196
|
|
197
|
-
�ɤ���ˡ�Ǽ����������⡢
|
198
|
-
|
199
|
-
Bio::sequence::AA ���饹�Τɤ��餫�Υ��֥������Ȥˤʤ�ޤ���
|
197
|
+
�ɤ���ˡ�Ǽ����������⡢getseq ���ޥ�ɤˤ�ä��֤��������ϡ�
|
198
|
+
���Ѥ����饹 Bio::Sequence �ˤʤ�ޤ�(��3)��
|
200
199
|
|
201
|
-
|
200
|
+
����������ȥ��ߥλ�����Τɤ����Ƚ�ꤵ��Ƥ���Τ��ϡ�
|
201
|
+
moltype ��åɤ��Ѥ���
|
202
202
|
|
203
|
-
bioruby> p cdc2.
|
203
|
+
bioruby> p cdc2.moltype
|
204
204
|
Bio::Sequence::AA
|
205
205
|
|
206
|
-
bioruby> p psaB.
|
206
|
+
bioruby> p psaB.moltype
|
207
207
|
Bio::Sequence::NA
|
208
208
|
|
209
209
|
�Τ褦��Ĵ�٤뤳�Ȥ��Ǥ��ޤ�����ưȽ�꤬�ְ�äƤ�����ʤɤˤ�
|
210
|
-
|
210
|
+
na, aa ��åɤǶ���Ū���Ѵ��Ǥ��ޤ����ʤ��������Υ�åɤ�
|
211
|
+
���Υ��֥������Ȥ���Ū�˽����ޤ���
|
212
|
+
|
213
|
+
bioruby> dna.aa
|
214
|
+
bioruby> p dna.moltype
|
215
|
+
Bio::Sequence::AA
|
216
|
+
|
217
|
+
bioruby> dna.na
|
218
|
+
bioruby> p dna.moltype
|
219
|
+
Bio::Sequence::NA
|
220
|
+
|
221
|
+
�ޤ��ϡ�to_naseq, to_aaseq ��åɤǶ���Ū���Ѵ����뤳�Ȥ�Ǥ��ޤ���
|
211
222
|
|
212
223
|
bioruby> pep = dna.to_aaseq
|
224
|
+
|
225
|
+
to_naseq, to_aaseq ��åɤ��֤����֥������Ȥϡ����줾�졢
|
226
|
+
DNA ����Τ���� Bio::Sequence::NA ���饹�����ߥλ�����Τ����
|
227
|
+
Bio::Sequence::AA ���饹�Υ��֥������Ȥˤʤ�ޤ���
|
228
|
+
���ɤ���Υ��饹��°���뤫�� Ruby �� class ��åɤ��Ѥ���
|
229
|
+
|
213
230
|
bioruby> p pep.class
|
214
231
|
Bio::Sequence::AA
|
215
232
|
|
233
|
+
�Τ褦��Ĵ�٤뤳�Ȥ��Ǥ��ޤ���
|
234
|
+
|
235
|
+
����Ū���Ѵ������ˡ�Bio::Sequence::NA ���饹�ޤ��� Bio::sequence::AA ���饹
|
236
|
+
�Τɤ��餫�Υ��֥������Ȥ����������ˤ� seq ��åɤ�Ȥ��ޤ�(��4)��
|
237
|
+
|
238
|
+
bioruby> pep2 = cdc2.seq
|
239
|
+
bioruby> p pep2.class
|
240
|
+
Bio::Sequence::AA
|
241
|
+
|
242
|
+
�ޤ����ʲ��Dz��⤹�� complement �� translate �ʤɤΥ�åɤη�̤ϡ�
|
243
|
+
����������֤����Ȥ����Ԥ�����åɤ� Bio::Sequence::NA ���饹��
|
244
|
+
���ߥλ�������֤����Ȥ����Ԥ�����åɤ� Bio::sequence::AA ���饹
|
245
|
+
�Υ��֥������Ȥˤʤ�ޤ���
|
246
|
+
|
216
247
|
��������䥢�ߥλ�����Υ��饹�� Ruby ��ʸ���饹�Ǥ��� String ��
|
217
|
-
|
218
|
-
|
248
|
+
�Ѿ����Ƥ��ޤ����ޤ���Bio::Sequence ���饹�Υ��֥������Ȥ� String ��
|
249
|
+
���֥������Ȥȸ�������Ʊ�ͤ�Ư���褦�˹��פ���Ƥ��ޤ������Τ��ᡢ
|
250
|
+
length ��Ĺ����Ĵ�٤��ꡢ+ ������碌���ꡢ* �Ƿ����֤�����ʤɡ�
|
251
|
+
Ruby ��ʸ������Ф��ƹԤ��������������Ѳ�ǽ�Ǥ���
|
219
252
|
���Τ褦����ħ�ϥ��֥������Ȼظ��ζ��Ϥ�¦�̤ΰ�Ĥȸ�����Ǥ��礦��
|
220
253
|
|
221
254
|
bioruby> puts dna.length
|
@@ -414,7 +447,7 @@ randomize
|
|
414
447
|
to_re ��åɤϡ�ۣ��ʱ����ɽ����ޤ��������� atgc ������
|
415
448
|
�ѥ�����ʤ�����ɽ�����Ѵ����ޤ���
|
416
449
|
|
417
|
-
bioruby> ambiguous =
|
450
|
+
bioruby> ambiguous = getseq("atgcyatgcatgcatgc")
|
418
451
|
|
419
452
|
bioruby> p ambiguous.to_re
|
420
453
|
/atgc[tc]atgcatgcatgc/
|
@@ -426,7 +459,7 @@ seq
|
|
426
459
|
ۣ��ʱ���¿���ޤޤ������ξ��� to_naseq ��åɤ�Ȥä�
|
427
460
|
����Ū�� Bio::Sequence::NA ���֥������Ȥ��Ѵ�����ɬ�פ�����ޤ���
|
428
461
|
|
429
|
-
bioruby> s =
|
462
|
+
bioruby> s = getseq("atgcrywskmbvhdn").to_naseq
|
430
463
|
bioruby> p s.to_re
|
431
464
|
/atgc[ag][tc][at][gc][tg][ac][tgc][agc][atc][atg][atgc]/
|
432
465
|
|
@@ -650,14 +683,14 @@ GenBank
|
|
650
683
|
% wget ftp://ftp.hgc.jp/pub/mirror/ncbi/genbank/gbphg.seq.gz
|
651
684
|
% gunzip gbphg.seq.gz
|
652
685
|
|
653
|
-
---
|
686
|
+
--- getent(str)
|
654
687
|
|
655
|
-
|
656
|
-
|
657
|
-
KEGG API
|
658
|
-
|
688
|
+
getseq ���ޥ�ɤ������������ޤ���������������Ǥʤ�����ȥ����Τ��������
|
689
|
+
�ˤ� getent ���ޥ��(��2)��Ȥ��ޤ���getseq ���ޥ��Ʊ�͡�getent ���ޥ�ɤǤ�
|
690
|
+
OBDA, EMBOSS, NCBI, EBI, TogoWS, KEGG API �Υǡ����١��������Ѳ�ǽ�Ǥ�(��5)��
|
691
|
+
����ˤĤ��Ƥ� getseq ���ޥ�ɤ������Ȥ��Ƥ���������
|
659
692
|
|
660
|
-
bioruby> entry =
|
693
|
+
bioruby> entry = getent("genbank:AB044425")
|
661
694
|
bioruby> puts entry
|
662
695
|
LOCUS AB044425 1494 bp DNA linear PLN 28-APR-2001
|
663
696
|
DEFINITION Volvox carteri f. kawasakiensis chloroplast psaB gene for
|
@@ -665,7 +698,7 @@ KEGG API
|
|
665
698
|
strain:NIES-732.
|
666
699
|
(ά)
|
667
700
|
|
668
|
-
|
701
|
+
getent ���ޥ�ɤΰ����ˤ� db:entry_id ������ʸ����EMBOSS �� USA��
|
669
702
|
�ե����롢IO ��Ϳ����졢�ǡ����١����Σ�����ȥ�ʬ��ʸ�����֤���ޤ���
|
670
703
|
����ǡ����١����˸¤餺����¿���Υǡ����١�������ȥ���б����Ƥ��ޤ���
|
671
704
|
|
@@ -674,7 +707,7 @@ ent
|
|
674
707
|
������������ȥ��ѡ��������ߤ����ǡ�����Ȥ�����ˤ� flatparse
|
675
708
|
���ޥ�ɤ�Ȥ��ޤ���
|
676
709
|
|
677
|
-
bioruby> entry =
|
710
|
+
bioruby> entry = getent("gbphg.seq")
|
678
711
|
bioruby> gb = flatparse(entry)
|
679
712
|
bioruby> puts gb.entry_id
|
680
713
|
AB000833
|
@@ -684,20 +717,20 @@ ent
|
|
684
717
|
acggtcagacgtttggcccgaccaccgggatgaggctgacgcaggtcagaaatctttgtgacgacaaccgtatcaat
|
685
718
|
(ά)
|
686
719
|
|
687
|
-
---
|
720
|
+
--- getobj(str)
|
688
721
|
|
689
|
-
|
690
|
-
|
691
|
-
|
692
|
-
|
722
|
+
getobj ���ޥ��(��2)�ϡ�getent �ǥ���ȥ��ʸ����Ȥ��Ƽ����� flatparse ��
|
723
|
+
�ѡ����������֥������Ȥ��Ѵ�����Τ�Ʊ���Ǥ���getent ���ޥ�ɤ�Ʊ��������
|
724
|
+
�����դ��ޤ������������������ getseq������ȥ������������ getent��
|
725
|
+
�ѡ����������֥������Ȥ����������� getobj ��Ȥ����Ȥˤʤ�ޤ���
|
693
726
|
|
694
|
-
bioruby> gb =
|
727
|
+
bioruby> gb = getobj("gbphg.seq")
|
695
728
|
bioruby> puts gb.entry_id
|
696
729
|
AB000833
|
697
730
|
|
698
731
|
--- flatfile(file)
|
699
732
|
|
700
|
-
|
733
|
+
getent ���ޥ�ɤϣ�����ȥꤷ�������ʤ����ᡢ��������Υե��������
|
701
734
|
�ƥ���ȥ���˽�����Ԥ��ˤ� flatfile ���ޥ�ɤ�Ȥ��ޤ���
|
702
735
|
|
703
736
|
bioruby> flatfile("gbphg.seq") do |entry|
|
@@ -911,7 +944,7 @@ bget
|
|
911
944
|
|
912
945
|
bioruby> script
|
913
946
|
-- 8< -- 8< -- 8< -- Script -- 8< -- 8< -- 8< --
|
914
|
-
bioruby> seq =
|
947
|
+
bioruby> seq = getseq("gbphg.seq")
|
915
948
|
bioruby> p seq
|
916
949
|
bioruby> p seq.translate
|
917
950
|
bioruby> script
|
@@ -922,7 +955,7 @@ bget
|
|
922
955
|
|
923
956
|
#!/usr/bin/env bioruby
|
924
957
|
|
925
|
-
seq =
|
958
|
+
seq = getseq("gbphg.seq")
|
926
959
|
p seq
|
927
960
|
p seq.translate
|
928
961
|
|
@@ -990,7 +1023,7 @@ bget
|
|
990
1023
|
|
991
1024
|
�ƥ����Ȥ����äƤ����ѿ�����Ƭ�뤳�Ȥ�Ǥ��ޤ���
|
992
1025
|
|
993
|
-
bioruby> entry =
|
1026
|
+
bioruby> entry = getent("gbphg.seq")
|
994
1027
|
bioruby> head entry, 2
|
995
1028
|
GBPHG.SEQ Genetic Sequence Data Bank
|
996
1029
|
October 15 2005
|
@@ -1125,7 +1158,7 @@ disp
|
|
1125
1158
|
DNA ��������������Ȥ�ɽ�����륪�ޥ���ǽ������ޤ���
|
1126
1159
|
Ŭ���ʱ������� seq ����������äݤ�ɽ�����Ƥߤޤ��礦��
|
1127
1160
|
|
1128
|
-
bioruby> dna =
|
1161
|
+
bioruby> dna = getseq("atgc" * 10).randomize
|
1129
1162
|
bioruby> doublehelix dna
|
1130
1163
|
ta
|
1131
1164
|
t--a
|
@@ -1915,7 +1948,7 @@ br_bioflat.rb
|
|
1915
1948
|
�����ޤǤν����� BioRuby ������ǻ�Ȱʲ��Τ褦�ˤʤ�ޤ���
|
1916
1949
|
|
1917
1950
|
# PDB ����ȥ� 1bl8 ��ͥåȥ����ͳ�Ǽ���
|
1918
|
-
bioruby> ent_1bl8 =
|
1951
|
+
bioruby> ent_1bl8 = getent("pdb:1bl8")
|
1919
1952
|
# ����ȥ����Ȥ��ǧ
|
1920
1953
|
bioruby> head ent_1bl8
|
1921
1954
|
# ����ȥ��ե��������¸
|
@@ -1926,8 +1959,8 @@ br_bioflat.rb
|
|
1926
1959
|
bioruby> pdb_1bl8 = flatparse(ent_1bl8)
|
1927
1960
|
# PDB �Υ���ȥ� ID ��ɽ��
|
1928
1961
|
bioruby> pdb_1bl8.entry_id
|
1929
|
-
#
|
1930
|
-
bioruby> obj_1bl8 =
|
1962
|
+
# getent("pdb:1bl8") ���� flatparse ��������ˡ��ʲ��Ǥ�OK
|
1963
|
+
bioruby> obj_1bl8 = getobj("pdb:1bl8")
|
1931
1964
|
bioruby> obj_1bl8.entry_id
|
1932
1965
|
# �� HETEROGEN ���Ȥ˻Ĵ�̾��ɽ��
|
1933
1966
|
bioruby> pdb_1bl8.each_heterogen { |heterogen| p heterogen.resName }
|
@@ -2636,5 +2669,38 @@ to be written...
|
|
2636
2669
|
¾�Υ��塼�ȥꥢ��Ū�ʥɥ�����ȤȤ��Ƥϡ�BioRuby Wiki���֤��Ƥ���
|
2637
2670
|
BioRuby in Anger ������ޤ���
|
2638
2671
|
|
2672
|
+
|
2673
|
+
== ����
|
2674
|
+
|
2675
|
+
* (��1) BioRuby 1.2.1 �����ΥС������Ǥϡ�setup.rb �Τ����� install.rb
|
2676
|
+
����Ѥ��ޤ����ޤ����ʲ��Τ褦��3�ʳ���Ƨ��ɬ�פ�����ޤ���
|
2677
|
+
|
2678
|
+
% ruby install.rb config
|
2679
|
+
% ruby install.rb setup
|
2680
|
+
# ruby install.rb install
|
2681
|
+
|
2682
|
+
* (��2) BioRuby 1.0.0 �����ΥС������Ǥϡ�getseq, getent, getobj
|
2683
|
+
�γƥ��ޥ�ɤΤ����ˡ�seq, ent, obj �γƥ��ޥ�ɤ���Ѥ��Ƥ���������
|
2684
|
+
|
2685
|
+
* (��3) BioRuby 0.7.1 �����ΥС������Ǥϡ�Bio::Sequence::NA ���饹����
|
2686
|
+
Bio::sequence::AA ���饹�Τɤ��餫�Υ��֥������Ȥˤʤ�ޤ���
|
2687
|
+
���ɤ���Υ��饹��°���뤫�� Ruby �� class ��åɤ��Ѥ���
|
2688
|
+
|
2689
|
+
bioruby> p cdc2.class
|
2690
|
+
Bio::Sequence::AA
|
2691
|
+
|
2692
|
+
bioruby> p psaB.class
|
2693
|
+
Bio::Sequence::NA
|
2694
|
+
|
2695
|
+
�Τ褦��Ĵ�٤뤳�Ȥ��Ǥ��ޤ�����ưȽ�꤬�ְ�äƤ�����ʤɤˤ�
|
2696
|
+
to_naseq, to_aaseq ��åɤǶ���Ū���Ѵ��Ǥ��ޤ���
|
2697
|
+
|
2698
|
+
* (��4) seq ��åɤϡ��ɤ߹�����ǡ����μ���ˤ�äƤϡ����𡦥��ߥλ���
|
2699
|
+
�ɤ���ˤ����ƤϤޤ�ʤ�����Τ���� Bio::Sequence::Generic ���饹��
|
2700
|
+
String ���饹�Υ��֥������Ȥ��֤���礬���뤫�⤷��ޤ���
|
2701
|
+
|
2702
|
+
* (��5) NCBI, EBI, TogoWS �����̤�����̵���� getseq, getent, getobj ���ޥ��
|
2703
|
+
�������Ѳ�ǽ�Ȥʤä��Τ� BioRuby 1.3.0 �ʹߤǤ���
|
2704
|
+
|
2639
2705
|
=end
|
2640
2706
|
|