[Bio] / FigKernelScripts / svr_run_RAST_jobs.pl Repository:
ViewVC logotype

Annotation of /FigKernelScripts/svr_run_RAST_jobs.pl

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.1 - (view) (download) (as text)

1 : olson 1.1 #!/usr/bin/perl
2 :    
3 :     #
4 :     # This is a SAS Component.
5 :     #
6 :    
7 :     use RASTserver;
8 :     use strict;
9 :     use Data::Dumper;
10 :    
11 :     @ARGV == 2 or die "Usage: $0 username password < contig-id-list\n";
12 :    
13 :     my $username = shift;
14 :     my $password = shift;
15 :    
16 :     my $rast = new RASTserver($username, $password);
17 :    
18 :     my @input_ids = <STDIN>;
19 :     chomp @input_ids;
20 :    
21 :     my @job_sets;
22 :     my $redundancies_seen;
23 :    
24 :     my %seen;
25 :     for my $id (@input_ids)
26 :     {
27 :     next if $seen{$id};
28 :    
29 :     my $res = $rast->get_contig_ids_in_project_from_entrez({ -contig_id => $id } );
30 :     # print Dumper($res);
31 :     my $project_ids = $res->{ids};
32 :     my $redundancies = $res->{redundancy_report};
33 :    
34 :     if (@$redundancies)
35 :     {
36 :     for my $redundancy (@$redundancies)
37 :     {
38 :     print STDERR join("\t", @$redundancy), "\n";
39 :     $redundancies_seen++;
40 :     }
41 :     }
42 :     else
43 :     {
44 :     push(@job_sets, $project_ids);
45 :     map { $seen{$_} = 1 } @$project_ids;
46 :     }
47 :     }
48 :    
49 :     if ($redundancies_seen)
50 :     {
51 :     die "Not submitting jobs, redudancies were found\n";
52 :     }
53 :    
54 :     #
55 :     # Pull contigs
56 :     #
57 :    
58 :     my @jobs;
59 :    
60 :     my $idx = 1;
61 :     for my $ids (@job_sets)
62 :     {
63 :     print "Retrieve @$ids\n";
64 :     my $data = $rast->get_contigs_from_entrez({ -id => $ids });
65 :     my $file= "data.$idx";
66 :     $idx++;
67 :     open(F, ">", $file) or die "Cannot open $file: $!";
68 :     for my $ent (@$data)
69 :     {
70 :     my $txt = $ent->{contents};
71 :     my $id = $ent->{id};
72 :     $ent->{contents} = '';
73 :     print Dumper($ent);
74 :     print "write $id\n";
75 :     print F $txt;
76 :     }
77 :     close(F);
78 :     push(@jobs, { file => $file, data => $data, ids => $ids });
79 :     }
80 :    
81 :     #
82 :     # Submit to RAST. The data hash looks like this:
83 :     # $VAR1 = {
84 :     # 'length' => '16660',
85 :     # 'project' => '15760',
86 :     # 'name' => 'Mycobacterium gilvum PYR-GCK',
87 :     # 'contents' => '',
88 :     # 'id' => 'NC_009341',
89 :     # 'taxonomy_id' => '350054'
90 :     # };
91 :     #
92 :    
93 :     for my $jobdata (@jobs)
94 :     {
95 :     my($file, $data) = @$jobdata{qw(file data)};
96 :    
97 :     my @biggest = sort { $b->{length} <=> $a->{length} } @$data;
98 :     print Dumper(\@biggest);
99 :     my $biggest = $biggest[0];
100 :    
101 :     my $taxonomy = $biggest->{taxonomy};
102 :    
103 :     my $submit_params = {
104 :     -filetype => 'genbank',
105 :     -taxonomyID => $biggest->{taxonomy_id},
106 :     -domain => $biggest->{domain},
107 :     -organismName => $biggest->{name},
108 :     -file => $file,
109 :     -geneticCode => $biggest->{genetic_code},
110 :     -keepGeneCalls => 0,
111 :     -geneCaller => 'RAST',
112 :     };
113 :    
114 :     print Dumper($submit_params);
115 :    
116 :     my $res = $rast->submit_RAST_job($submit_params);
117 :     print Dumper($res);
118 :     }
119 :    
120 :     #
121 :     # Loop waiting for jobs to finish and retrieve results when they do.
122 :     #

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3