[Bio] / FigWebServices / index.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/index.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.3 - (view) (download)

1 : overbeek 1.2
2 : efrank 1.1 use FIG;
3 :     my $fig = new FIG;
4 :    
5 :     use HTML;
6 :     use strict;
7 :     use CGI;
8 :     my $cgi = new CGI;
9 :    
10 :     my($map,@orgs,$user,$map,$org);
11 :    
12 :     if (0)
13 :     {
14 :     print $cgi->header;
15 :     my @params = $cgi->param;
16 :     print "<pre>\n";
17 :     foreach $_ (@params)
18 :     {
19 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
20 :     }
21 :     print "=======\n";
22 :     foreach $_ (sort keys(%ENV))
23 :     {
24 :     print "$_\t$ENV{$_}\n";
25 :     }
26 :     exit;
27 :     }
28 :    
29 :     $ENV{"PATH"} = "$FIG_Config::bin:$FIG_Config::ext_bin:" . $ENV{"PATH"};
30 :    
31 :     my $html = [];
32 :    
33 :     my($pattern,$seq_pat,$tool);
34 :     my $user = $cgi->param('user');
35 :     if (! $user) { $user = "" }
36 :    
37 :     if ($cgi->param('Search for Genes Matching an Occurrence Profile'))
38 :     {
39 :    
40 :     my $url = $cgi->url;
41 :     $ENV{"REQUEST_METHOD"} = "GET";
42 :     $ENV{"QUERY_STRING"} = "user=$user";
43 :     my @out = `./sigs.cgi`;
44 :     &HTML::trim_output(\@out);
45 :     push(@$html,@out);
46 :     }
47 :     elsif (($pattern = $cgi->param('pattern')) && ($cgi->param('Search') || $cgi->param('Find Genes in Org that Might Play the Role')))
48 :     {
49 :     if ($cgi->param('Find Genes in Org that Might Play the Role') &&
50 :     (@orgs = $cgi->param('korgs')) && (@orgs == 1))
51 :     {
52 :     @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
53 :     $ENV{"REQUEST_METHOD"} = "GET";
54 :     $ENV{"QUERY_STRING"} = "user=$user&request=find_in_org&role=$pattern&org=$orgs[0]";
55 :     my @out = `./pom.cgi`;
56 :     print join("",@out);
57 :     exit;
58 :     }
59 :     else
60 :     {
61 :     &show_indexed_objects($fig,$cgi,$html,$pattern);
62 :     }
63 :     }
64 :     elsif (($map = $cgi->param('kmap')) && $cgi->param('Metabolic Overview'))
65 :     {
66 :     $map =~ s/^.*\((MAP\d+)\).*$/$1/;
67 :     @orgs = $cgi->param('korgs');
68 :     @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
69 :     $ENV{"REQUEST_METHOD"} = "GET";
70 :     if (@orgs > 0)
71 :     {
72 :     $ENV{"QUERY_STRING"} = "user=$user&map=$map&org=$orgs[0]";
73 :     }
74 :     else
75 :     {
76 :     $ENV{"QUERY_STRING"} = "user=$user&map=$map";
77 :     }
78 :    
79 :     my @out = `./show_kegg_map.cgi`;
80 :     &HTML::trim_output(\@out);
81 :     push(@$html,@out);
82 :     }
83 :     elsif (($seq_pat = $cgi->param('seq_pat')) &&
84 :     (@orgs = $cgi->param('korgs')) &&
85 :     ($tool = $cgi->param('Tool')) &&
86 :     $cgi->param('Search for Matches'))
87 :     {
88 :     @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
89 :     if ($tool =~ /blast/)
90 :     {
91 :     &run_blast($fig,$cgi,$html,$orgs[0],$tool,$seq_pat);
92 :     }
93 :     elsif ($tool =~ /Protein scan_for_matches/)
94 :     {
95 :     &run_prot_scan_for_matches($fig,$cgi,$html,$orgs[0],$seq_pat);
96 :     }
97 :     elsif ($tool =~ /DNA scan_for_matches/)
98 :     {
99 :     &run_dna_scan_for_matches($fig,$cgi,$html,$orgs[0],$seq_pat);
100 :     }
101 :     }
102 :     else
103 :     {
104 :     &show_initial($fig,$cgi,$html);
105 :     }
106 :     &HTML::show_page($cgi,$html,1);
107 :    
108 :     sub show_initial {
109 :     my($fig,$cgi,$html) = @_;
110 :     my($map,$name,$olrg,$gs);
111 :    
112 : overbeek 1.2 my($a,$b,$e,$v) = $fig->genome_counts;
113 :    
114 :     push(@$html,$cgi->h2("Contains $a archaeal, $b bacterial, $e eukaryotic, and $v viral genomes"),$cgi->hr);
115 :    
116 : efrank 1.1 my @maps = sort map { $map = $_; $name = $fig->map_name($map); "$name ($map)" } $fig->all_maps;
117 :     my @orgs = sort map { $org = $_; $gs = $fig->genus_species($org); "$gs ($org)" } $fig->genomes;
118 :    
119 :     push(@$html,
120 :     $cgi->start_form(-action => "index.cgi"),
121 :     $cgi->h1('Searching for Genes or Functional Roles Using Text'),
122 :     "Search Pattern: ",
123 :     $cgi->textfield(-name => "pattern", -size => 50),
124 :     $cgi->br,
125 :     $cgi->br,
126 :     "User ID: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ",
127 :     $cgi->textfield(-name => "user", -size => 20),
128 :     "&nbsp; [optional]",
129 :     $cgi->br,
130 :     $cgi->br,
131 :     $cgi->submit('Search'),
132 :     $cgi->reset('Clear'),
133 :     $cgi->hr,
134 :     $cgi->h1('If You Need to Pick an Organism for Options Below'),
135 :     $cgi->scrolling_list(-name => 'korgs',
136 :     -values => [@orgs],
137 :     -size => 10
138 :     ),
139 :     $cgi->hr,
140 :     $cgi->h1('Finding Candidates for a Functional Role'),
141 :     "Make sure that you type the functional role you want to search for in the Search Pattern above",
142 :     $cgi->br,
143 :     $cgi->submit('Find Genes in Org that Might Play the Role'),
144 :     $cgi->hr,
145 :     $cgi->h1('Metabolic Overviews (via KEGG) - Choose KEGG Map'),
146 :     $cgi->submit('Metabolic Overview'),
147 :     $cgi->br,
148 :     $cgi->br,
149 :     $cgi->scrolling_list(-name => 'kmap',
150 :     -values => [@maps],
151 :     -size => 10
152 :     ),
153 :     $cgi->hr,
154 :     $cgi->h1('Searching DNA or Protein Sequences (in a selected organism)'),
155 :     "Sequence/Pattern: ",
156 :     $cgi->textarea(-name => 'seq_pat', -rows => 20, -cols => 70),
157 :     $cgi->popup_menu(-name => 'Tool', -values => ['blastp','blastx','blastn','tblastn','Protein scan_for_matches','DNA scan_for_matches'], -default => 'blastp'),
158 :     $cgi->submit('Search for Matches'),
159 :     $cgi->hr,
160 :     $cgi->h1('Searching for Interesting Genes'),
161 :     $cgi->submit('Search for Genes Matching an Occurrence Profile'),
162 :     $cgi->end_form,
163 :     $cgi->end_html
164 :     );
165 :    
166 :     }
167 :    
168 :     sub show_indexed_objects {
169 :     my($fig,$cgi,$html,$pattern) = @_;
170 :     my($msg,$i);
171 :    
172 :     if ($pattern =~ /^\s*(fig\|\d+\.\d+\.peg\.\d+)\s*$/)
173 :     {
174 :     my $peg = $1;
175 :     my $user = $cgi->param('user');
176 :     $user = $user ? $user : "";
177 :     $ENV{'REQUEST_METHOD'} = "GET";
178 :     $ENV{"QUERY_STRING"} = "prot=$peg\&user=$user";
179 :     $ENV{"REQUEST_URI"} =~ s/index.cgi/protein.cgi/;
180 :     my @prot_out = `./protein.cgi`;
181 :     &HTML::trim_output(\@prot_out);
182 :     push(@$html,@prot_out);
183 :     return;
184 :     }
185 :    
186 :     my($peg_index_data,$role_index_data) = $fig->search_index($pattern);
187 :     my $n = @$peg_index_data;
188 :     if ($n > 100)
189 :     {
190 :     $msg = "Showing First 100 Out of $n PEGs";
191 :     $#{$peg_index_data} = 99;
192 :     }
193 :     else
194 :     {
195 :     $msg = "Showing $n PEGs";
196 :     }
197 :    
198 :     my $col_hdrs = ["PEG","Organism","Aliases","Function","Who"];
199 :     my $tab = [ map { &format_peg_entry($fig,$cgi,$_) } @$peg_index_data ];
200 :     push(@$html,&HTML::make_table($col_hdrs,$tab,$msg), $cgi->hr);
201 :    
202 :     $n = @$role_index_data;
203 :     if ($n > 100)
204 :     {
205 :     $msg = "Showing First 100 Out of $n Roles";
206 :     $#{$role_index_data} = 99;
207 :     }
208 :     else
209 :     {
210 :     $msg = "Showing $n Roles";
211 :     }
212 :    
213 :     $col_hdrs = ["Role"];
214 :     $tab = [ map { &format_role_entry($fig,$cgi,$_) } @$role_index_data ];
215 :     push(@$html,&HTML::make_table($col_hdrs,$tab,$msg));
216 :     }
217 :    
218 :     sub format_peg_entry {
219 :     my($fig,$cgi,$entry) = @_;
220 :     my($i,$function,$who);
221 :    
222 :     my($peg,$gs,$aliases,@funcs) = @$entry;
223 :     my $user = $cgi->param('user');
224 :     $user = $user ? $user : "";
225 :    
226 :     @funcs = map { $_ =~ s/^function:\s*//; $_ } @funcs;
227 :    
228 :     if ($aliases)
229 :     {
230 :     $aliases =~ s/^aliases://;
231 :     }
232 :     else
233 :     {
234 :     $aliases = "";
235 :     }
236 :    
237 :     if ($user)
238 :     {
239 :     for ($i=0; ($i < @funcs) && ($funcs[$i] !~ /\#$user/); $i++) {}
240 :     if ($i < @funcs)
241 :     {
242 :     ($function,$who) = split(/\#/,$funcs[$i]);
243 :     }
244 :     }
245 :     if (! $function)
246 :     {
247 :     for ($i=0; ($i < @funcs) && ($funcs[$i] !~ /\#master/); $i++) {}
248 :     if ($i < @funcs)
249 :     {
250 :     ($function,$who) = split(/\#/,$funcs[$i]);
251 :     }
252 :     }
253 :    
254 :     if ((! $function) && (@funcs > 0))
255 :     {
256 :     ($function,$who) = split(/\#/,$funcs[0]);
257 :     }
258 :     return [&HTML::fid_link($cgi,$peg),$gs,$aliases,$function,$who];
259 :     }
260 :    
261 :     sub format_role_entry {
262 :     my($fig,$cgi,$entry) = @_;
263 :    
264 :     return [&HTML::role_link($cgi,$entry)];
265 :     }
266 :    
267 :     sub run_prot_scan_for_matches {
268 :     my($fig,$cgi,$html,$org,$pat) = @_;
269 :     my($string,$peg,$beg,$end,$user,$col_hdrs,$tab,$i);
270 :    
271 :     my $tmp_pat = "$FIG_Config::temp/tmp$$.pat";
272 :     open(PAT,">$tmp_pat")
273 :     || die "could not open $tmp_pat";
274 :     $pat =~ s/[\s\012\015]+/ /g;
275 :     print PAT "$pat\n";
276 :     close(PAT);
277 :     my @out = `$FIG_Config::ext_bin/scan_for_matches -p $tmp_pat < $FIG_Config::organisms/$org/Features/peg/fasta`;
278 :     if (@out < 1)
279 :     {
280 :     push(@$html,$cgi->h1("Sorry, no hits"));
281 :     }
282 :     else
283 :     {
284 :     if (@out > 2000)
285 :     {
286 :     push(@$html,$cgi->h1("truncating to the first 1000 hits"));
287 :     $#out = 1999;
288 :     }
289 :    
290 :     push(@$html,$cgi->pre);
291 :     $user = $cgi->param('user');
292 :     $col_hdrs = ["peg","begin","end","string","function of peg"];
293 :     for ($i=0; ($i < @out); $i += 2)
294 :     {
295 :     if ($out[$i] =~ /^>([^:]+):\[(\d+),(\d+)\]/)
296 :     {
297 :     $peg = $1;
298 :     $beg = $2;
299 :     $end = $3;
300 :     $string = $out[$i+1];
301 :     chop $string;
302 :     push(@$tab,[&HTML::fid_link($cgi,$peg,1),$beg,$end,$string,scalar $fig->function_of($peg,$user)]);
303 :     }
304 :     }
305 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Matches"));
306 :     push(@$html,$cgi->end_pre);
307 :     }
308 :     unlink($tmp_pat);
309 :     }
310 :    
311 :     sub run_dna_scan_for_matches {
312 :     my($fig,$cgi,$html,$org,$pat) = @_;
313 :     my($string,$contig,$beg,$end,$col_hdrs,$tab,$i);
314 :    
315 :     my $tmp_pat = "$FIG_Config::temp/tmp$$.pat";
316 :     open(PAT,">$tmp_pat")
317 :     || die "could not open $tmp_pat";
318 :     $pat =~ s/[\s\012\015]+/ /g;
319 :     print PAT "$pat\n";
320 :     close(PAT);
321 :     my @out = `cat $FIG_Config::organisms/$org/contigs | $FIG_Config::ext_bin/scan_for_matches -c $tmp_pat`;
322 :     if (@out < 1)
323 :     {
324 :     push(@$html,$cgi->h1("Sorry, no hits"));
325 :     }
326 :     else
327 :     {
328 :     if (@out > 2000)
329 :     {
330 :     push(@$html,$cgi->h1("truncating to the first 1000 hits"));
331 :     $#out = 1999;
332 :     }
333 :    
334 :     push(@$html,$cgi->pre);
335 :     $col_hdrs = ["contig","begin","end","string"];
336 :     for ($i=0; ($i < @out); $i += 2)
337 :     {
338 :     if ($out[$i] =~ /^>([^:]+):\[(\d+),(\d+)\]/)
339 :     {
340 :     $contig = $1;
341 :     $beg = $2;
342 :     $end = $3;
343 :     $string = $out[$i+1];
344 :     chop $string;
345 :     push(@$tab,[$contig,$beg,$end,$string]);
346 :     }
347 :     }
348 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Matches"));
349 :     push(@$html,$cgi->end_pre);
350 :     }
351 :     unlink($tmp_pat);
352 :     }
353 :    
354 :     sub run_blast {
355 :     my($fig,$cgi,$html,$org,$tool,$seq) = @_;
356 :     my($query,@out);
357 :    
358 :     my $tmp_seq = "$FIG_Config::temp/tmp$$.seq";
359 :    
360 :     if ($seq =~ /^\s*([a-zA-Z]{2,4}\|\S+)/)
361 :     {
362 :     my $id = $1;
363 :     $seq = "";
364 :     if (($tool eq "blastp") || ($tool eq "tblastn"))
365 :     {
366 :     $seq = $fig->get_translation($id);
367 :     }
368 :     elsif ($id =~ /^fig/)
369 :     {
370 :     my @locs;
371 :     if ((@locs = $fig->feature_location($id)) && (@locs > 0))
372 :     {
373 :     $seq = $fig->dna_seq($fig->genome_of($id),@locs);
374 :     }
375 :     }
376 :     if (! $seq)
377 :     {
378 :     push(@$html,$cgi->h1("Sorry, could not get sequence for $id"));
379 :     return;
380 :     }
381 :     }
382 :     elsif ($seq =~ s/^>(\S+)[^\n\012\015]*//)
383 :     {
384 :     $query = $1;
385 :     }
386 :     else
387 :     {
388 :     $query = "query";
389 :     }
390 :     $seq =~ s/\s//g;
391 :     open(SEQ,">$tmp_seq")
392 :     || die "could not open $tmp_seq";
393 :     print SEQ ">$query\n$seq\n";
394 :     close(SEQ);
395 :    
396 :     if (! $ENV{"BLASTMAT"}) { $ENV{"BLASTMAT"} = "$FIG_Config::blastmat" }
397 :    
398 :     if ($tool eq "blastp")
399 :     {
400 :     &verify_db("$FIG_Config::organisms/$org/Features/peg/fasta","p");
401 :     @out = map { &HTML::set_prot_links($cgi,$_) } `$FIG_Config::ext_bin/blastall -i $tmp_seq -d $FIG_Config::organisms/$org/Features/peg/fasta -p blastp`;
402 :     }
403 :     elsif ($tool eq "blastx")
404 :     {
405 :     &verify_db("$FIG_Config::organisms/$org/Features/peg/fasta","p");
406 :     @out = map { &HTML::set_prot_links($cgi,$_) } `$FIG_Config::ext_bin/blastall -i $tmp_seq -d $FIG_Config::organisms/$org/Features/peg/fasta -p blastx`;
407 :     }
408 :     elsif ($tool eq "blastn")
409 :     {
410 :     &verify_db("$FIG_Config::organisms/$org/contigs","n"); ### fix to get all contigs
411 :     @out = `$FIG_Config::ext_bin/blastall -i $tmp_seq -d $FIG_Config::organisms/$org/contigs -p blastn`;
412 :     }
413 :     elsif ($tool eq "tblastn")
414 :     {
415 :     &verify_db("$FIG_Config::organisms/$org/contigs","n"); ### fix to get all contigs
416 :     @out = `$FIG_Config::ext_bin/blastall -i $tmp_seq -d $FIG_Config::organisms/$org/contigs -p tblastn`;
417 :     }
418 :    
419 :     if (@out < 1)
420 :     {
421 :     push(@$html,$cgi->h1("Sorry, no hits"));
422 :     }
423 :     else
424 :     {
425 :     push(@$html,$cgi->pre);
426 :     push(@$html,@out);
427 :     push(@$html,$cgi->end_pre);
428 :     }
429 :     unlink($tmp_seq);
430 :     }
431 :    
432 :     sub verify_db {
433 :     my($db,$type) = @_;
434 :    
435 :     if ($type =~ /p/i)
436 :     {
437 :     if ((! -s "$db.psq") || (-M "$db.psq" > -M $db))
438 :     {
439 :     system "$FIG_Config::ext_bin/formatdb -p T -i $db";
440 :     }
441 :     }
442 :     else
443 :     {
444 :     if ((! -s "$db.nsq") || (-M "$db.nsq" > -M $db))
445 :     {
446 :     system "$FIG_Config::ext_bin/formatdb -p F -i $db";
447 :     }
448 :     }
449 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3