[Bio] / FigWebServices / index.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/index.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.34 - (view) (download)

1 : efrank 1.1 use FIG;
2 :     my $fig = new FIG;
3 :    
4 :     use HTML;
5 :     use strict;
6 :     use CGI;
7 :     my $cgi = new CGI;
8 :    
9 : overbeek 1.28 my($map,@orgs,$user,$map,$org,$made_by,$from_func,$to_func);
10 : efrank 1.1
11 :     if (0)
12 :     {
13 :     print $cgi->header;
14 :     my @params = $cgi->param;
15 :     print "<pre>\n";
16 :     foreach $_ (@params)
17 :     {
18 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
19 :     }
20 :     print "=======\n";
21 :     foreach $_ (sort keys(%ENV))
22 :     {
23 :     print "$_\t$ENV{$_}\n";
24 :     }
25 :     exit;
26 :     }
27 :    
28 :     $ENV{"PATH"} = "$FIG_Config::bin:$FIG_Config::ext_bin:" . $ENV{"PATH"};
29 :    
30 :     my $html = [];
31 : golsen 1.23
32 : efrank 1.5 my @ver = `cat $FIG_Config::fig_disk/CURRENT_RELEASE`;
33 : golsen 1.21 chomp $ver[0];
34 : disz 1.26 my $p2p_url = &FIG::cgi_url . "/p2p/seed_update_page.cgi";
35 :     my $new_p2p_url = &FIG::cgi_url . "/p2p/new_seed_update_page.cgi";
36 : olson 1.24 my $host = $fig->get_local_hostname();
37 : efrank 1.5 push(@$html,
38 : olson 1.24 "You are currently running SEED version <b>$ver[0]</b> on $host<br>",
39 : olson 1.34 "To start a peer-to-peer update, <a href=$new_p2p_url>click here</a><br>\n"
40 : efrank 1.5 );
41 :    
42 : overbeek 1.30 my($pattern,$seq_pat,$tool,$ids);
43 : efrank 1.1 my $user = $cgi->param('user');
44 :     if (! $user) { $user = "" }
45 :    
46 : overbeek 1.28 if ($cgi->param('Search for Genes Matching an Occurrence Profile or Common to a Set of Organisms'))
47 : efrank 1.1 {
48 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Phylogenetic Signatures</TITLE>\n";
49 : efrank 1.1 my $url = $cgi->url;
50 :     $ENV{"REQUEST_METHOD"} = "GET";
51 :     $ENV{"QUERY_STRING"} = "user=$user";
52 :     my @out = `./sigs.cgi`;
53 :     &HTML::trim_output(\@out);
54 :     push(@$html,@out);
55 :     }
56 : overbeek 1.17 #-----------------------------------------------------------------------
57 : overbeek 1.31 # Align Sequences
58 :     #-----------------------------------------------------------------------
59 :     elsif ($cgi->param('Align Sequences'))
60 :     {
61 :     my $seqs = $cgi->param('seqids');
62 :     $seqs =~ s/^\s+//;
63 :     $seqs =~ s/\s+$//;
64 :     my @seq_ids = split(/[ \t,;]+/,$seqs);
65 :     if (@seq_ids < 2)
66 :     {
67 :     print $cgi->header;
68 :     print $cgi->h1("Sorry, you need to specify at least two sequence IDs");
69 :     }
70 :     else
71 :     {
72 :     $ENV{"REQUEST_METHOD"} = "GET";
73 :     $_ = join('&checked=',@seq_ids);
74 :     $ENV{"QUERY_STRING"} = "user=$user&align=1&checked=" . $_;
75 :     my @out = `./fid_checked.cgi`;
76 :     print join("",@out);
77 :     }
78 :     exit;
79 :     }
80 :     #-----------------------------------------------------------------------
81 : overbeek 1.17 # Search (text) || Find Genes in Org that Might Play the Role
82 :     #-----------------------------------------------------------------------
83 : efrank 1.1 elsif (($pattern = $cgi->param('pattern')) && ($cgi->param('Search') || $cgi->param('Find Genes in Org that Might Play the Role')))
84 :     {
85 : overbeek 1.17 # Remove leading and trailing spaces from pattern -- GJO:
86 :     $pattern =~ s/^\s+//;
87 :     $pattern =~ s/\s+$//;
88 : efrank 1.1 if ($cgi->param('Find Genes in Org that Might Play the Role') &&
89 :     (@orgs = $cgi->param('korgs')) && (@orgs == 1))
90 :     {
91 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Genes in that Might Play Specific Role</TITLE>\n";
92 : efrank 1.1 @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
93 :     $ENV{"REQUEST_METHOD"} = "GET";
94 :     $ENV{"QUERY_STRING"} = "user=$user&request=find_in_org&role=$pattern&org=$orgs[0]";
95 :     my @out = `./pom.cgi`;
96 :     print join("",@out);
97 :     exit;
98 :     }
99 :     else
100 :     {
101 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Search Results</TITLE>\n";
102 : golsen 1.22 &show_indexed_objects($fig, $cgi, $html, $pattern);
103 : efrank 1.1 }
104 :     }
105 : overbeek 1.17 #-----------------------------------------------------------------------
106 :     # Metabolic Overview
107 :     #-----------------------------------------------------------------------
108 : efrank 1.1 elsif (($map = $cgi->param('kmap')) && $cgi->param('Metabolic Overview'))
109 :     {
110 :     $map =~ s/^.*\((MAP\d+)\).*$/$1/;
111 :     @orgs = $cgi->param('korgs');
112 :     @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
113 :     $ENV{"REQUEST_METHOD"} = "GET";
114 :     if (@orgs > 0)
115 :     {
116 :     $ENV{"QUERY_STRING"} = "user=$user&map=$map&org=$orgs[0]";
117 :     }
118 :     else
119 :     {
120 :     $ENV{"QUERY_STRING"} = "user=$user&map=$map";
121 :     }
122 :    
123 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Metabolic Overview</TITLE>\n";
124 : efrank 1.1 my @out = `./show_kegg_map.cgi`;
125 :     &HTML::trim_output(\@out);
126 : golsen 1.23 push( @$html, "<br>\n", @out );
127 : efrank 1.1 }
128 : overbeek 1.17
129 :     #-----------------------------------------------------------------------
130 :     # Search for Matches (sequence or pattern)
131 :     #-----------------------------------------------------------------------
132 : efrank 1.1 elsif (($seq_pat = $cgi->param('seq_pat')) &&
133 :     ($tool = $cgi->param('Tool')) &&
134 :     $cgi->param('Search for Matches'))
135 :     {
136 : overbeek 1.30 @orgs = $cgi->param('korgs');
137 :     if (@orgs > 0)
138 :     {
139 :     @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
140 :     }
141 :     else
142 :     {
143 :     @orgs = ("");
144 :     }
145 :    
146 : efrank 1.1 if ($tool =~ /blast/)
147 :     {
148 : golsen 1.23 unshift @$html, "<TITLE>The SEED: BLAST Search Results</TITLE>\n";
149 : efrank 1.1 &run_blast($fig,$cgi,$html,$orgs[0],$tool,$seq_pat);
150 :     }
151 :     elsif ($tool =~ /Protein scan_for_matches/)
152 :     {
153 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Protein Pattern Match Results</TITLE>\n";
154 : efrank 1.1 &run_prot_scan_for_matches($fig,$cgi,$html,$orgs[0],$seq_pat);
155 :     }
156 :     elsif ($tool =~ /DNA scan_for_matches/)
157 :     {
158 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Nucleotide Pattern Match Results</TITLE>\n";
159 : efrank 1.1 &run_dna_scan_for_matches($fig,$cgi,$html,$orgs[0],$seq_pat);
160 :     }
161 :     }
162 : overbeek 1.7 elsif (($made_by = $cgi->param('made_by')) && $cgi->param('Extract Assignments'))
163 :     {
164 :     &export_assignments($fig,$cgi,$html,$made_by);
165 :     }
166 : overbeek 1.28 elsif ($cgi->param('Generate Assignments via Translation') &&
167 :     ($from_func = $cgi->param('from_func')) &&
168 :     ($to_func = $cgi->param('to_func')))
169 :     {
170 :     &translate_assignments($fig,$cgi,$html,$from_func,$to_func);
171 :     }
172 : overbeek 1.30 elsif ($cgi->param('Extract Matched Sequences') && ($ids = $cgi->param('ids')))
173 :     {
174 :     my @ids = split(/,/,$ids);
175 :     my($list_to,$i);
176 :     if ($list_to = $cgi->param('list_to'))
177 :     {
178 :     for ($i=0; ($i < @ids) && ($ids[$i] ne $list_to); $i++) {}
179 :     if ($i < @ids)
180 :     {
181 :     $#ids = $i;
182 :     }
183 :     }
184 :    
185 :     my($id,$seq,$i,$func);
186 :     push(@$html,$cgi->pre);
187 :    
188 :     foreach $id (@ids)
189 :     {
190 :     if ($seq = $fig->get_translation($id))
191 :     {
192 :     $func = $fig->function_of($id);
193 :     push(@$html,">$id $func\n");
194 :     for ($i=0; ($i < length($seq)); $i += 60)
195 :     {
196 :     if ($i > (length($seq) - 60))
197 :     {
198 :     push(@$html,substr($seq,$i) . "\n");
199 :     }
200 :     else
201 :     {
202 :     push(@$html,substr($seq,$i,60) . "\n");
203 :     }
204 :     }
205 :     }
206 :     }
207 :     push(@$html,$cgi->end_pre);
208 :     }
209 : overbeek 1.17
210 :     #-----------------------------------------------------------------------
211 :     # Initial search page
212 :     #-----------------------------------------------------------------------
213 : efrank 1.1 else
214 :     {
215 : golsen 1.23 unshift @$html, "<TITLE>The SEED: Entry Page</TITLE>\n";
216 : efrank 1.1 &show_initial($fig,$cgi,$html);
217 :     }
218 :     &HTML::show_page($cgi,$html,1);
219 :    
220 : overbeek 1.17
221 :     #==============================================================================
222 :     # Initial page (alias search)
223 :     #==============================================================================
224 :    
225 : efrank 1.1 sub show_initial {
226 :     my($fig,$cgi,$html) = @_;
227 :     my($map,$name,$olrg,$gs);
228 :    
229 : overbeek 1.2 my($a,$b,$e,$v) = $fig->genome_counts;
230 : overbeek 1.6 push(@$html,$cgi->h2("Contains $a archaeal, $b bacterial, $e eukaryotic, and $v viral genomes"));
231 :     my($a,$b,$e,$v) = $fig->genome_counts("complete");
232 :     push(@$html,$cgi->h2("Of these, $a archaeal, $b bacterial, and $e eukaryotic genomes are more-or-less complete"),$cgi->hr);
233 : overbeek 1.2
234 : efrank 1.1 my @maps = sort map { $map = $_; $name = $fig->map_name($map); "$name ($map)" } $fig->all_maps;
235 : overbeek 1.6 my @orgs = sort map { $org = $_; $gs = $fig->genus_species($org); "$gs ($org)" } $fig->genomes("complete",undef);
236 : efrank 1.1
237 :     push(@$html,
238 :     $cgi->start_form(-action => "index.cgi"),
239 :     $cgi->h1('Searching for Genes or Functional Roles Using Text'),
240 : overbeek 1.17 "<table><tr>",
241 :     "<td>Search Pattern: </td><td>",
242 :     $cgi->textfield(-name => "pattern", -size => 65),
243 :     "</td></tr><tr>",
244 :     "<td>User ID:</td><td>",
245 : efrank 1.1 $cgi->textfield(-name => "user", -size => 20),
246 : overbeek 1.17 " [optional] ",
247 :     "&nbsp; &nbsp; Max Genes: ",
248 :     $cgi->textfield(-name => "maxpeg", -size => 6, -value => 100),
249 :     "&nbsp; &nbsp; Max Roles: ",
250 :     $cgi->textfield(-name => "maxrole", -size => 6, -value => 100),
251 :     "</td></td></table>",
252 : efrank 1.1 $cgi->submit('Search'),
253 :     $cgi->reset('Clear'),
254 :     $cgi->hr,
255 : overbeek 1.17
256 : efrank 1.1 $cgi->h1('If You Need to Pick an Organism for Options Below'),
257 :     $cgi->scrolling_list(-name => 'korgs',
258 :     -values => [@orgs],
259 :     -size => 10
260 :     ),
261 :     $cgi->hr,
262 : overbeek 1.17
263 : efrank 1.1 $cgi->h1('Finding Candidates for a Functional Role'),
264 :     "Make sure that you type the functional role you want to search for in the Search Pattern above",
265 :     $cgi->br,
266 :     $cgi->submit('Find Genes in Org that Might Play the Role'),
267 :     $cgi->hr,
268 : overbeek 1.17
269 : efrank 1.1 $cgi->h1('Metabolic Overviews (via KEGG) - Choose KEGG Map'),
270 :     $cgi->submit('Metabolic Overview'),
271 :     $cgi->br,
272 :     $cgi->br,
273 :     $cgi->scrolling_list(-name => 'kmap',
274 :     -values => [@maps],
275 :     -size => 10
276 :     ),
277 :     $cgi->hr,
278 : overbeek 1.17
279 : efrank 1.1 $cgi->h1('Searching DNA or Protein Sequences (in a selected organism)'),
280 : golsen 1.29 "<TABLE>\n",
281 :     " <TR>\n",
282 :     " <TD>Sequence/Pattern: </TD>",
283 :     " <TD>", $cgi->textarea(-name => 'seq_pat', -rows => 10, -cols => 70), "</TD>\n",
284 :     " </TR>\n",
285 :     " <TR>\n",
286 :     " <TD>Search Program: </TD>",
287 : overbeek 1.30 " <TD>", $cgi->popup_menu(-name => 'Tool', -values => ['blastp','blastx','blastn','tblastn','blastp against complete genomes','Protein scan_for_matches','DNA scan_for_matches'], -default => 'blastp'), "</TD>",
288 : golsen 1.29 " </TR>\n",
289 :     "</TABLE>\n",
290 : efrank 1.1 $cgi->submit('Search for Matches'),
291 :     $cgi->hr,
292 : overbeek 1.17
293 : overbeek 1.7 $cgi->h1('Exporting Assignments'),
294 :     "Extract assignments made by ",
295 :     $cgi->textfield(-name => "made_by", -size => 50),
296 :     $cgi->br,
297 : overbeek 1.15 "Save as user: ",
298 :     $cgi->textfield(-name => "save_user", -size => 50),
299 :     $cgi->br,
300 : overbeek 1.10 "After date (MM/DD/YYYY) ",
301 :     $cgi->textfield(-name => "after_date", -size => 15),
302 :     $cgi->br,
303 : overbeek 1.11 $cgi->checkbox(-label => 'tab-delimited Spreadsheet: ', -name => 'tabs', -value => 1),
304 :     $cgi->br,
305 :     $cgi->checkbox(-label => 'Save Assignments: ', -name => 'save_assignments', -value => 1),
306 : overbeek 1.7 $cgi->br,
307 :     $cgi->submit('Extract Assignments'),
308 : overbeek 1.28 $cgi->br, $cgi->br,
309 :     "Alternatively, you can generate a set of assignments as translations of existing assignments.",
310 :     $cgi->br,
311 :     "From: ",$cgi->textfield(-name => "from_func", -size => 60),
312 :     $cgi->br,
313 :     "To:&nbsp;&nbsp;&nbsp;&nbsp; ",$cgi->textfield(-name => "to_func", -size => 60),
314 :     $cgi->br,
315 :     $cgi->submit('Generate Assignments via Translation'),
316 : overbeek 1.7 $cgi->hr,
317 : efrank 1.1 $cgi->h1('Searching for Interesting Genes'),
318 : overbeek 1.28 $cgi->submit('Search for Genes Matching an Occurrence Profile or Common to a Set of Organisms'),
319 : overbeek 1.17 $cgi->end_form
320 : overbeek 1.14 );
321 :    
322 :     push(@$html,
323 :     $cgi->hr,
324 :     $cgi->h1('Process Saved Assignments Sets'),
325 :     $cgi->start_form(-action => "assignments.cgi"),
326 : overbeek 1.19 "Enter user: ",
327 : overbeek 1.14 $cgi->textfield(-name => "user", -size => 20),
328 :     $cgi->submit('Process Assignment Sets'),
329 : overbeek 1.17 $cgi->end_form
330 : efrank 1.1 );
331 :    
332 : overbeek 1.19 push(@$html,
333 :     $cgi->hr,
334 :     $cgi->h1('Work on Subsystems'),
335 :     $cgi->start_form(-action => "ssa.cgi"),
336 :     "Enter user: ",
337 :     $cgi->textfield(-name => "user", -size => 20),
338 :     $cgi->submit('Work on Subsystems'),
339 : overbeek 1.27 $cgi->end_form,
340 :     $cgi->h2('Try the New, Somewhat Experimental, Version'),
341 :     $cgi->start_form(-action => "ssa2.cgi"),
342 :     "Enter user: ",
343 :     $cgi->textfield(-name => "user", -size => 20),
344 :     $cgi->submit('Work on Subsystems'),
345 :     $cgi->end_form,
346 : overbeek 1.19 );
347 :    
348 : overbeek 1.31 push(@$html,
349 :     $cgi->hr,
350 :     $cgi->h1('Align Sequences'),
351 :     $cgi->start_form(-action => "index.cgi"),
352 :     "Enter user: ",
353 :     $cgi->textfield(-name => "user", -size => 20), $cgi->br,
354 :     $cgi->submit('Align Sequences'),": ",
355 :     $cgi->textfield(-name => "seqids", -size => 100),
356 :     $cgi->end_form
357 :     );
358 : efrank 1.1 }
359 :    
360 : overbeek 1.17
361 :     #==============================================================================
362 :     # Indexed objects (text search)
363 :     #==============================================================================
364 :    
365 : efrank 1.1 sub show_indexed_objects {
366 : golsen 1.22 my($fig, $cgi, $html, $pattern) = @_;
367 :     my($msg, $i);
368 : efrank 1.1
369 :     if ($pattern =~ /^\s*(fig\|\d+\.\d+\.peg\.\d+)\s*$/)
370 :     {
371 :     my $peg = $1;
372 :     my $user = $cgi->param('user');
373 :     $user = $user ? $user : "";
374 :     $ENV{'REQUEST_METHOD'} = "GET";
375 :     $ENV{"QUERY_STRING"} = "prot=$peg\&user=$user";
376 :     $ENV{"REQUEST_URI"} =~ s/index.cgi/protein.cgi/;
377 :     my @prot_out = `./protein.cgi`;
378 :     &HTML::trim_output(\@prot_out);
379 :     push(@$html,@prot_out);
380 :     return;
381 :     }
382 :    
383 : overbeek 1.17 push( @$html, $cgi->br );
384 :     my( $peg_index_data, $role_index_data ) = $fig->search_index($pattern);
385 :     my $maxpeg = defined( $cgi->param("maxpeg") ) ? $cgi->param("maxpeg") : 100;
386 :     my $maxrole = defined( $cgi->param("maxrole") ) ? $cgi->param("maxrole") : 100;
387 : golsen 1.22 my $check_all = $cgi->param('Select all') || 0;
388 : overbeek 1.17
389 :     if ($maxpeg > 0)
390 :     {
391 :     push( @$html, $cgi->start_form(-action => "index.cgi"),
392 :     $cgi->hidden(-name => 'user', -value => $user),
393 :     $cgi->hidden(-name => 'pattern', -value => $pattern),
394 :     $cgi->hidden(-name => 'maxpeg', -value => $maxpeg),
395 : golsen 1.21 $cgi->hidden(-name => 'maxrole', -value => $maxrole),
396 : overbeek 1.17 $cgi->hidden(-name => 'Search', -value => 'Search'),
397 :     $cgi->submit( $check_all ? 'Deselect all' : 'Select all'),
398 :     $cgi->end_form
399 :     );
400 :    
401 :     push( @$html, $cgi->start_form( -method => 'post',
402 :     -target => "window$$",
403 :     -action => 'fid_checked.cgi'
404 :     ),
405 :     $cgi->hidden(-name => 'user', -value => $user),
406 : golsen 1.21 "For Selected (checked) sequences: ",
407 : overbeek 1.17 $cgi->submit('get sequences'),
408 :     $cgi->submit('view annotations'),
409 : overbeek 1.33 $cgi->submit('assign/annotate'),
410 : overbeek 1.17 $cgi->br, $cgi->br
411 :     );
412 : efrank 1.1
413 : overbeek 1.17 my $n = @$peg_index_data;
414 :     if ($n > $maxpeg)
415 :     {
416 :     $msg = "Showing First $maxpeg Out of $n PEGs";
417 :     $#{$peg_index_data} = $maxpeg-1;
418 :     }
419 :     else
420 :     {
421 :     $msg = "Showing $n PEGs";
422 :     }
423 : efrank 1.1
424 : overbeek 1.17 my $col_hdrs = ["Sel","PEG","Organism","Aliases","Function","Who"];
425 :     my $tab = [ map { &format_peg_entry($fig,$cgi,$_,$check_all) } @$peg_index_data ];
426 :     push( @$html, &HTML::make_table($col_hdrs,$tab,$msg),
427 :     $cgi->br,
428 :     "For SELECTed (checked) sequences: ",
429 :     $cgi->submit('get sequences'),
430 :     $cgi->submit('view annotations'),
431 :     $cgi->br,
432 :     $cgi->end_form
433 :     );
434 : efrank 1.1 }
435 : overbeek 1.17
436 :     if ($maxrole > 0)
437 : efrank 1.1 {
438 : overbeek 1.17 my $n = @$role_index_data;
439 :     if ($n > $maxrole)
440 :     {
441 :     $msg = "Showing First $maxrole Out of $n Roles";
442 :     $#{$role_index_data} = $maxrole - 1;
443 :     }
444 :     else
445 :     {
446 :     $msg = "Showing $n Roles";
447 :     }
448 :    
449 :     if ( $maxpeg > 0 ) { push( @$html, $cgi->hr ) }
450 :     my $col_hdrs = ["Role"];
451 :     my $tab = [ map { &format_role_entry($fig,$cgi,$_) } @$role_index_data ];
452 :     push( @$html, &HTML::make_table($col_hdrs,$tab,$msg) );
453 : efrank 1.1 }
454 :     }
455 :    
456 :     sub format_peg_entry {
457 : overbeek 1.17 my( $fig, $cgi, $entry, $checked) = @_;
458 : efrank 1.1 my($i,$function,$who);
459 :    
460 :     my($peg,$gs,$aliases,@funcs) = @$entry;
461 : overbeek 1.17
462 : golsen 1.21 $gs =~ s/\s+\d+$//; # Org name comes with taxon_id appended (why?) -- GJO
463 : efrank 1.1
464 :     @funcs = map { $_ =~ s/^function:\s*//; $_ } @funcs;
465 :    
466 :     if ($aliases)
467 :     {
468 :     $aliases =~ s/^aliases://;
469 :     }
470 :     else
471 :     {
472 :     $aliases = "";
473 :     }
474 :    
475 : golsen 1.21 my $user = $cgi->param('user');
476 :     $user = $user ? $user : "";
477 :    
478 : efrank 1.1 if ($user)
479 :     {
480 :     for ($i=0; ($i < @funcs) && ($funcs[$i] !~ /\#$user/); $i++) {}
481 :     if ($i < @funcs)
482 :     {
483 :     ($function,$who) = split(/\#/,$funcs[$i]);
484 :     }
485 :     }
486 : golsen 1.21
487 : efrank 1.1 if (! $function)
488 :     {
489 :     for ($i=0; ($i < @funcs) && ($funcs[$i] !~ /\#master/); $i++) {}
490 :     if ($i < @funcs)
491 :     {
492 :     ($function,$who) = split(/\#/,$funcs[$i]);
493 :     }
494 :     }
495 :    
496 :     if ((! $function) && (@funcs > 0))
497 :     {
498 :     ($function,$who) = split(/\#/,$funcs[0]);
499 :     }
500 : golsen 1.21 my $box = "<input type=checkbox name=checked value=\"$peg\""
501 :     . ($checked ? " checked=1" : "")
502 : overbeek 1.17 . ">";
503 :     return [ $box, &HTML::fid_link($cgi,$peg), $gs, $aliases, $function, $who ];
504 : efrank 1.1 }
505 :    
506 :     sub format_role_entry {
507 :     my($fig,$cgi,$entry) = @_;
508 :    
509 :     return [&HTML::role_link($cgi,$entry)];
510 :     }
511 :    
512 :     sub run_prot_scan_for_matches {
513 :     my($fig,$cgi,$html,$org,$pat) = @_;
514 :     my($string,$peg,$beg,$end,$user,$col_hdrs,$tab,$i);
515 :    
516 :     my $tmp_pat = "$FIG_Config::temp/tmp$$.pat";
517 :     open(PAT,">$tmp_pat")
518 :     || die "could not open $tmp_pat";
519 :     $pat =~ s/[\s\012\015]+/ /g;
520 :     print PAT "$pat\n";
521 :     close(PAT);
522 :     my @out = `$FIG_Config::ext_bin/scan_for_matches -p $tmp_pat < $FIG_Config::organisms/$org/Features/peg/fasta`;
523 :     if (@out < 1)
524 :     {
525 :     push(@$html,$cgi->h1("Sorry, no hits"));
526 :     }
527 :     else
528 :     {
529 :     if (@out > 2000)
530 :     {
531 :     push(@$html,$cgi->h1("truncating to the first 1000 hits"));
532 :     $#out = 1999;
533 :     }
534 :    
535 :     push(@$html,$cgi->pre);
536 :     $user = $cgi->param('user');
537 :     $col_hdrs = ["peg","begin","end","string","function of peg"];
538 :     for ($i=0; ($i < @out); $i += 2)
539 :     {
540 :     if ($out[$i] =~ /^>([^:]+):\[(\d+),(\d+)\]/)
541 :     {
542 :     $peg = $1;
543 :     $beg = $2;
544 :     $end = $3;
545 :     $string = $out[$i+1];
546 : golsen 1.21 chomp $string;
547 : overbeek 1.17 push( @$tab, [ &HTML::fid_link($cgi,$peg,1),
548 :     $beg,
549 :     $end,
550 :     $string,
551 :     scalar $fig->function_of( $peg, $user )
552 :     ]
553 :     );
554 : efrank 1.1 }
555 :     }
556 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Matches"));
557 :     push(@$html,$cgi->end_pre);
558 :     }
559 :     unlink($tmp_pat);
560 :     }
561 :    
562 : overbeek 1.17 #==============================================================================
563 :     # Scan for matches
564 :     #==============================================================================
565 :    
566 : efrank 1.1 sub run_dna_scan_for_matches {
567 :     my($fig,$cgi,$html,$org,$pat) = @_;
568 :     my($string,$contig,$beg,$end,$col_hdrs,$tab,$i);
569 :    
570 :     my $tmp_pat = "$FIG_Config::temp/tmp$$.pat";
571 :     open(PAT,">$tmp_pat")
572 :     || die "could not open $tmp_pat";
573 :     $pat =~ s/[\s\012\015]+/ /g;
574 :     print PAT "$pat\n";
575 :     close(PAT);
576 :     my @out = `cat $FIG_Config::organisms/$org/contigs | $FIG_Config::ext_bin/scan_for_matches -c $tmp_pat`;
577 :     if (@out < 1)
578 :     {
579 :     push(@$html,$cgi->h1("Sorry, no hits"));
580 :     }
581 :     else
582 :     {
583 :     if (@out > 2000)
584 :     {
585 :     push(@$html,$cgi->h1("truncating to the first 1000 hits"));
586 :     $#out = 1999;
587 :     }
588 :    
589 :     push(@$html,$cgi->pre);
590 :     $col_hdrs = ["contig","begin","end","string"];
591 :     for ($i=0; ($i < @out); $i += 2)
592 :     {
593 :     if ($out[$i] =~ /^>([^:]+):\[(\d+),(\d+)\]/)
594 :     {
595 :     $contig = $1;
596 :     $beg = $2;
597 :     $end = $3;
598 :     $string = $out[$i+1];
599 : golsen 1.21 chomp $string;
600 : efrank 1.1 push(@$tab,[$contig,$beg,$end,$string]);
601 :     }
602 :     }
603 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Matches"));
604 :     push(@$html,$cgi->end_pre);
605 :     }
606 :     unlink($tmp_pat);
607 :     }
608 :    
609 : overbeek 1.17 #==============================================================================
610 :     # BLAST search
611 :     #==============================================================================
612 :    
613 : efrank 1.1 sub run_blast {
614 :     my($fig,$cgi,$html,$org,$tool,$seq) = @_;
615 :     my($query,@out);
616 :    
617 :     my $tmp_seq = "$FIG_Config::temp/tmp$$.seq";
618 :    
619 : overbeek 1.17 #--------------------------------------------------------------------------
620 :     # Is the request for an id? Get the sequence
621 :     #--------------------------------------------------------------------------
622 : efrank 1.1 if ($seq =~ /^\s*([a-zA-Z]{2,4}\|\S+)/)
623 :     {
624 : golsen 1.23 # Replaced $id with $query so that output inherits label -- GJO
625 :     $query = $1;
626 : efrank 1.1 $seq = "";
627 :     if (($tool eq "blastp") || ($tool eq "tblastn"))
628 :     {
629 : golsen 1.23 $seq = $fig->get_translation($query);
630 : efrank 1.1 }
631 : golsen 1.23 elsif ($query =~ /^fig/)
632 : efrank 1.1 {
633 :     my @locs;
634 : golsen 1.23 if ((@locs = $fig->feature_location($query)) && (@locs > 0))
635 : efrank 1.1 {
636 : golsen 1.23 $seq = $fig->dna_seq($fig->genome_of($query),@locs);
637 : efrank 1.1 }
638 :     }
639 :     if (! $seq)
640 :     {
641 : golsen 1.23 push(@$html,$cgi->h1("Sorry, could not get sequence for $query"));
642 : efrank 1.1 return;
643 :     }
644 :     }
645 : overbeek 1.17 #--------------------------------------------------------------------------
646 :     # Is it a fasta format? Get the query name
647 :     #--------------------------------------------------------------------------
648 : efrank 1.1 elsif ($seq =~ s/^>(\S+)[^\n\012\015]*//)
649 :     {
650 :     $query = $1;
651 :     }
652 : overbeek 1.17 #--------------------------------------------------------------------------
653 :     # Take it as plain text
654 :     #--------------------------------------------------------------------------
655 : efrank 1.1 else
656 :     {
657 :     $query = "query";
658 :     }
659 : golsen 1.23 $seq =~ s/\s+//g;
660 : efrank 1.1 open(SEQ,">$tmp_seq")
661 :     || die "could not open $tmp_seq";
662 :     print SEQ ">$query\n$seq\n";
663 :     close(SEQ);
664 :    
665 :     if (! $ENV{"BLASTMAT"}) { $ENV{"BLASTMAT"} = "$FIG_Config::blastmat" }
666 :    
667 : overbeek 1.17 my $blastall = "$FIG_Config::ext_bin/blastall";
668 : efrank 1.1 if ($tool eq "blastp")
669 :     {
670 : overbeek 1.17 my $db = "$FIG_Config::organisms/$org/Features/peg/fasta";
671 :     &verify_db($db,"p");
672 :     @out = map { &HTML::set_prot_links($cgi,$_) } `$blastall -i $tmp_seq -d $db -p blastp`;
673 : efrank 1.1 }
674 :     elsif ($tool eq "blastx")
675 :     {
676 : overbeek 1.17 my $db = "$FIG_Config::organisms/$org/Features/peg/fasta";
677 :     &verify_db($db,"p");
678 :     @out = map { &HTML::set_prot_links($cgi,$_) } `$blastall -i $tmp_seq -d $db -p blastx`;
679 : efrank 1.1 }
680 :     elsif ($tool eq "blastn")
681 :     {
682 : overbeek 1.17 # Typo fixed by GJO
683 :     # my $db = "$$FIG_Config::organisms/$org/contigs";
684 :     my $db = "$FIG_Config::organisms/$org/contigs";
685 :     &verify_db($db,"n"); ### fix to get all contigs
686 :     # Matrix changed by GJO for greater sensitivity
687 :     # @out = `$blastall -i $tmp_seq -d $db -p blastn`;
688 :     @out = `$blastall -i $tmp_seq -d $db -p blastn -r 1 -q -1`;
689 : efrank 1.1 }
690 :     elsif ($tool eq "tblastn")
691 :     {
692 : overbeek 1.17 my $db = "$FIG_Config::organisms/$org/contigs";
693 :     &verify_db($db,"n"); ### fix to get all contigs
694 :     @out = `$blastall -i $tmp_seq -d $db -p tblastn`;
695 : efrank 1.1 }
696 : overbeek 1.30 elsif ($tool eq 'blastp against complete genomes') ### this tool gets nonstandard treatment: RAO
697 :     {
698 :     &blast_complete($fig,$cgi,$html,$tmp_seq,$blastall);
699 :     unlink($tmp_seq);
700 :     return;
701 :     }
702 : overbeek 1.17 if (@out < 1) # This is really a bigger problem than no hits (GJO)
703 : efrank 1.1 {
704 :     push(@$html,$cgi->h1("Sorry, no hits"));
705 :     }
706 :     else
707 :     {
708 :     push(@$html,$cgi->pre);
709 :     push(@$html,@out);
710 :     push(@$html,$cgi->end_pre);
711 :     }
712 :     unlink($tmp_seq);
713 :     }
714 :    
715 : overbeek 1.30 sub blast_complete {
716 :     my($fig,$cgi,$html,$seq_file,$blastall) = @_;
717 :     my($genome,@sims);
718 :    
719 :     @sims = ();
720 :     foreach $genome ($fig->genomes("complete"))
721 :     {
722 :     my $db = "$FIG_Config::organisms/$genome/Features/peg/fasta";
723 :     next if (! -s $db);
724 :    
725 :     &verify_db($db,"p");
726 :     my $sim;
727 :     push(@sims,map { chop;
728 :     $sim = [split(/\t/,$_)];
729 :     $sim->[10] = ($sim->[10] =~ /^e-/) ? "1.0" . $sim->[10] : $sim->[10];
730 :     $sim }
731 :     `$blastall -i $seq_file -d $db -m 8 -FF -e 1.0e-5 -p blastp`);
732 :     }
733 :     @sims = sort { $a->[10] <=> $b->[10] } @sims;
734 :     &format_sims($fig,$cgi,$html,\@sims);
735 :     }
736 :    
737 :     sub format_sims {
738 :     my($fig,$cgi,$html,$sims) = @_;
739 :     my($col_hdrs,$table,@ids,$ids,$sim,%seen);
740 :    
741 :     $col_hdrs = [ "Select up to here",
742 :     "Similar sequence",
743 :     "E-val",
744 :     "Function",
745 :     "Organism",
746 :     "Aliases"
747 :     ];
748 :    
749 :     $table = [];
750 :     @ids = ();
751 :     if (@$sims > 1000) { $#{$sims} = 999 }
752 :     foreach $sim (@$sims)
753 :     {
754 :     if (! $seen{$sim->[1]})
755 :     {
756 :     push(@$table,[$cgi->checkbox(-name => 'list_to', -value => $sim->[1], -override => 1, -checked => 0, -label => ""),
757 :     &HTML::fid_link($cgi,$sim->[1]),
758 :     $sim->[10],
759 :     scalar $fig->function_of($sim->[1]),
760 :     $fig->genus_species(&FIG::genome_of($sim->[1])),
761 :     scalar $fig->feature_aliases($sim->[1])
762 :     ]);
763 :     push(@ids,$sim->[1]);
764 :     }
765 :     }
766 :     $ids = join(",",@ids);
767 :     my $target = "window$$";
768 :     push(@$html, $cgi->start_form( -method => 'post',
769 :     -target => $target,
770 :     -action => 'index.cgi'
771 :     ),
772 :     $cgi->hidden(-name => 'ids', -value => $ids),
773 :     &HTML::make_table($col_hdrs,$table,"Best Hits"),
774 :     $cgi->submit('Extract Matched Sequences'),
775 :     $cgi->end_form);
776 :     }
777 : overbeek 1.17
778 : efrank 1.1 sub verify_db {
779 :     my($db,$type) = @_;
780 :    
781 : overbeek 1.17 if ($type =~ /^p/i)
782 : efrank 1.1 {
783 :     if ((! -s "$db.psq") || (-M "$db.psq" > -M $db))
784 :     {
785 :     system "$FIG_Config::ext_bin/formatdb -p T -i $db";
786 :     }
787 :     }
788 :     else
789 :     {
790 :     if ((! -s "$db.nsq") || (-M "$db.nsq" > -M $db))
791 :     {
792 :     system "$FIG_Config::ext_bin/formatdb -p F -i $db";
793 :     }
794 :     }
795 :     }
796 : overbeek 1.7
797 :     sub export_assignments {
798 :     my($fig,$cgi,$html,$who) = @_;
799 :     my($genome,$x);
800 :    
801 :     my @genomes = map { $_ =~ /\((\d+\.\d+)\)/; $1 } $cgi->param('korgs');
802 :    
803 :     if (@genomes == 0)
804 :     {
805 :     @genomes = $fig->genomes;
806 :     }
807 :    
808 : overbeek 1.10 my @assignments = $fig->assignments_made(\@genomes,$who,$cgi->param('after_date'));
809 : overbeek 1.7 if (@assignments == 0)
810 :     {
811 :     push(@$html,$cgi->h1("Sorry, no assignments where made by $who"));
812 :     }
813 :     else
814 :     {
815 :     my $col_hdrs = ["FIG id", "External ID", "Genus/Species","Assignment"];
816 :     my $tab = [];
817 :     my($x,$peg,$func);
818 :     foreach $x (@assignments)
819 :     {
820 :     ($peg,$func) = @$x;
821 :     push(@$tab,[$peg,&ext_id($fig,$peg),$fig->genus_species($fig->genome_of($peg)),$func]);
822 :     }
823 : overbeek 1.11
824 :     if ($cgi->param('save_assignments'))
825 :     {
826 : overbeek 1.15 my $user = $cgi->param('save_user');
827 : overbeek 1.13 if ($user)
828 :     {
829 :     &FIG::verify_dir("$FIG_Config::data/Assignments/$user");
830 : overbeek 1.15 my $file = &FIG::epoch_to_readable(time) . ":$who:exported_from_local_SEED";
831 : overbeek 1.13 if (open(TMP,">$FIG_Config::data/Assignments/$user/$file"))
832 :     {
833 :     print TMP join("",map { join("\t",@$_) . "\n" } map { [$_->[0],$_->[3]] } @$tab);
834 :     close(TMP);
835 :     }
836 :     push(@$html,$cgi->h1("Saved Assignment Set $file"));
837 :     }
838 :     else
839 : overbeek 1.11 {
840 : overbeek 1.13 push(@$html,$cgi->h1("You need to specify a user to save an assignment set"));
841 : overbeek 1.11 }
842 :     }
843 : overbeek 1.13
844 : overbeek 1.7 if ($cgi->param('tabs'))
845 :     {
846 :     print $cgi->header;
847 :     print "<pre>\n";
848 :     print join("",map { join("\t",@$_) . "\n" } @$tab);
849 :     print "</pre>\n";
850 :     exit;
851 :     }
852 :     else
853 :     {
854 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Assignments Made by $who"));
855 :     }
856 :     }
857 :     }
858 :    
859 :     sub ext_id {
860 :     my($fig,$peg) = @_;
861 :    
862 :     my @mapped = grep { $_ !~ /^fig/ } map { $_->[0] } $fig->mapped_prot_ids($peg);
863 :     if (@mapped == 0)
864 :     {
865 :     return $peg;
866 :     }
867 :    
868 :     my @tmp = ();
869 :     if ((@tmp = grep { $_ =~ /^sp/ } @mapped) && (@tmp > 0)) { return $tmp[0] }
870 :     if ((@tmp = grep { $_ =~ /^pir/ } @mapped) && (@tmp > 0)) { return $tmp[0] }
871 :     if ((@tmp = grep { $_ =~ /^gi/ } @mapped) && (@tmp > 0)) { return $tmp[0] }
872 :     if ((@tmp = grep { $_ =~ /^tr/ } @mapped) && (@tmp > 0)) { return $tmp[0] }
873 :     if ((@tmp = grep { $_ =~ /^tn/ } @mapped) && (@tmp > 0)) { return $tmp[0] }
874 :     if ((@tmp = grep { $_ =~ /^kegg/ } @mapped) && (@tmp > 0)) { return $tmp[0] }
875 :    
876 :     return $peg;
877 :     }
878 :    
879 : overbeek 1.28 sub translate_assignments {
880 :     my($fig,$cgi,$html,$from_func,$to_func) = @_;
881 :    
882 :     my $user = $cgi->param('save_user');
883 :     if ($user)
884 :     {
885 :     &FIG::verify_dir("$FIG_Config::data/Assignments/$user");
886 :     my $file = &FIG::epoch_to_readable(time) . ":$user:translation";
887 :     if (open(TMP,">$FIG_Config::data/Assignments/$user/$file"))
888 :     {
889 :     my($peg,$from_funcQ,$to_funcQ,$func,$to);
890 :     $from_funcQ = quotemeta $from_func;
891 :    
892 :     foreach $peg ($fig->seqs_with_role($from_func))
893 :     {
894 :     if ($peg =~ /^fig\|/)
895 :     {
896 :     $func = $fig->function_of($peg);
897 :     $to = $func;
898 :     if ($to =~ s/$from_funcQ/$to_func/)
899 :     {
900 :     print TMP "$peg\t$to\n";
901 :     }
902 :     }
903 :     }
904 :     close(TMP);
905 :     }
906 :     push(@$html,$cgi->h1("Saved Assignment Set $file"));
907 :     }
908 :     else
909 :     {
910 :     push(@$html,$cgi->h1("You need to specify a user to save an assignment set"));
911 :     }
912 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3