[Bio] / FigWebServices / ssa2.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/ssa2.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.8 - (view) (download)

1 : overbeek 1.1 use FIG;
2 :     my $fig = new FIG;
3 :    
4 :     use HTML;
5 :     use strict;
6 :     use tree_utilities;
7 :    
8 :     use CGI;
9 :     my $cgi = new CGI;
10 :    
11 :     if (0)
12 :     {
13 :     my $VAR1;
14 :     eval(join("",`cat /tmp/ssa_parms`));
15 :     $cgi = $VAR1;
16 :     # print STDERR &Dumper($cgi);
17 :     }
18 :    
19 :     if (0)
20 :     {
21 :     print $cgi->header;
22 :     my @params = $cgi->param;
23 :     print "<pre>\n";
24 :     foreach $_ (@params)
25 :     {
26 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
27 :     }
28 :    
29 :     if (0)
30 :     {
31 :     if (open(TMP,">/tmp/ssa_parms"))
32 :     {
33 :     print TMP &Dumper($cgi);
34 :     close(TMP);
35 :     }
36 :     }
37 :     exit;
38 :     }
39 :    
40 :     my $request = $cgi->param("request");
41 :     if ($request && ($request eq "show_tree"))
42 :     {
43 :     print $cgi->header;
44 :     &show_tree;
45 :     exit;
46 :     }
47 :    
48 :     my $html = [];
49 :    
50 :     my $user = $cgi->param('user');
51 :     if ((! $user) || ($user !~ /^master:\S+/))
52 :     {
53 :     push(@$html,$cgi->h1("Sorry, you need to specify a master user to modify subsystem annotations"));
54 :     }
55 :     else
56 :     {
57 :     $request = defined($request) ? $request : "";
58 :    
59 :     if ($request eq "reset")
60 :     {
61 :     &reset_ssa($fig,$cgi,$html);
62 :     }
63 :     elsif ($request eq "reset_to")
64 :     {
65 :     &reset_ssa_to($fig,$cgi,$html);
66 :     &show_ssa($fig,$cgi,$html);
67 :     }
68 :     elsif ($request eq "make_exchangable")
69 :     {
70 :     &make_exchangable($fig,$cgi,$html);
71 :     &show_initial($fig,$cgi,$html);
72 :     }
73 :     elsif ($request eq "make_unexchangable")
74 :     {
75 :     &make_unexchangable($fig,$cgi,$html);
76 :     &show_initial($fig,$cgi,$html);
77 :     }
78 :     elsif ($request eq "show_ssa")
79 :     {
80 :     &show_ssa($fig,$cgi,$html);
81 :     }
82 :     elsif ($request eq "show_ssa_noload")
83 :     {
84 :     &show_ssa_noload($fig,$cgi,$html);
85 :     }
86 : olson 1.8 #
87 :     # Note that this is a little different; I added another submit button
88 :     # to the delete_or_export_ssa form, so have to distinguish between them
89 :     # here based on $cgi->param('delete_export') - the original button,
90 :     # or $cgi->param('publish') - the new one.
91 :     #
92 :     elsif ($request eq "delete_or_export_ssa" and
93 :     defined($cgi->param('delete_export')))
94 : overbeek 1.1 {
95 :     my($ssa,$exported);
96 :     $exported = 0;
97 :     foreach $ssa ($cgi->param('export'))
98 :     {
99 :     if (! $exported)
100 :     {
101 :     print $cgi->header;
102 :     print "<pre>\n";
103 :     }
104 :     &export($fig,$cgi,$ssa);
105 :     $exported = 1;
106 :     }
107 :    
108 :     foreach $ssa ($cgi->param('export_assignments'))
109 :     {
110 :     &export_assignments($fig,$cgi,$ssa);
111 :     }
112 :    
113 :     foreach $ssa ($cgi->param('delete'))
114 :     {
115 : olson 1.8 system "rm -rf $fig_config::data/subsystems/$ssa";
116 : overbeek 1.1 }
117 :    
118 :     if (! $exported)
119 :     {
120 :     &show_initial($fig,$cgi,$html);
121 :     }
122 :     else
123 :     {
124 :     print "</pre>\n";
125 :     exit;
126 :     }
127 :     }
128 : olson 1.8 elsif ($request eq "delete_or_export_ssa" and
129 :     defined($cgi->param('publish')))
130 :     {
131 :     my($ssa,$exported);
132 :     my($ch) = $fig->get_clearinghouse();
133 :    
134 :     print $cgi->header;
135 :    
136 :     if (!defined($ch))
137 :     {
138 :     print "cannot publish: clearinghouse not available\n";
139 :     exit;
140 :     }
141 :    
142 :     foreach $ssa ($cgi->param('publish_to_clearinghouse'))
143 :     {
144 :     print "<h2>Publishing $ssa to clearinghouse...</h2>\n";
145 :     $| = 1;
146 :     print "<pre>\n";
147 :     my $res = $fig->publish_subsystem_to_clearinghouse($ssa);
148 :     print "</pre>\n";
149 :     if ($res)
150 :     {
151 :     print "Published <i>$ssa </i> to clearinghouse<br>\n";
152 :     }
153 :     else
154 :     {
155 :     print "<b>Failed</b> to publish <i>$ssa</i> to clearinghouse<br>\n";
156 :     }
157 :     }
158 :     exit;
159 :     }
160 : overbeek 1.1 elsif ($request eq "new_ssa")
161 :     {
162 :     &new_ssa($fig,$cgi,$html);
163 :     }
164 :     else
165 :     {
166 :     &show_initial($fig,$cgi,$html);
167 :     }
168 :     }
169 :    
170 :     &HTML::show_page($cgi,$html);
171 :    
172 :     sub show_initial {
173 :     my($fig,$cgi,$html) = @_;
174 :     my($set,$when,$comment);
175 :    
176 :     my $user = $cgi->param('user');
177 :     my @ssa = &existing_subsystem_annotations;
178 :    
179 :     if (@ssa > 0)
180 :     {
181 : overbeek 1.3 &format_ssa_table($cgi,$html,$user,\@ssa);
182 : overbeek 1.1 }
183 :    
184 :     my $target = "window$$";
185 :     push(@$html, $cgi->h1('To Start a New Subsystem Annotation'),
186 : overbeek 1.2 $cgi->start_form(-action => "ssa2.cgi",
187 : overbeek 1.1 -target => $target,
188 :     -method => 'post'),
189 :     $cgi->hidden(-name => 'user', -value => $user, -override => 1),
190 :     $cgi->hidden(-name => 'request', -value => 'new_ssa', -override => 1),
191 :     "Name of New Subsystem Annotation: ",
192 :     $cgi->textfield(-name => "ssa_name", -size => 50),
193 : overbeek 1.5 $cgi->hidden(-name => 'can_alter', -value => 1, -override => 1),
194 : overbeek 1.1 $cgi->br,
195 :     $cgi->submit('start new subsystem annotation'),
196 :     $cgi->end_form
197 :     );
198 :     }
199 :    
200 :     sub new_ssa {
201 :     my($fig,$cgi,$html) = @_;
202 :    
203 :     my $user = $cgi->param('user');
204 :     my $name = $cgi->param('ssa_name');
205 :    
206 :     if (! $user)
207 :     {
208 :     push(@$html,$cgi->h1('You need to specify a user before starting a new subsystem annotation'));
209 :     return;
210 :     }
211 :    
212 :     if (! $name)
213 :     {
214 :     push(@$html,$cgi->h1('You need to specify a subsystem name'));
215 :     return;
216 :     }
217 :    
218 :     my $ssa = $name;
219 :     $ssa =~ s/ /_/g;
220 :     &FIG::verify_dir("$FIG_Config::data/Subsystems");
221 :    
222 :     if (-d "$FIG_Config::data/Subsystems/$ssa")
223 :     {
224 :     push(@$html,$cgi->h1("You need to specify a new subsystem name; $ssa already is being used"));
225 :     return;
226 :     }
227 :     mkdir("$FIG_Config::data/Subsystems/$ssa",0777)
228 :     || die "could not make $FIG_Config::data/Subsystems/$ssa";
229 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa");
230 :    
231 :     open(LOG,">$FIG_Config::data/Subsystems/$ssa/curation.log")
232 :     || die "could not open $FIG_Config::data/Subsystems/$ssa/curation.log";
233 :     my $time = time;
234 :     print LOG "$time\t$user\tstarted\n";
235 :     close(LOG);
236 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa");
237 :    
238 :     &show_ssa($fig,$cgi,$html);
239 :     }
240 :    
241 :     sub show_ssa {
242 :     my($fig,$cgi,$html) = @_;
243 :    
244 :     my $user = $cgi->param('user');
245 :     my $ssa = $cgi->param('ssa_name');
246 :    
247 :     if (! $user)
248 :     {
249 :     push(@$html,$cgi->h1('You need to specify a user to work on a subsystem annotation'));
250 :     return;
251 :     }
252 :    
253 :     if (! $ssa)
254 :     {
255 :     push(@$html,$cgi->h1('You need to specify a subsystem'));
256 :     return;
257 :     }
258 :    
259 :     my $name = $ssa;
260 :     $name =~ s/_/ /g;
261 :     $ssa =~ s/ /_/g;
262 :    
263 :     if (open(SSA,"<$FIG_Config::data/Subsystems/$ssa/spreadsheet"))
264 :     {
265 :     $/ = "//\n";
266 :     my($i,$role,%pos,$subset,$adj_subset,$genome,$row,$abbrev);
267 :     if (defined($_ = <SSA>) && $_)
268 :     {
269 :     $_ =~ s/\n?\/\/\n//s;
270 :     $i = 1;
271 :     foreach $role (split(/\n/,$_))
272 :     {
273 :     if ($role =~ /^(.*)\t(.*)$/)
274 :     {
275 :     $role = $2;
276 :     $abbrev = $1;
277 :     }
278 :     else
279 :     {
280 :     $abbrev = "";
281 :     }
282 :     $cgi->param(-name => "posR$i", -value => $i);
283 :     $cgi->param(-name => "role$i", -value => $role);
284 :     $cgi->param(-name => "abbrev$i", -value => $abbrev);
285 :     $pos{$role} = $i;
286 :     $i++;
287 :     }
288 : overbeek 1.3
289 : overbeek 1.1 if (defined($_ = <SSA>) && $_)
290 :     {
291 :     $_ =~ s/\n?\/\/\n//s;
292 :     my($subsetsC,$subsetsR) = split(/\n\n/,$_);
293 :     $i = 1;
294 :     my @subsetsC = split(/\n/,$subsetsC);
295 :     my $active_subsetC = (@subsetsC > 0) ? pop @subsetsC : "All";
296 :     $cgi->param(-name => 'active_subsetC', -value => $active_subsetC);
297 :     foreach $subset (@subsetsC)
298 :     {
299 :     my($nameCS,@subset_members) = split(/\s+/,$subset);
300 :     $cgi->param(-name => "nameCS$i", -value => $nameCS);
301 :     $adj_subset = join(" ",map { $pos{$_} ? $pos{$_} : $_ } @subset_members);
302 :     $cgi->param(-name => "subsetC$i", -value => $adj_subset);
303 :     $i++;
304 :     }
305 :    
306 :     my $active_subsetR = ($subsetsR && ($subsetsR =~ /^(\S[^\n]+\S)/)) ? $1 : "All";
307 :     $cgi->param(-name => 'active_subsetR', -value => $active_subsetR);
308 :     $/ = "\n";
309 :     $i = 1;
310 :     while (defined($_ = <SSA>))
311 :     {
312 :     chop;
313 :     my($entry,$checked);
314 :     my @row = split(/\t/,$_);
315 :     if (@row > 0)
316 :     {
317 :     $genome = shift @row;
318 :     $cgi->param(-name => "genome$i", -value => $genome);
319 :     $checked = shift @row;
320 :     $cgi->param(-name => "vcode$i", -value => $checked);
321 :     }
322 :     else
323 :     {
324 :     $cgi->param(-name => "vcode$i", -value => 0);
325 :     }
326 :    
327 :     my $j = 1;
328 :     foreach $entry (@row)
329 :     {
330 :     $cgi->param(-name => "row$i.$j", -value => $entry);
331 :     $j++;
332 :     }
333 :     $i++;
334 :     }
335 :     }
336 :     close(SSA);
337 :     }
338 : overbeek 1.3
339 : overbeek 1.1 if (-s "$FIG_Config::data/Subsystems/$ssa/notes")
340 :     {
341 :     my $notes = join("",`cat $FIG_Config::data/Subsystems/$ssa/notes`);
342 :     $cgi->param(-name => 'notes', -value => $notes);
343 :     }
344 :     }
345 :     else
346 :     {
347 :     &format_empty_ssa("$FIG_Config::data/Subsystems/$ssa/spreadsheet");
348 :     }
349 :     &show_ssa_noload($fig,$cgi,$html);
350 :     }
351 :    
352 :     sub format_empty_ssa {
353 :     my($file) = @_;
354 :    
355 :     open(SSA,">$file") || die "aborted";
356 :     print SSA "//\nAll\n\n";
357 :     &print_default_genome_set(\*SSA);
358 :     print SSA "//\n";
359 :     close(SSA);
360 :     }
361 :    
362 :     sub print_default_genome_set {
363 :     my($fh) = @_;
364 :    
365 :     print $fh &default_genome_set, "\n";
366 :     }
367 :    
368 :     sub default_genome_set {
369 :     return "All";
370 :     }
371 :    
372 :     sub show_ssa_noload {
373 :     my($fig,$cgi,$html) = @_;
374 :     my($col);
375 :    
376 :     my $user = $cgi->param('user');
377 :     my $ssa = $cgi->param('ssa_name');
378 : overbeek 1.5 my $can_alter = $cgi->param('can_alter');
379 : overbeek 1.1 if (! $user)
380 :     {
381 :     push(@$html,$cgi->h1('You need to specify a user to work on a subsystem annotation'));
382 :     return;
383 :     }
384 :    
385 :     if (! $ssa)
386 :     {
387 :     push(@$html,$cgi->h1('You need to specify a subsystem'));
388 :     return;
389 :     }
390 :    
391 :     my $name = $ssa;
392 :     $name =~ s/_/ /g;
393 :     $ssa =~ s/ /_/g;
394 :    
395 :     push(@$html, $cgi->h1("Subsystem: $name"),
396 : overbeek 1.2 $cgi->start_form(-action => "ssa2.cgi",
397 : overbeek 1.1 -method => 'post'),
398 :     $cgi->hidden(-name => 'user', -value => $user, -override => 1),
399 :     $cgi->hidden(-name => 'request', -value => 'show_ssa_noload', -override => 1),
400 : overbeek 1.5 $cgi->hidden(-name => 'can_alter', -value => $can_alter, -override => 1),
401 : overbeek 1.1 $cgi->hidden(-name => 'ssa_name', -value => $name, -override => 1),
402 :     $cgi->br,
403 :     );
404 :    
405 :     my($roles,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR,$genomes,$rows) = &write_spreadsheet_from_input_parameters($fig,$cgi,$html,$ssa,$user);
406 :     &format_roles($fig,$cgi,$html,$roles,$genomes,$rows);
407 :     &format_subsets($fig,$cgi,$html,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
408 :     &format_rows($fig,$cgi,$html,$roles,$genomes,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
409 :    
410 : overbeek 1.5 if ($can_alter)
411 : overbeek 1.3 {
412 :     &format_extend_with($fig,$cgi,$html,$genomes,$roles);
413 :     push(@$html,$cgi->checkbox(-name => 'precise_fill', -value => 1, -checked => 0, -override => 1,-label => 'fill'),$cgi->br);
414 :     push(@$html,$cgi->checkbox(-name => 'aggressive_fill', -value => 1, -checked => 0, -override => 1,-label => 'aggressively fill'));
415 :     push(@$html,$cgi->br);
416 :     push(@$html,$cgi->submit('update spreadsheet'),$cgi->br);
417 :     }
418 :     else
419 :     {
420 :     push(@$html,$cgi->br);
421 :     push(@$html,$cgi->submit('show spreadsheet'),$cgi->br);
422 :     }
423 : overbeek 1.1 push(@$html,$cgi->checkbox(-name => 'show_clusters', -value => 1, -checked => 0, -override => 1,-label => 'show clusters'),$cgi->br);
424 :     push(@$html,$cgi->checkbox(-name => 'show_missing', -value => 1, -checked => 0, -override => 1,-label => 'show missing'),$cgi->br);
425 : overbeek 1.6 push(@$html,$cgi->checkbox(-name => 'refill', -value => 1, -checked => 0, -override => 1,-label => 'refill spreadsheet from scratch'),$cgi->br);
426 : overbeek 1.1 push(@$html,$cgi->checkbox(-name => 'show_dups', -value => 1, -checked => 0, -override => 1,-label => 'show duplicates'),$cgi->br);
427 :     push(@$html,$cgi->checkbox(-name => 'check_problems', -value => 1, -checked => 0, -override => 1,-label => 'show PEGs in roles that do not match precisely'),$cgi->br);
428 :     push(@$html,$cgi->checkbox(-name => 'show_excluded', -value => 1, -checked => 0, -override => 1,-label => 'show PEGs that have roles, but not in spreadsheet'),$cgi->br);
429 :     push(@$html,$cgi->checkbox(-name => 'add_solid', -value => 1, -checked => 0, -override => 1,-label => 'Add Genomes with Solid Hits'),$cgi->br);
430 :     push(@$html,$cgi->checkbox(-name => 'show_coupled_fast', -value => 1, -checked => 0, -override => 1,-label => 'show coupled PEGs fast [depends on existing pins/clusters]'),$cgi->br);
431 : overbeek 1.3 push(@$html,$cgi->checkbox(-name => 'show_coupled', -value => 1, -checked => 0, -override => 1,-label => 'show coupled PEGs[figure 2 minutes per PEG in spreadsheet]'),$cgi->br);
432 : overbeek 1.1 push(@$html,$cgi->br,"Align column: ",
433 :     $cgi->textfield(-name => "col_to_align", -size => 7),
434 :     $cgi->br,"Include homologs that pass the following threshhold: ",
435 :     $cgi->textfield(-name => "include_homo", -size => 10)," (leave blank to see just column)",
436 :     " Max homologous seqs: ",$cgi->textfield(-name => "max_homo", -value => 100, -size => 6),
437 :     $cgi->hr);
438 :    
439 :     if ($cgi->param('show_missing'))
440 :     {
441 :     &format_missing($fig,$cgi,$html,$genomes,$roles,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
442 :     }
443 :    
444 :     if ($cgi->param('show_dups'))
445 :     {
446 :     &format_dups($fig,$cgi,$html,$genomes,$roles,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
447 :     }
448 :    
449 :     if ($cgi->param('show_excluded'))
450 :     {
451 :     &format_excluded($fig,$cgi,$html,$genomes,$roles,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
452 :     }
453 :    
454 :     if ($cgi->param('show_coupled'))
455 :     {
456 :     &format_coupled($fig,$cgi,$html,$genomes,$roles,$rows,"careful",$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
457 :     }
458 :     elsif ($cgi->param('show_coupled_fast'))
459 :     {
460 :     &format_coupled($fig,$cgi,$html,$genomes,$roles,$rows,"fast",$subsetsC,$active_subsetC,$subsetsR,$active_subsetR);
461 :     }
462 :    
463 :     if ($col = $cgi->param('col_to_align'))
464 :     {
465 :     &align_column($fig,$cgi,$html,$col,$roles,$genomes,$rows,$subsetsR,$active_subsetR);
466 :     }
467 :    
468 :    
469 :     my $notes = "";
470 :     if (-s "$FIG_Config::data/Subsystems/$ssa/notes")
471 :     {
472 :     $notes = join("",`cat $FIG_Config::data/Subsystems/$ssa/notes`);
473 :     }
474 :     push(@$html,$cgi->hr,"NOTES:\n",$cgi->br,$cgi->textarea(-name => 'notes', -rows => 40, -cols => 100, -value => $notes));
475 :     }
476 :    
477 :     sub format_extend_with {
478 :     my($fig,$cgi,$html,$genomes,$roles) = @_;
479 :     my($org,$gs);
480 :    
481 :     # if (@$genomes > 0)
482 :     # {
483 :     my %genomes = map { $_ => 1 } @$genomes;
484 :     my @orgs = sort map { $org = $_; $gs = &ext_genus_species($fig,$org); "$gs ($org)" }
485 :     grep { ! $genomes{$_} }
486 :     $fig->genomes("complete",undef);
487 :     push(@$html,
488 :     $cgi->h1('Pick Organisms to Extend with'),
489 :     $cgi->scrolling_list(-name => 'korgs',
490 :     -values => [@orgs],
491 :     -size => 10,
492 :     -multiple => 1
493 :     ),
494 :     $cgi->hr
495 :     );
496 :     # }
497 :     # else
498 :     # {
499 :     # my $col_hdrs = ["Genome ID","Organism","not checked","checked"];
500 :     # my @checked = $cgi->radio_group(-name => 'vcode1',-values => [0,1], -nolabels => 1, -override => 1);
501 :     # my $row = [$cgi->textfield(-name => "genome1", -size => 15),"",@checked];
502 :     # my $i = 1;
503 :     # my $role;
504 :     # while ($i < @$roles)
505 :     # {
506 :     # push(@$row,$cgi->textfield(-name => "row1.$i", -size => 15));
507 :     # $i++;
508 :     # }
509 :     # my $tab = [$row];
510 :     # push(@$html,&HTML::make_table($col_hdrs,$tab,"Basic Spreadsheet"),
511 :     # $cgi->hr
512 :     # );
513 :     # }
514 :     }
515 :    
516 :     sub format_rows {
517 :     my($fig,$cgi,$html,$roles,$genomes,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR) = @_;
518 :    
519 :     my($i);
520 :     my $subsetC = $subsetsC->{$active_subsetC};
521 :     my $subsetR = $subsetsR->{$active_subsetR};
522 :     # print &Dumper($subsetsC,$subsetC,$active_subsetC); die "aborted";
523 :     if (@$rows > 0)
524 :     {
525 :     my $col_hdrs = ["Genome ID","Organism","Variant Code"];
526 :     for ($i=1; ($i < @$roles); $i++)
527 :     {
528 :     if ($roles->[$i])
529 :     {
530 :     if ($subsetC->{$i})
531 :     {
532 :     if ($roles->[$i] =~ /^(.*\S.*)\t(.*)$/)
533 :     {
534 :     push(@$col_hdrs,$1);
535 :     }
536 :     else
537 :     {
538 :     push(@$col_hdrs,$i);
539 :     }
540 :     }
541 :     }
542 :     }
543 :     my $tab = [];
544 :    
545 : overbeek 1.6 &format_existing_rows($fig,$cgi,$html,$tab,$genomes,$rows,$roles,$subsetC,$subsetR,$col_hdrs);
546 : overbeek 1.1
547 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Basic Spreadsheet"),
548 :     $cgi->hr
549 :     );
550 :    
551 :     push(@$html,$cgi->scrolling_list(-name => 'sort',
552 :     -value => ['unsorted','alphabetic','by_variant','by_phylo','by_tax_id'],
553 :     -default => 'unsorted'
554 :     ));
555 :     }
556 :     }
557 :    
558 :     sub format_existing_rows {
559 : overbeek 1.6 my($fig,$cgi,$html,$tab,$genomes,$rows,$roles,$subsetC,$subsetR,$col_hdrs) = @_;
560 : overbeek 1.1 my($i,$j,$genome,$row,$entries);
561 :     my(@tab1);
562 :    
563 :     if (@$genomes != @$rows)
564 :     {
565 :     print STDERR &Dumper($genomes,$rows); die "mismatch between genomes and rows";
566 :     }
567 :    
568 :     my $iR = 1;
569 :     for ($i=0; ($i < @$genomes); $i++)
570 :     {
571 :     $genome = $genomes->[$i];
572 :     next if (! $genome);
573 :     my $vcode_value = $rows->[$i]->[0];
574 :    
575 :     my @tmp = ();
576 :     for ($j=1; ($j < @$roles); $j++)
577 :     {
578 :     $rows->[$i]->[$j] = &verify_entry($fig,$genome,$rows->[$i]->[$j]);
579 :     if ($subsetR->{$genome} && $subsetC->{$j})
580 :     {
581 : overbeek 1.6 if ($cgi->param('refill'))
582 :     {
583 :     $rows->[$i]->[$j] = join(",",map { $_ =~ /(\d+)$/; $1 } &seqs_with_role_precisely($fig,$j,$genome,$roles));
584 :     }
585 :     elsif ($cgi->param('aggressive_fill') && (! $rows->[$i]->[$j]))
586 : overbeek 1.1 {
587 :     $rows->[$i]->[$j] = join(",",map { $_ =~ /(\d+)$/; $1 } &seqs_with_role_aggressively($fig,$j,$genome,$roles,$genomes,$rows));
588 :     }
589 :     elsif ($cgi->param('precise_fill') && (! $rows->[$i]->[$j]))
590 :     {
591 :     $rows->[$i]->[$j] = join(",",map { $_ =~ /(\d+)$/; $1 } &seqs_with_role_precisely($fig,$j,$genome,$roles));
592 :     }
593 :     }
594 :     $tmp[$j-1] = $rows->[$i]->[$j];
595 :     }
596 :    
597 :     @tmp = &group_by_clusters($fig,$genome,\@tmp);
598 :    
599 :     if ($subsetR->{$genome})
600 :     {
601 :     my $variant = join("", map { ($_->[0] =~ /\S/) ? 1 : 0 } @tmp);
602 : overbeek 1.3
603 :     my($genomeV,$vcodeV);
604 :     if ($cgi->param('can_alter'))
605 :     {
606 :     $genomeV = $cgi->textfield(-name => "genome$iR", -size => 15, -value => $genome, -override => 1);
607 :     $vcodeV = $cgi->textfield(-name => "vcode$iR", -value => $vcode_value, -size => 5);
608 :     }
609 :     else
610 :     {
611 :     push(@$html,$cgi->hidden(-name => "genome$iR", -value => $genome, -override => 1),
612 :     $cgi->hidden(-name => "vcode$iR", -value => $vcode_value));
613 :     $genomeV = $genome;
614 :     $vcodeV = $vcode_value;
615 :     }
616 :    
617 : overbeek 1.1 $row = [[$genome,$variant], # key for sorting
618 : overbeek 1.3 $genomeV,
619 : overbeek 1.1 &ext_genus_species($fig,$genome),
620 : overbeek 1.3 $vcodeV
621 : overbeek 1.1 ];
622 :     $j = 1;
623 :     while ($j < @$roles)
624 :     {
625 :     if ($roles->[$j])
626 :     {
627 :     push(@$html,$cgi->hidden(-name => "row$iR.$j", -value => $tmp[$j-1]->[0], -override => 1));
628 :     if ($subsetC->{$j})
629 :     {
630 :     push(@$row,&fid_links($cgi,$tmp[$j-1],$genome));
631 :     }
632 :     }
633 :     $j++;
634 :     }
635 :     push(@tab1,$row);
636 :     }
637 :     else
638 :     {
639 :     push(@$html,$cgi->hidden(-name => "genome$iR", -value => $genome, -override => 1),
640 :     $cgi->hidden(-name => "vcode$iR", -value => $vcode_value, -override => 1)
641 :     );
642 :    
643 :     $j = 1;
644 :     while ($j < @$roles)
645 :     {
646 :     if ($roles->[$j])
647 :     {
648 :     push(@$html,$cgi->hidden(-name => "row$iR.$j", -value => $tmp[$j-1]->[0], -override => 1));
649 :     }
650 :     $j++;
651 :     }
652 :     }
653 :     $iR++;
654 :     }
655 :    
656 :     my($sort);
657 :     if ($sort = $cgi->param('sort'))
658 :     {
659 :     if ($sort eq "by_variant")
660 :     {
661 :     @tab1 = sort { ($a->[0]->[1] cmp $b->[0]->[1]) or ($fig->genus_species($a->[0]->[0]) cmp $fig->genus_species($b->[0]->[0])) } @tab1;
662 :     }
663 :     elsif ($sort eq "by_phylo")
664 :     {
665 :     @tab1 = map { $_->[0] }
666 :     sort { $a->[1] cmp $b->[1] }
667 :     map { [$_, $fig->taxonomy_of($_->[0]->[0])] }
668 :     @tab1;
669 :     }
670 :     elsif ($sort eq "by_tax_id")
671 :     {
672 :     @tab1 = map { $_->[0] }
673 :     sort { $a->[1] <=> $b->[1] }
674 :     map { [$_, $_->[0]->[0]] }
675 :     @tab1;
676 :     }
677 :     elsif ($sort eq "alphabetic")
678 :     {
679 :     @tab1 = map { $_->[0] }
680 :     sort { $a->[1] cmp $b->[1] }
681 :     map { [$_, $fig->genus_species($_->[0]->[0])] }
682 :     @tab1;
683 :     }
684 :     }
685 :    
686 :     my $x;
687 :     foreach $x (@tab1)
688 :     {
689 : overbeek 1.6 if ((@$tab > 0) && ((@$tab % 10) == 0))
690 :     {
691 :     push(@$tab,[map { "<b>$_</b>" } @$col_hdrs]) ;
692 :     }
693 : overbeek 1.1 shift @$x; # eliminate sort key
694 :     push(@$tab,$x);
695 :     }
696 :     }
697 :    
698 :     sub format_subsets {
699 :     my($fig,$cgi,$html,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR) = @_;
700 :    
701 :     &format_subsetsC($fig,$cgi,$html,$subsetsC,$active_subsetC);
702 :     &format_subsetsR($fig,$cgi,$html,$subsetsR,$active_subsetR);
703 :     }
704 :    
705 :     sub format_subsetsC {
706 :     my($fig,$cgi,$html,$subsetsC,$active_subsetC) = @_;
707 :     my($i);
708 :    
709 :     my $col_hdrs = ["Subset","Includes These Roles"];
710 :     my $tab = [];
711 :    
712 :     my $n = 1;
713 : overbeek 1.3 &format_existing_subsetsC($cgi,$html,$tab,$subsetsC,\$n);
714 :     if ($cgi->param('can_alter'))
715 : overbeek 1.1 {
716 : overbeek 1.3 for ($i=0; ($i < 5); $i++)
717 :     {
718 :     &format_subsetC($cgi,$html,$tab,$n,"");
719 :     $n++;
720 :     }
721 : overbeek 1.1 }
722 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Subsets of Roles"),
723 :     $cgi->hr
724 :     );
725 :    
726 :     if (keys(%$subsetsC) > 1)
727 :     {
728 :     push(@$html,$cgi->scrolling_list(-name => 'active_subsetC',
729 :     -values => [sort keys(%$subsetsC)],
730 :     -default => $active_subsetC
731 :     ),
732 :     $cgi->br
733 :     );
734 :     }
735 :     else
736 :     {
737 :     push(@$html,$cgi->hidden(-name => 'active_subsetC', -value => $active_subsetC, -override => 1));
738 :     }
739 :     }
740 :    
741 :     sub format_subsetsR {
742 :     my($fig,$cgi,$html,$subsets,$active_subsetR) = @_;
743 :     my($i);
744 :    
745 :     my $link = &tree_link;
746 :     push(@$html,$cgi->br,$link,$cgi->br);
747 :    
748 :     my @tmp = grep { $_ ne "All" } sort keys(%$subsets);
749 :     push(@$html,$cgi->scrolling_list(-name => 'active_subsetR',
750 :     -values => ["All",@tmp],
751 :     -default => $active_subsetR,
752 :     -size => 5
753 :     ),
754 :     $cgi->br
755 :     );
756 :     }
757 :    
758 :     sub format_existing_subsetsC {
759 : overbeek 1.3 my($cgi,$html,$tab,$subsetsC,$nP) = @_;
760 : overbeek 1.1 my($nameCS);
761 :    
762 :     foreach $nameCS (sort keys(%$subsetsC))
763 :     {
764 : overbeek 1.3 &format_subsetC($cgi,$html,$tab,$$nP,$nameCS,$subsetsC->{$nameCS});
765 : overbeek 1.1 $$nP++;
766 :     }
767 :     }
768 :    
769 :     sub format_subsetC {
770 : overbeek 1.3 my($cgi,$html,$tab,$n,$nameCS,$subsetC) = @_;
771 : overbeek 1.1
772 :     if ($nameCS ne "All")
773 :     {
774 :     my $subset = join(",",sort { $a <=> $b } keys(%$subsetC));
775 : overbeek 1.3 my($posT,$subsetT);
776 :     if ($cgi->param('can_alter'))
777 :     {
778 :     $posT = $cgi->textfield(-name => "nameCS$n", -size => 30, -value => $nameCS, -override => 1);
779 :     $subsetT = $cgi->textfield(-name => "subsetC$n", -size => 80, -value => $subset, -override => 1);
780 :     }
781 :     else
782 :     {
783 :     push(@$html,$cgi->hidden(-name => "nameCS$n", -value => $nameCS, -override => 1),
784 :     $cgi->hidden(-name => "subsetC$n", -value => $subset, -override => 1));
785 :     $posT = $nameCS;
786 :     $subsetT = $subset;
787 :     }
788 : overbeek 1.1 push(@$tab,[$posT,$subsetT]);
789 :     }
790 :     }
791 :    
792 :     sub format_roles {
793 :     my($fig,$cgi,$html,$roles,$genomes,$rows) = @_;
794 :     my($i);
795 :    
796 :     my $col_hdrs = ["Column","Abbrev","Functional Role"];
797 :     my $tab = [];
798 :    
799 :     my $n = 1;
800 : overbeek 1.3 &format_existing_roles($fig,$cgi,$html,$tab,$roles,\$n,$genomes,$rows);
801 :     if ($cgi->param('can_alter'))
802 : overbeek 1.1 {
803 : overbeek 1.3 for ($i=0; ($i < 5); $i++)
804 :     {
805 :     &format_role($fig,$cgi,$html,$tab,$n,"",$roles,$genomes,$rows);
806 :     $n++;
807 :     }
808 : overbeek 1.1 }
809 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Functional Roles"),
810 :     $cgi->hr
811 :     );
812 :     }
813 :    
814 :     sub format_existing_roles {
815 : overbeek 1.3 my($fig,$cgi,$html,$tab,$roles,$nP,$genomes,$rows) = @_;
816 : overbeek 1.1 my($role,$i);
817 :    
818 :     for ($i=1; ($i < @$roles); $i++)
819 :     {
820 :     $role = $roles->[$i];
821 : overbeek 1.3 &format_role($fig,$cgi,$html,$tab,$$nP,$role,$roles,$genomes,$rows);
822 : overbeek 1.1 $$nP++;
823 :     }
824 :     }
825 :    
826 :     sub format_role {
827 : overbeek 1.3 my($fig,$cgi,$html,$tab,$n,$role,$roles,$genomes,$rows) = @_;
828 : overbeek 1.1 my($abbrev,$text);
829 :    
830 :     if ($role =~ /^(.*)\t(.*)$/)
831 :     {
832 :     $abbrev = $1;
833 :     $text = $2;
834 :     }
835 :     else
836 :     {
837 :     $abbrev = "";
838 :     $text = $role;
839 :     }
840 :    
841 : overbeek 1.3 my($posT,$abbrevT,$roleT);
842 :     if ($cgi->param('can_alter'))
843 :     {
844 :     $posT = $cgi->textfield(-name => "posR$n", -size => 3, -value => $n, -override => 1);
845 :     $abbrevT = $cgi->textfield(-name => "abbrev$n", -size => 7, -value => $abbrev, -override => 1);
846 :     $roleT = $cgi->textfield(-name => "role$n", -size => 80, -value => $text, -override => 1);
847 :     }
848 :     else
849 :     {
850 :     push(@$html,$cgi->hidden(-name => "posR$n", -value => $n, -override => 1),
851 :     $cgi->hidden(-name => "abbrev$n", -value => $abbrev, -override => 1),
852 :     $cgi->hidden(-name => "role$n", -value => $text, -override => 1));
853 :     $posT = $n;
854 :     $abbrevT = $abbrev;
855 :     $roleT = $text;
856 :     }
857 : overbeek 1.1 push(@$tab,[$posT,$abbrevT,$roleT]);
858 : overbeek 1.7 if (! $cgi->param('refill'))
859 : overbeek 1.1 {
860 : overbeek 1.7 my @roles = grep { $_->[0] ne $text } &gene_functions_in_col($fig,$n,$roles,$genomes,$rows);
861 :     my($x,$peg);
862 :     foreach $x (@roles)
863 : overbeek 1.1 {
864 : overbeek 1.7 push(@$tab,["","",$x->[0]]);
865 :     if ($cgi->param('check_problems'))
866 :     {
867 :     push(@$tab,["","",join(",",map { &HTML::fid_link($cgi,$_) } @{$x->[1]})]);
868 :     }
869 : overbeek 1.1 }
870 :     }
871 :     }
872 :    
873 :     sub write_spreadsheet_from_input_parameters {
874 :     my($fig,$cgi,$html,$ssa,$user) = @_;
875 :     my($i,$j,$pos,$role,$subset,@roles,$genome,$row,$nameCS,$nameRS,%role_map,%role_map2);
876 :     my($param,@param,@tmp,$active_subsetC,$pair);
877 :    
878 :     my $roles = [];
879 :     my $genomes = [];
880 :     my $rows = [];
881 :     my $subsetsC = {};
882 :     my $active_subsetC = "All";
883 :     my $subsetsR = {};
884 :     my $active_subsetR = "All";
885 :    
886 : overbeek 1.3 if ($cgi->param('can_alter'))
887 :     {
888 :     &log_update($ssa,$user);
889 : overbeek 1.1
890 : overbeek 1.3 if (-s "$FIG_Config::data/Subsystems/$ssa/spreadsheet")
891 : overbeek 1.1 {
892 : overbeek 1.3 rename("$FIG_Config::data/Subsystems/$ssa/spreadsheet","$FIG_Config::data/Subsystems/$ssa/spreadsheet~");
893 :     if (-s "$FIG_Config::data/Subsystems/$ssa/notes")
894 :     {
895 :     rename("$FIG_Config::data/Subsystems/$ssa/notes","$FIG_Config::data/Subsystems/$ssa/notes~");
896 :     }
897 :     else
898 :     {
899 :     open(NOTES,">$FIG_Config::data/Subsystems/$ssa/notes");
900 :     close(NOTES);
901 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa/notes");
902 :     }
903 : overbeek 1.1 }
904 : overbeek 1.3
905 :     open(SSA,">$FIG_Config::data/Subsystems/$ssa/spreadsheet")
906 :     || die "could not open $FIG_Config::data/Subsystems/$ssa/spreadsheet";
907 : overbeek 1.1 }
908 :     @param = grep { $_ =~ /^posR/ } $cgi->param;
909 :     foreach $param (@param)
910 :     {
911 :     if ($param =~ /^posR(\d+)/)
912 :     {
913 :     $i = $1;
914 :     if (($pos = $cgi->param("posR$i")) && ($role = $cgi->param("role$i")))
915 :     {
916 :     $role =~ s/^\s+//;
917 :     $role =~ s/\s+$//;
918 :     if ($role =~ /\S/)
919 :     {
920 :     if ($_ = $cgi->param("abbrev$i"))
921 :     {
922 :     $tmp[$pos] = "$_\t$role";
923 :     }
924 :     else
925 :     {
926 :     $tmp[$pos] = "\t$role";
927 :     }
928 :     $role_map2{$pos} = $i;
929 :     }
930 :     }
931 :     }
932 :     }
933 :    
934 :     $j = 1;
935 :     foreach $pos (sort { $a <=> $b } keys(%role_map2))
936 :     {
937 :     $roles->[$j] = $tmp[$pos];
938 :     $role_map{$role_map2{$pos}} = $j;
939 :     $j++;
940 :     }
941 :    
942 : overbeek 1.3 if ($cgi->param('can_alter'))
943 : overbeek 1.1 {
944 : overbeek 1.3 foreach $role (@$roles)
945 : overbeek 1.1 {
946 : overbeek 1.3 if ($role)
947 :     {
948 :     print SSA "$role\n";
949 :     }
950 : overbeek 1.1 }
951 : overbeek 1.3 print SSA "//\n";
952 : overbeek 1.1 }
953 :    
954 :     @param = grep { $_ =~ /^nameCS/ } $cgi->param;
955 :     foreach $param (@param)
956 :     {
957 :     if ($param =~ /^nameCS(\d+)/)
958 :     {
959 :     $i = $1;
960 :     if (($nameCS = $cgi->param("nameCS$i")) && ($subset = $cgi->param("subsetC$i")))
961 :     {
962 :     foreach $_ (split(/[\t ,;]+/,$subset))
963 :     {
964 :     if ($_ =~ /^\d+$/)
965 :     {
966 :     $subsetsC->{$nameCS}->{$role_map{$_}} = 1;
967 :     }
968 :     }
969 :     }
970 :     }
971 :     }
972 :    
973 :     foreach $nameCS (sort keys(%$subsetsC))
974 :     {
975 :     $subset = $subsetsC->{$nameCS};
976 :     if ($subset)
977 :     {
978 :     @roles = sort { $a <=> $b } keys(%$subset);
979 :     }
980 :    
981 : overbeek 1.3 if ($cgi->param('can_alter'))
982 : overbeek 1.1 {
983 : overbeek 1.3 if (@roles > 1)
984 :     {
985 :     print SSA join("\t",($nameCS,@roles)),"\n";
986 :     }
987 :     else
988 :     {
989 :     push(@$html,$cgi->h2("invalid subset: $subset"));
990 :     }
991 : overbeek 1.1 }
992 :     }
993 :    
994 :     if (! ($active_subsetC = $cgi->param('active_subsetC')))
995 :     {
996 :     $active_subsetC = "All";
997 :     }
998 :    
999 :     if (! $subsetsC->{"All"})
1000 :     {
1001 :     for ($i=1; ($i < @$roles); $i++)
1002 :     {
1003 :     $subsetsC->{"All"}->{$i} = 1;
1004 :     }
1005 :     }
1006 : overbeek 1.3 if ($cgi->param('can_alter'))
1007 :     {
1008 :     print SSA "$active_subsetC\n";
1009 :     print SSA "\n";
1010 :     }
1011 : overbeek 1.1
1012 :    
1013 :     my($taxonomic_groups,$id,$members,$genome);
1014 :     $taxonomic_groups = $fig->taxonomic_groups_of_complete(10);
1015 :     foreach $pair (@$taxonomic_groups)
1016 :     {
1017 :     ($id,$members) = @$pair;
1018 :     foreach $genome (@$members)
1019 :     {
1020 :     $subsetsR->{$id}->{$genome} = 1;
1021 :     }
1022 :     }
1023 :    
1024 :     $active_subsetR = $cgi->param('active_subsetR');
1025 :     if (! ($active_subsetR && $subsetsR->{$active_subsetR}))
1026 :     {
1027 :     $active_subsetR = &default_genome_set;
1028 :     }
1029 : overbeek 1.3 if ($cgi->param('can_alter'))
1030 :     {
1031 :     print SSA "$active_subsetR\n";
1032 :     print SSA "//\n";
1033 :     }
1034 : overbeek 1.1
1035 :     $i = 1;
1036 :     while (defined($genome = $cgi->param("genome$i")))
1037 :     {
1038 :     if ($genome =~ /^\d+\.\d+$/)
1039 :     {
1040 :     $genomes->[$i-1] = $genome;
1041 :     }
1042 :     $i++;
1043 :     }
1044 :    
1045 :     $i = 1;
1046 :     my($vcode_value,$j,$row,$entry,$non_null);
1047 :     while (defined($vcode_value = $cgi->param("vcode$i")))
1048 :     {
1049 :     if ($genomes->[$i-1])
1050 :     {
1051 :     $row = [$vcode_value];
1052 :     for ($j=1; ($j < (@$roles + 5)); $j++)
1053 :     {
1054 :     if ($role_map{$j})
1055 :     {
1056 :     if ($entry = $cgi->param("row$i.$j"))
1057 :     {
1058 :     $row->[$role_map{$j}] = $entry;
1059 :     }
1060 :     else
1061 :     {
1062 :     $row->[$role_map{$j}] = "";
1063 :     }
1064 :     }
1065 :     }
1066 :     $rows->[$i-1] = $row;
1067 : overbeek 1.3 if ($cgi->param('can_alter'))
1068 :     {
1069 :     print SSA join("\t",($genomes->[$i-1],@$row)),"\n";
1070 :     }
1071 : overbeek 1.1 }
1072 :     $i++;
1073 :     }
1074 :    
1075 :     my @orgs = $cgi->param('korgs');
1076 :     @orgs = map { $_ =~ /\((\d+\.\d+)\)/; $1 } @orgs;
1077 :    
1078 : overbeek 1.3 if ($cgi->param('can_alter'))
1079 : overbeek 1.1 {
1080 : overbeek 1.3 my @orgs1 = ();
1081 :     if ($cgi->param('add_solid'))
1082 :     {
1083 :     my %genomes1 = map { $_ => 1 } (@$genomes,@orgs);;
1084 :     @orgs1 = sort grep { ! $genomes1{$_} } $fig->genomes("complete",undef);
1085 :     }
1086 :     &extend_ssa($fig,$genomes,$roles,$rows,\@orgs,\@orgs1,\*SSA);
1087 :    
1088 :    
1089 :     close(SSA);
1090 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa/spreadsheet");
1091 :     if (($_ = $cgi->param('notes')) && open(NOTES,">$FIG_Config::data/Subsystems/$ssa/notes"))
1092 :     {
1093 :     print NOTES $_;
1094 :     close(NOTES);
1095 :     }
1096 :     &backup("$FIG_Config::data/Subsystems/$ssa");
1097 : overbeek 1.1
1098 :     }
1099 : overbeek 1.3 # print &Dumper($roles,$subsets,$genomes,$rows); die "aborted";
1100 : overbeek 1.1 return ($roles,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR,$genomes,$rows);
1101 :     }
1102 :    
1103 :     sub format_ssa_table {
1104 : overbeek 1.3 my($cgi,$html,$user,$ssaP) = @_;
1105 : overbeek 1.1 my($ssa,$curator);
1106 :     my($url1,$link1);
1107 : olson 1.8 my($publish_checkbox);
1108 : overbeek 1.1
1109 : overbeek 1.3 my $can_alter = $cgi->param('can_alter');
1110 : overbeek 1.2 push(@$html, $cgi->start_form(-action => "ssa2.cgi",
1111 : overbeek 1.1 -method => 'post'),
1112 :     $cgi->hidden(-name => 'user', -value => $user, -override => 1),
1113 : overbeek 1.3 $cgi->hidden(-name => 'can_alter', -value => $can_alter, -override => 1),
1114 : overbeek 1.1 $cgi->hidden(-name => 'request', -value => 'delete_or_export_ssa', -override => 1)
1115 :     );
1116 : overbeek 1.4 push(@$html,"<font size=\"+2\">Please do not ever edit someone else\'s spreadsheet (by using their
1117 :     user ID), and <b>never open multiple windows to
1118 : overbeek 1.3 process the same spreadsheet</b></font>. It is, of course, standard practice to open a subsystem
1119 : overbeek 1.4 spreadsheet and then to have multiple other SEED windows to access data and modify annotations. Further,
1120 :     you can access someone else's subsystem spreadsheet using your ID (which will make it impossible
1121 :     for you to edit the spreadsheet).
1122 :     Just do not open the same subsystem spreadsheet for editing in multiple windows simultaneously.",
1123 : overbeek 1.3 $cgi->br,
1124 :     $cgi->br
1125 :     );
1126 : overbeek 1.1
1127 : olson 1.8 my $col_hdrs = [
1128 :     "Name","Curator","Exchangable","Version",
1129 :     "Reset to Previous Timestamp","Delete",
1130 :     "Export Full Subsystem","Export Just Assignments", "Publish to Clearinghouse",
1131 :     ];
1132 : overbeek 1.1 my $title = "Existing Subsystem Annotations";
1133 :     my $tab = [];
1134 :     foreach $_ (@$ssaP)
1135 :     {
1136 :     ($ssa,$curator) = @$_;
1137 :     my($url,$link);
1138 : overbeek 1.3 if ((-d "$FIG_Config::data/Subsystems/$ssa/Backup") && ($curator eq $cgi->param('user')))
1139 : overbeek 1.1 {
1140 : overbeek 1.2 $url = &FIG::cgi_url . "/ssa2.cgi?user=$user&ssa_name=$ssa&request=reset";
1141 : overbeek 1.1 $link = "<a href=$url>reset</a>";
1142 :     }
1143 :     else
1144 :     {
1145 : overbeek 1.3 $link = "";
1146 : overbeek 1.1 }
1147 :    
1148 : overbeek 1.3 if (($fig->is_exchangable_subsystem($ssa)) && ($curator eq $cgi->param('user')))
1149 : overbeek 1.1 {
1150 : overbeek 1.2 $url1 = &FIG::cgi_url . "/ssa2.cgi?user=$user&ssa_name=$ssa&request=make_unexchangable";
1151 : overbeek 1.1 $link1 = "Exchangable<br><a href=$url1>Make not exchangable</a>";
1152 :     }
1153 : overbeek 1.3 elsif ($curator eq $cgi->param('user'))
1154 : overbeek 1.1 {
1155 : overbeek 1.2 $url1 = &FIG::cgi_url . "/ssa2.cgi?user=$user&ssa_name=$ssa&request=make_exchangable";
1156 : overbeek 1.1 $link1 = "Not exchangable<br><a href=$url1>Make exchangable</a>";
1157 :     }
1158 : overbeek 1.3 else
1159 :     {
1160 :     $link1 = "";
1161 :     }
1162 : olson 1.8
1163 :     #
1164 :     # Only allow publish for subsystems we are curating?
1165 :     #
1166 :     if (1 or $curator eq $cgi->param('user'))
1167 :     {
1168 :     $publish_checkbox = $cgi->checkbox(-name => "publish_to_clearinghouse",
1169 :     -value => $ssa,
1170 :     -label => "Publish"),
1171 :    
1172 :     }
1173 : overbeek 1.1
1174 : olson 1.8 push(@$tab,[
1175 : overbeek 1.1 &ssa_link($ssa,$user),
1176 :     $curator,
1177 :     $link1,
1178 : olson 1.8 $fig->subsystem_version($ssa),
1179 :     $link,
1180 :     ($curator eq $cgi->param('user')) ? $cgi->checkbox(-name => "delete", -value => $ssa) : "",
1181 :     $cgi->checkbox(-name => "export", -value => $ssa, -label => "Export full"),
1182 :     $cgi->checkbox(-name => "export_assignments", -value => $ssa, -label => "Export assignments"),
1183 :     $publish_checkbox,
1184 : overbeek 1.1 ]);
1185 :     }
1186 : olson 1.8 push(@$html,
1187 :     &HTML::make_table($col_hdrs,$tab,$title),
1188 :     $cgi->submit(-name => 'delete_export',
1189 :     -label => 'Process marked deletions and exports'),
1190 :     $cgi->submit(-name => 'publish',
1191 :     -label => "Publish marked subsystems"),
1192 :     $cgi->end_form
1193 : overbeek 1.1 );
1194 :     }
1195 :    
1196 :     sub ssa_link {
1197 :     my($ssa,$user) = @_;
1198 :     my $name = $ssa; $name =~ s/_/ /g;
1199 :     my $target = "window$$";
1200 : overbeek 1.3 my $can_alter = &curator($ssa) eq $user;
1201 :    
1202 :     my $url = &FIG::cgi_url . "/ssa2.cgi?user=$user&ssa_name=$ssa&request=show_ssa&can_alter=$can_alter";
1203 : overbeek 1.1 return "<a href=$url target=$target>$name</a>";
1204 :     }
1205 :    
1206 :     sub tree_link {
1207 :     my $target = "window$$";
1208 : overbeek 1.2 my $url = &FIG::cgi_url . "/ssa2.cgi?request=show_tree";
1209 : overbeek 1.1 return "<a href=$url target=$target>Show Phylogenetic Tree</a>";
1210 :     }
1211 :    
1212 :    
1213 :     sub existing_subsystem_annotations {
1214 :     my($ssa,$name);
1215 :     my @ssa = ();
1216 :     if (opendir(SSA,"$FIG_Config::data/Subsystems"))
1217 :     {
1218 :     @ssa = map { $ssa = $_; $name = $ssa; $ssa =~ s/ /_/g; [$name,&curator($ssa)] } grep { $_ !~ /^\./ } readdir(SSA);
1219 :     closedir(SSA);
1220 :     }
1221 :     return @ssa;
1222 :     }
1223 :    
1224 :     sub curator {
1225 :     my($ssa) = @_;
1226 :     my($who) = "";
1227 :    
1228 :     if (open(DATA,"<$FIG_Config::data/Subsystems/$ssa/curation.log"))
1229 :     {
1230 :     $_ = <DATA>;
1231 :     if ($_ =~ /^\d+\t(\S+)\s+started/)
1232 :     {
1233 :     $who = $1;
1234 :     }
1235 :     close(DATA);
1236 :     }
1237 :     return $who;
1238 :     }
1239 :    
1240 :     sub log_update {
1241 :     my($ssa,$user) = @_;
1242 :    
1243 :     $ssa =~ s/ /_/g;
1244 :    
1245 :     if (open(LOG,">>$FIG_Config::data/Subsystems/$ssa/curation.log"))
1246 :     {
1247 :     my $time = time;
1248 :     print LOG "$time\t$user\tupdated\n";
1249 :     close(LOG);
1250 :     }
1251 :     else
1252 :     {
1253 :     print STDERR "failed to open $FIG_Config::data/Subsystems/$ssa/curation.log\n";
1254 :     }
1255 :     }
1256 :    
1257 :     sub extend_ssa {
1258 :     my($fig,$genomes,$roles,$rows,$new_genomes,$poss_new_genomes,$fh) = @_;
1259 :     my($genome,$i,$row,$role);
1260 :    
1261 :     foreach $genome (@$new_genomes)
1262 :     {
1263 :     push(@$genomes,$genome);
1264 :     $row = [0];
1265 :     for ($i=1; ($i < @$roles); $i++)
1266 :     {
1267 :     push(@$row,join(",",map { $_ =~ /(\d+)$/; $1 } &seqs_with_role_precisely($fig,$i,$genome,$roles)));
1268 :     }
1269 :     push(@$rows,$row);
1270 :     print $fh join("\t",($genome,@$row)),"\n";
1271 :     }
1272 :    
1273 :     foreach $genome (@$poss_new_genomes)
1274 :     {
1275 :     $row = [0];
1276 :     my $bad = 0;
1277 :     for ($i=1; ($i < @$roles); $i++)
1278 :     {
1279 :     my $entry = join(",",map { $_ =~ /(\d+)$/; $1 } &seqs_with_role_precisely($fig,$i,$genome,$roles));
1280 :     if (! $entry)
1281 :     {
1282 :     $bad = 1;
1283 :     last;
1284 :     }
1285 :     push(@$row,$entry);
1286 :     }
1287 :     if (! $bad)
1288 :     {
1289 :     push(@$genomes,$genome);
1290 :     push(@$rows,$row);
1291 :     print $fh join("\t",($genome,@$row)),"\n";
1292 :     }
1293 :     }
1294 :     }
1295 :    
1296 :     sub seqs_with_role_aggressively {
1297 :     my($fig,$i,$genome,$roles,$genomes,$rows) = @_;
1298 :    
1299 :     # The $i parm is a bit weird. The actual role we want is in $roles->[$i]. Any existing versions are in
1300 :     # $rows->[*]->[$i] entries. You look for acceptable roles among $roles->[$i] (after tab) and the entries
1301 :     # from the existing rows.
1302 :    
1303 :     my(@roles,$peg,%pegs,$role);
1304 :    
1305 :     @roles = map { $_->[0] } &gene_functions_in_col($fig,$i,$roles,$genomes,$rows);
1306 :     foreach $role (@roles)
1307 :     {
1308 :     foreach $peg ($fig->seqs_with_role($role,"master",$genome))
1309 :     {
1310 :     $pegs{$peg} = 1;
1311 :     }
1312 :     }
1313 :     return sort { &FIG::by_fig_id($a,$b) } keys(%pegs);;
1314 :     }
1315 :    
1316 :     sub seqs_with_role_precisely {
1317 :     my($fig,$i,$genome,$roles) = @_;
1318 :    
1319 :     # The $i parm is a bit weird. The actual role we want is in $roles->[$i]. Any existing versions are in
1320 :     # $rows->[*]->[$i] entries. You look for acceptable roles matching $roles->[$i] (after tab)
1321 :    
1322 :     my @pegs = ();
1323 :     if ($roles->[$i] =~ /([^\t]+)$/)
1324 :     {
1325 :     @pegs = $fig->seqs_with_role($1,"master",$genome);
1326 :     }
1327 :     return @pegs;
1328 :     }
1329 :    
1330 :     sub gene_functions_in_col {
1331 :     my($fig,$i,$roles,$genomes,$rows) = @_;
1332 :     my(%roles,$j,$row,$genomeJ,$entry,@pegs,$peg,$func);
1333 :    
1334 :     if ($roles->[$i] =~ /([^\t]+)$/)
1335 :     {
1336 :     $roles{$1} = [];
1337 :     }
1338 :    
1339 :     for ($j=0; ($j < @$rows); $j++)
1340 :     {
1341 :     $row = $rows->[$j];
1342 :     $genomeJ = $genomes->[$j];
1343 :     if ($row->[$i] =~ /(\S.*\S)/)
1344 :     {
1345 :     $entry = $1;
1346 :     @pegs = map { "fig|$genomeJ.peg.$_" } split(/,/,$entry);
1347 :     foreach $peg (@pegs)
1348 :     {
1349 :     if ($func = $fig->function_of($peg))
1350 :     {
1351 :     push(@{$roles{$func}},$peg);
1352 :     }
1353 :     }
1354 :     }
1355 :     }
1356 :     return map { [$_,$roles{$_}] } sort keys(%roles);
1357 :     }
1358 :    
1359 :    
1360 :     sub verify_entry {
1361 :     my($fig,$genome,$entry) = @_;
1362 :     my($peg);
1363 :    
1364 :     my @verified = ();
1365 :     foreach $peg (split(/[, \t]+/,$entry))
1366 :     {
1367 :     if ($fig->is_real_feature("fig|$genome.peg.$peg"))
1368 :     {
1369 :     push(@verified,$peg);
1370 :     }
1371 :     }
1372 :     return join(",",@verified);
1373 :     }
1374 :    
1375 :     sub export {
1376 :     my($fig,$cgi,$ssa) = @_;
1377 :     my($line);
1378 :    
1379 :     my ($exportable,$notes) = $fig->exportable_subsystem($ssa);
1380 :     foreach $line (@$exportable,@$notes)
1381 :     {
1382 :     print $line;
1383 :     }
1384 :     }
1385 :    
1386 :     sub export_assignments {
1387 :     my($fig,$cgi,$ssa) = @_;
1388 :     my(@roles,$i,$entry,$id,$user);
1389 :    
1390 :     if (($user = $cgi->param('user')) && open(SSA,"<$FIG_Config::data/Subsystems/$ssa/spreadsheet"))
1391 :     {
1392 :     $user =~ s/^master://;
1393 :     &FIG::verify_dir("$FIG_Config::data/Assignments/$user");
1394 :     my $who = &curator($ssa);
1395 :     my $file = &FIG::epoch_to_readable(time) . ":$who:generated_from_subsystem_$ssa";
1396 :    
1397 :     if (open(OUT,">$FIG_Config::data/Assignments/$user/$file"))
1398 :     {
1399 :     while (defined($_ = <SSA>) && ($_ !~ /^\/\//))
1400 :     {
1401 :     chop;
1402 :     push(@roles,$_);
1403 :     }
1404 :     while (defined($_ = <SSA>) && ($_ !~ /^\/\//)) {}
1405 :     while (defined($_ = <SSA>))
1406 :     {
1407 :     chop;
1408 :     my @flds = split(/\t/,$_);
1409 :     my $genome = $flds[0];
1410 :     for ($i=2; ($i < @flds); $i++)
1411 :     {
1412 :     my @entries = split(/,/,$flds[$i]);
1413 :     foreach $id (@entries)
1414 :     {
1415 :     my $peg = "fig|$genome.peg.$id";
1416 :     my $func = $fig->function_of($peg);
1417 :     print OUT "$peg\t$func\n";
1418 :     }
1419 :     }
1420 :     }
1421 :     close(OUT);
1422 :     }
1423 :     close(SSA);
1424 :     }
1425 :     }
1426 :    
1427 :     sub format_missing {
1428 :     my($fig,$cgi,$html,$genomes,$roles,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR) = @_;
1429 :     my($i,$j,$missing,$user,$role,$org,$link,$genus_species,$abr);
1430 :    
1431 :     my $subsetC = $subsetsC->{$active_subsetC};
1432 :     my $subsetR = $subsetsR->{$active_subsetR};
1433 :    
1434 :     push(@$html,$cgi->h1('To Check Missing Entries:'));
1435 :    
1436 :     for ($i=0; ($i < @$rows); $i++)
1437 :     {
1438 :     $org = $genomes->[$i];
1439 :     next if (! $subsetR->{$org});
1440 :    
1441 :     $missing = [];
1442 :    
1443 :     for ($j=1; ($j < @$roles); $j++)
1444 :     {
1445 :     if ((! $rows->[$i]->[$j]) && $subsetC->{$j})
1446 :     {
1447 :     $user = $cgi->param('user');
1448 :     $role = $roles->[$j];
1449 :     if ($role =~ /^(.*)\t(.*)$/)
1450 :     {
1451 :     ($abr,$role) = ($1,$2);
1452 :     }
1453 :     else
1454 :     {
1455 :     $abr = "";
1456 :     }
1457 :     my $roleE = $cgi->escape($role);
1458 :     $link = "<a href=" . &FIG::cgi_url . "/pom.cgi?user=$user&request=find_in_org&role=$roleE&org=$org>$abr $role</a>";
1459 :     push(@$missing,$link);
1460 :     }
1461 :     }
1462 :     if (@$missing > 0)
1463 :     {
1464 :     $genus_species = &ext_genus_species($fig,$org);
1465 :     push(@$html,$cgi->h2("$org: $genus_species"));
1466 :     push(@$html,$cgi->ul($cgi->li($missing)));
1467 :     }
1468 :    
1469 :     }
1470 :     }
1471 :    
1472 :     sub format_dups {
1473 :     my($fig,$cgi,$html,$genomes,$roles,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR) = @_;
1474 :     my($i,$j,$duplicates,$user,$role,$org,$link,$genus_species,$abr,$func,$peg);
1475 :    
1476 :     my $subsetC = $subsetsC->{$active_subsetC};
1477 :     my $subsetR = $subsetsR->{$active_subsetR};
1478 :    
1479 :     push(@$html,$cgi->h1('To Check Duplicates:'));
1480 :    
1481 :     for ($i=0; ($i < @$rows); $i++)
1482 :     {
1483 :     $org = $genomes->[$i];
1484 :     next if (! $subsetR->{$org});
1485 :    
1486 :     $duplicates = [];
1487 :     for ($j=1; ($j < @$roles); $j++)
1488 :     {
1489 :     if (($rows->[$i]->[$j] =~ /,/) && $subsetC->{$j})
1490 :     {
1491 :     $user = $cgi->param('user');
1492 :     $role = $roles->[$j];
1493 :     if ($role =~ /^(.*)\t(.*)$/)
1494 :     {
1495 :     ($abr,$role) = ($1,$2);
1496 :     }
1497 :     else
1498 :     {
1499 :     $abr = "";
1500 :     }
1501 :     push(@$duplicates,"$role<br>" . $cgi->ul($cgi->li([map { $peg = "fig|$org.peg.$_"; $func = $fig->function_of($peg,$user); &HTML::fid_link($cgi,$peg) . " $func" } split(/,/,$rows->[$i]->[$j])])));
1502 :     }
1503 :     }
1504 :     if (@$duplicates > 0)
1505 :     {
1506 :     $genus_species = &ext_genus_species($fig,$org);
1507 :     push(@$html,$cgi->h2("$org: $genus_species"));
1508 :     push(@$html,$cgi->ul($cgi->li($duplicates)));
1509 :     }
1510 :     }
1511 :     }
1512 :    
1513 :     sub format_excluded {
1514 :     my($fig,$cgi,$html,$genomes,$roles,$rows,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR) = @_;
1515 :     my($i,$j,$show,$user,$role,$org,$link,$genus_species,$abr,$func,$peg,@excluded,@in,%in);
1516 :    
1517 :     my $subsetC = $subsetsC->{$active_subsetC};
1518 :     my $subsetR = $subsetsR->{$active_subsetR};
1519 :    
1520 :     push(@$html,$cgi->h1('To PEGs with Role, but not in Spreadsheet:'));
1521 :    
1522 :     for ($i=0; ($i < @$rows); $i++)
1523 :     {
1524 :     $org = $genomes->[$i];
1525 :     next if (! $subsetR->{$org});
1526 :    
1527 :     $show = [];
1528 :     for ($j=1; ($j < @$roles); $j++)
1529 :     {
1530 :     next if (! $subsetC->{$j});
1531 :    
1532 :     if ($rows->[$i]->[$j])
1533 :     {
1534 :     @in = map { "fig|$org.peg.$_" } split(/,/,$rows->[$i]->[$j]);
1535 :     }
1536 :     else
1537 :     {
1538 :     @in = ();
1539 :     }
1540 :     %in = map { $_ => 1 } @in;
1541 :     $user = $cgi->param('user');
1542 :     $role = $roles->[$j];
1543 :     if ($role =~ /^(.*)\t(.*)$/)
1544 :     {
1545 :     ($abr,$role) = ($1,$2);
1546 :     }
1547 :     else
1548 :     {
1549 :     $abr = "";
1550 :     }
1551 :     @excluded = grep { ! $in{$_} } &seqs_with_role_precisely($fig,$j,$org,$roles);
1552 :     if (@excluded > 0)
1553 :     {
1554 :     push(@$show,"$role<br>" . $cgi->ul($cgi->li([map { $peg = $_; $func = $fig->function_of($peg,$user); &HTML::fid_link($cgi,$peg) . " $func" } @excluded])));
1555 :     }
1556 :     }
1557 :     if (@$show > 0)
1558 :     {
1559 :     $genus_species = &ext_genus_species($fig,$org);
1560 :     push(@$html,$cgi->h2("$org: $genus_species"));
1561 :     push(@$html,$cgi->ul($cgi->li($show)));
1562 :     }
1563 :     }
1564 :     }
1565 :    
1566 :     sub format_coupled {
1567 :     my($fig,$cgi,$html,$genomes,$roles,$rows,$type,$subsetsC,$active_subsetC,$subsetsR,$active_subsetR) = @_;
1568 :     my($i,$j,@show,$user,$org,$link,$gs,$func,$peg,$peg1,$peg2,%in,%seen,%seen2);
1569 :     my(@cluster,$sc,$x,$id2,@in,$sim,@coupled);
1570 :    
1571 :     my $subsetC = $subsetsC->{$active_subsetC};
1572 :     my $subsetR = $subsetsR->{$active_subsetR};
1573 :    
1574 :     for ($i=0; ($i < @$rows); $i++)
1575 :     {
1576 :     $org = $genomes->[$i];
1577 :     next if (! $subsetR->{$org});
1578 :    
1579 :     for ($j=1; ($j < @$roles); $j++)
1580 :     {
1581 :     if ($rows->[$i]->[$j] && $subsetC->{$j})
1582 :     {
1583 :     push(@in,map { "fig|$org.peg.$_" } split(/,/,$rows->[$i]->[$j]));
1584 :     }
1585 :     }
1586 :     }
1587 :    
1588 :     %in = map { $_ => 1 } @in;
1589 :     $user = $cgi->param('user');
1590 :     @show = ();
1591 :     foreach $peg1 (@in)
1592 :     {
1593 :     if ($type eq "careful")
1594 :     {
1595 :     @coupled = $fig->coupling_and_evidence($peg1,5000,1.0e-10,0.2,1);
1596 :     }
1597 :     else
1598 :     {
1599 :     @coupled = $fig->fast_coupling($peg1,5000,1);
1600 :     }
1601 :    
1602 :     foreach $x (@coupled)
1603 :     {
1604 :     ($sc,$peg2) = @$x;
1605 :     if ((! $in{$peg2}) && ((! $seen{$peg2}) || ($seen{$peg2} < $sc)))
1606 :     {
1607 :     $seen{$peg2} = $sc;
1608 :     # print STDERR "$sc\t$peg1 -> $peg2\n";
1609 :     }
1610 :     }
1611 :     }
1612 :    
1613 :     foreach $peg1 (sort { $seen{$b} <=> $seen{$a} } keys(%seen))
1614 :     {
1615 :     if (! $seen2{$peg1})
1616 :     {
1617 :     @cluster = ($peg1);
1618 :     $seen2{$peg1} = 1;
1619 :     for ($i=0; ($i < @cluster); $i++)
1620 :     {
1621 :     foreach $sim ($fig->sims($cluster[$i],1000,1.0e-10,"fig"))
1622 :     {
1623 :     $id2 = $sim->id2;
1624 :     if ($seen{$id2} && (! $seen2{$id2}))
1625 :     {
1626 :     push(@cluster,$id2);
1627 :     $seen2{$id2} = 1;
1628 :     }
1629 :     }
1630 :     }
1631 :     push(@show, [scalar @cluster,
1632 :     $cgi->br .
1633 :     $cgi->ul($cgi->li([map { $peg = $_;
1634 :     $sc = $seen{$peg};
1635 :     $func = $fig->function_of($peg,$user);
1636 :     $gs = $fig->genus_species($fig->genome_of($peg));
1637 :     $link = &HTML::fid_link($cgi,$peg);
1638 :     "$sc: $link: $func \[$gs\]" }
1639 :     sort { $seen{$b} <=> $seen{$a} }
1640 :     @cluster]))
1641 :     ]);
1642 :     }
1643 :     }
1644 :    
1645 :     if (@show > 0)
1646 :     {
1647 :     @show = map { $_->[1] } sort { $b->[0] <=> $a->[0] } @show;
1648 :     push(@$html,$cgi->h1('Coupled, but not in Spreadsheet:'));
1649 :     push(@$html,$cgi->ul($cgi->li(\@show)));
1650 :     }
1651 :     }
1652 :    
1653 :     sub ext_genus_species {
1654 :     my($fig,$genome) = @_;
1655 :    
1656 :     my $gs = $fig->genus_species($genome);
1657 :     my $c = substr($fig->taxonomy_of($genome),0,1);
1658 :     return "$gs [$c]";
1659 :     }
1660 :    
1661 :     sub show_tree {
1662 :    
1663 :     my($id,$gs);
1664 :     my($tree,$ids) = $fig->build_tree_of_complete;
1665 :     my $relabel = {};
1666 :     foreach $id (@$ids)
1667 :     {
1668 :     if ($gs = $fig->genus_species($id))
1669 :     {
1670 :     $relabel->{$id} = "$gs ($id)";
1671 :     }
1672 :     }
1673 :     $_ = &display_tree($tree,$relabel);
1674 :     print $cgi->pre($_),"\n";
1675 :     }
1676 :    
1677 :     sub align_column {
1678 :     my($fig,$cgi,$html,$col,$roles,$genomes,$rows,$subsetsR,$active_subsetR) = @_;
1679 :     my($colN,@checked,$cutoff);
1680 :    
1681 :     my $subsetR = $subsetsR->{$active_subsetR};
1682 :    
1683 :     if (($colN = &which_column($col,$roles)) &&
1684 :     ((@checked = &seqs_to_align($colN,$genomes,$rows,$subsetR)) > 1))
1685 :     {
1686 :     if ($cutoff = $cgi->param('include_homo'))
1687 :     {
1688 :     my $max = $cgi->param('max_homo');
1689 :     $max = $max ? $max : 100;
1690 :     push(@checked,&get_homologs($fig,\@checked,$cutoff,$max));
1691 :     }
1692 :     my $checked = join("\' \'",@checked);
1693 :     push(@$html,"<pre>\n");
1694 :     my %org = map { ( $_, $fig->org_of($_) ) } @checked;
1695 :     # Modified by GJO to compress tree and add organism names to tree:
1696 :     # push(@$html,`$FIG_Config::bin/align_with_clustal -tree \'$checked\'`);
1697 :    
1698 :     # Simpler version
1699 :     # push @$html, map { chomp;
1700 :     # /^ *\|[ |]*$/ # line that adds only tree height
1701 :     # ? () # remove it
1702 :     # : /- ([a-z]+\|\S+):/ && defined( $org{$1} ) # tree id?
1703 :     # ? "$_ [$org{$1}]\n" # add the name
1704 :     # : "$_\n" # otherwise leave unmodified
1705 :     # } `$FIG_Config::bin/align_with_clustal -tree \'$checked\'`;
1706 :    
1707 :     # More complex version the preserves double spaced tree tips
1708 :     my $tip = 0;
1709 :     my @out = ();
1710 :     foreach ( `$FIG_Config::bin/align_with_clustal -tree \'$checked\'` )
1711 :     {
1712 :     chomp;
1713 :     if ( /^ *\|[ |]*$/ ) {} # line that adds only tree height
1714 :     elsif ( /- ([a-z]+\|\S+):/ ) # line with tree tip
1715 :     {
1716 :     if ( defined( $org{$1} ) ) { $_ .= " [$org{$1}]" } # add org
1717 :     if ( $tip ) { push @out, " |\n" } # 2 tips in a row? add line
1718 :     push @out, "$_\n"; # output current line
1719 :     $tip = 1;
1720 :     }
1721 :     else # not a tip
1722 :     {
1723 :     push @out, "$_\n";
1724 :     $tip = 0;
1725 :     }
1726 :     }
1727 :     push(@$html,&set_links($cgi,\@out));
1728 :     push(@$html,"</pre>\n");
1729 :     }
1730 :     else
1731 :     {
1732 :     push(@$html,"<h1>You need to check at least two sequences</h1>\n");
1733 :     }
1734 :     }
1735 :    
1736 :     sub which_column {
1737 :     my($col,$roles) = @_;
1738 :     my($i);
1739 :    
1740 :     if (($col =~ /^(\d+)/) && ($1 <= @$roles))
1741 :     {
1742 :     return $1;
1743 :     }
1744 :     else
1745 :     {
1746 :     for ($i=1; ($i < @$roles) && ($roles->[$i] !~ /^$col\t/); $i++) {}
1747 :     return ($i < @$roles) ? $i : undef;
1748 :     }
1749 :     }
1750 :    
1751 :     sub seqs_to_align {
1752 :     my($colN,$genomes,$rows,$subsetR) = @_;
1753 :     my($i);
1754 :    
1755 :     my @seqs = ();
1756 :     for ($i=0; ($i < @$rows); $i++)
1757 :     {
1758 :     my $genome = $genomes->[$i];
1759 :     if ($subsetR->{$genome})
1760 :     {
1761 :     push(@seqs,map { "fig|$genome.peg.$_" } split(/,/,$rows->[$i]->[$colN]));
1762 :     }
1763 :     }
1764 :     return @seqs;
1765 :     }
1766 :    
1767 :     sub get_homologs {
1768 :     my($fig,$checked,$cutoff,$max) = @_;
1769 :     my($peg,$sim,$id2);
1770 :    
1771 :     my @homologs = ();
1772 :     my %got = map { $_ => 1 } @$checked;
1773 :    
1774 :     foreach $peg (@$checked)
1775 :     {
1776 :     foreach $sim ($fig->sims($peg,$max,$cutoff,"fig"))
1777 :     {
1778 :     $id2 = $sim->id2;
1779 :     if (! $got{$id2})
1780 :     {
1781 :     push(@homologs,[$sim->psc,$id2]);
1782 :     $got{$id2} = 1;
1783 :     }
1784 :     }
1785 :     }
1786 :     @homologs = map { $_->[1] } sort { $a->[0] <=> $b->[0] } @homologs;
1787 :     if (@homologs > $max) { $#homologs = $max-1 }
1788 :    
1789 :     return @homologs;
1790 :     }
1791 :    
1792 :     sub set_links {
1793 :     my($cgi,$out) = @_;
1794 :    
1795 :     my @with_links = ();
1796 :     foreach $_ (@$out)
1797 :     {
1798 :     if ($_ =~ /^(.*)(fig\|\d+\.\d+\.peg\.\d+)(.*)$/)
1799 :     {
1800 :     my($before,$peg,$after) = ($1,$2,$3);
1801 :     push(@with_links, $before . &HTML::fid_link($cgi,$peg) . $after . "\n");
1802 :     }
1803 :     else
1804 :     {
1805 :     push(@with_links,$_);
1806 :     }
1807 :     }
1808 :     return @with_links;
1809 :     }
1810 :    
1811 :     sub backup {
1812 :     my($ssaD) = @_;
1813 :    
1814 :     my $sz1 = &size("$ssaD/spreadsheet") + &size("$ssaD/notes");
1815 :     my $sz2 = &size("$ssaD/spreadsheet~") + &size("$ssaD/notes~");
1816 :     if (abs($sz1-$sz2) > 10)
1817 :     {
1818 :     &make_backup($ssaD);
1819 :     }
1820 :     }
1821 :    
1822 :     sub make_backup {
1823 :     my($ssaD) = @_;
1824 :    
1825 :     &FIG::verify_dir("$ssaD/Backup");
1826 :     my $ts = time;
1827 :     rename("$ssaD/spreadsheet~","$ssaD/Backup/spreadsheet.$ts");
1828 :     rename("$ssaD/notes~","$ssaD/Backup/notes.$ts");
1829 :     &incr_version($ssaD);
1830 :     }
1831 :    
1832 :     sub incr_version {
1833 :     my($dir) = @_;
1834 :     my($ver);
1835 :    
1836 :     if (open(VER,"<$dir/VERSION"))
1837 :     {
1838 :     if (defined($ver = <VER>) && ($ver =~ /^(\S+)/))
1839 :     {
1840 :     $ver = $1;
1841 :     }
1842 :     else
1843 :     {
1844 :     $ver = 0;
1845 :     }
1846 :     close(VER);
1847 :     }
1848 :     else
1849 :     {
1850 :     $ver = 0;
1851 :     }
1852 :     open(VER,">$dir/VERSION") || die "could not open $dir/VERSION";
1853 :     chmod(0777,"$dir/VERSION");
1854 :     $ver++;
1855 :     print VER "$ver\n";
1856 :     }
1857 :    
1858 :    
1859 :     sub size {
1860 :     my($file) = @_;
1861 :    
1862 :     return (-s $file) ? -s $file : 0;
1863 :     }
1864 :    
1865 :     sub reset_ssa {
1866 :     my($fig,$cgi,$html) = @_;
1867 :     my($ssa,@spreadsheets,$col_hdrs,$tab,$t,$readable,$url,$link,@tmp);
1868 :    
1869 :     if (($ssa = $cgi->param('ssa_name')) && opendir(BACKUP,"$FIG_Config::data/Subsystems/$ssa/Backup"))
1870 :     {
1871 :     @spreadsheets = sort { $b <=> $a }
1872 :     map { $_ =~ /^spreadsheet.(\d+)/; $1 }
1873 :     grep { $_ =~ /^spreadsheet/ }
1874 :     readdir(BACKUP);
1875 :     closedir(BACKUP);
1876 :     $col_hdrs = ["When","Number Genomes"];
1877 :     $tab = [];
1878 :     foreach $t (@spreadsheets)
1879 :     {
1880 :     $readable = &FIG::epoch_to_readable($t);
1881 : overbeek 1.2 $url = &FIG::cgi_url . "/ssa2.cgi?user=$user&ssa_name=$ssa&request=reset_to&ts=$t";
1882 : overbeek 1.1 $link = "<a href=$url>$readable</a>";
1883 :     open(TMP,"<$FIG_Config::data/Subsystems/$ssa/Backup/spreadsheet.$t")
1884 :     || die "could not open $FIG_Config::data/Subsystems/$ssa/Backup/spreadsheet.$t";
1885 :     $/ = "//\n";
1886 :     $_ = <TMP>;
1887 :     $_ = <TMP>;
1888 :     $_ = <TMP>;
1889 :     chomp;
1890 :     $/ = "\n";
1891 :    
1892 :     @tmp = grep { $_ =~ /^\d+\.\d+/ } split(/\n/,$_);
1893 :     push(@$tab,[$link,scalar @tmp]);
1894 :     }
1895 :     }
1896 :     push(@$html,&HTML::make_table($col_hdrs,$tab,"Possible Points to Reset From"));
1897 :     }
1898 :    
1899 :     sub reset_ssa_to {
1900 :     my($fig,$cgi,$html) = @_;
1901 :     my($ts,$ssa);
1902 :    
1903 :     if (($ssa = $cgi->param('ssa_name')) &&
1904 :     ($ts = $cgi->param('ts')) &&
1905 :     (-s "$FIG_Config::data/Subsystems/$ssa/Backup/spreadsheet.$ts"))
1906 :     {
1907 :     system "cp -f $FIG_Config::data/Subsystems/$ssa/Backup/spreadsheet.$ts $FIG_Config::data/Subsystems/$ssa/spreadsheet";
1908 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa/spreadsheet");
1909 :     if (-s "$FIG_Config::data/Subsystems/$ssa/Backup/notes.$ts")
1910 :     {
1911 :     system "cp -f $FIG_Config::data/Subsystems/$ssa/Backup/notes.$ts $FIG_Config::data/Subsystems/$ssa/notes";
1912 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa/notes");
1913 :     }
1914 :     push(@$html,$cgi->h1("Reset"));
1915 :     }
1916 :     }
1917 :    
1918 :     sub make_exchangable {
1919 :     my($fig,$cgi,$html) = @_;
1920 :     my($ssa);
1921 :    
1922 :     if (($ssa = $cgi->param('ssa_name')) &&
1923 :     (-s "$FIG_Config::data/Subsystems/$ssa/spreadsheet") &&
1924 :     open(TMP,">$FIG_Config::data/Subsystems/$ssa/EXCHANGABLE"))
1925 :     {
1926 :     print TMP "1\n";
1927 :     close(TMP);
1928 :     chmod(0777,"$FIG_Config::data/Subsystems/$ssa/EXCHANGABLE");
1929 :     }
1930 :     }
1931 :    
1932 :     sub make_unexchangable {
1933 :     my($fig,$cgi,$html) = @_;
1934 :     my($ssa);
1935 :    
1936 :     if (($ssa = $cgi->param('ssa_name')) &&
1937 :     (-s "$FIG_Config::data/Subsystems/$ssa/EXCHANGABLE"))
1938 :     {
1939 :     unlink("$FIG_Config::data/Subsystems/$ssa/EXCHANGABLE");
1940 :     }
1941 :     }
1942 :    
1943 :     sub fid_links {
1944 :     my($cgi,$entry,$genome) = @_;
1945 :     my($pegN);
1946 :    
1947 :     my @links = ();
1948 :     foreach $pegN (split(/,/,$entry->[0]))
1949 :     {
1950 :     push(@links,&HTML::fid_link($cgi,"fig|$genome.peg.$pegN","local"));
1951 :     }
1952 :     my $color = "bgcolor=\"$entry->[1]\"\:";
1953 :     return "\@$color" . join(",",@links);
1954 :     }
1955 :    
1956 :     sub group_by_clusters {
1957 :     my($fig,$genome,$tmp) = @_;
1958 :     my(@pegs,$entry,$pegN,%pegs,$peg,$peg1,%conn,%seen,@entries);
1959 :     my($i,$x,@cluster,@clusters,%in,$best,$cluster,$which,$colors);
1960 :    
1961 :     if (! $cgi->param('show_clusters'))
1962 :     {
1963 :     return map { [$_,"#FFFFFF"] } @$tmp;
1964 :     }
1965 :    
1966 :     @pegs = ();
1967 :     foreach $entry (@$tmp)
1968 :     {
1969 :     foreach $pegN (split(/,/,$entry))
1970 :     {
1971 :     push(@pegs,"fig|$genome.peg.$pegN");
1972 :     }
1973 :     }
1974 :     %pegs = map { $_ => 1 } @pegs;
1975 : overbeek 1.2 @pegs = keys(%pegs);
1976 : overbeek 1.1
1977 :     foreach $peg (@pegs)
1978 :     {
1979 :     foreach $peg1 (grep { $pegs{$_} && ($_ ne $peg) } $fig->close_genes($peg,5000))
1980 :     {
1981 :     push(@{$conn{$peg}},$peg1);
1982 :     }
1983 :     }
1984 :    
1985 :     @clusters = ();
1986 :     while ($peg = shift @pegs)
1987 :     {
1988 :     if (! $seen{$peg})
1989 :     {
1990 :     @cluster = ($peg);
1991 :     $seen{$peg} = 1;
1992 :     for ($i=0; ($i < @cluster); $i++)
1993 :     {
1994 :     $x = $conn{$cluster[$i]};
1995 :     foreach $peg1 (@$x)
1996 :     {
1997 :     if (! $seen{$peg1})
1998 :     {
1999 :     push(@cluster,$peg1);
2000 :     $seen{$peg1} = 1;
2001 :     }
2002 :     }
2003 :     }
2004 :     push(@clusters,[@cluster]);
2005 :     }
2006 :     }
2007 :    
2008 :     @clusters = sort { @$b <=> @$a } @clusters;
2009 :     for ($i=0; ($i < @clusters); $i++)
2010 :     {
2011 :     $cluster = $clusters[$i];
2012 :     foreach $peg (@$cluster)
2013 :     {
2014 :     $peg =~ /(\d+)$/;
2015 :     $in{$1} = $i;
2016 :     }
2017 :     }
2018 :    
2019 :     $colors =
2020 :     [
2021 :     '#C0C0C0',
2022 :     '#FF40C0',
2023 :     '#FF8040',
2024 :     '#FF0080',
2025 :     '#FFC040',
2026 :     '#40C0FF',
2027 :     '#40FFC0',
2028 :     '#C08080',
2029 :     '#C0FF00',
2030 :     '#00FF80',
2031 :     '#00C040'
2032 :     ];
2033 :    
2034 :     @entries = ();
2035 :     foreach $entry (@$tmp)
2036 :     {
2037 :     $best = undef;
2038 :     foreach $pegN (split(/,/,$entry))
2039 :     {
2040 :     $which = $in{$pegN};
2041 :     if ((! defined($best)) || ($best > $which))
2042 :     {
2043 :     $best = $which;
2044 :     }
2045 :     }
2046 :    
2047 :     if (defined($best) && (@{$clusters[$best]} > 1) && ($best < @$colors))
2048 :     {
2049 :     push(@entries,[$entry,$colors->[$best]]);
2050 :     }
2051 :     else
2052 :     {
2053 :     push(@entries,[$entry,'#FFFFFF']);
2054 :     }
2055 :     }
2056 :     return @entries;
2057 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3