[Bio] / FigKernelPackages / UnvSubsys.pm Repository:
ViewVC logotype

Annotation of /FigKernelPackages/UnvSubsys.pm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.9 - (view) (download) (as text)

1 : overbeek 1.1 package UnvSubsys;
2 :    
3 : overbeek 1.2 use Subsystem;
4 : overbeek 1.1 use Carp;
5 :     use FIG;
6 :    
7 :     use Data::Dumper;
8 :     use strict;
9 :    
10 :     sub new
11 :     {
12 : overbeek 1.8 my($class, $ssa, $fig, $active_subsetR, $focus, $show_clusters, $aliases, $peg_colors) = @_;
13 : overbeek 1.1
14 :     $ssa =~ s/ /_/g;
15 :    
16 :    
17 : parrello 1.5 ### { Roles =>Roles,
18 : overbeek 1.2 ### RoleIndex => ToRoleIndexHash,
19 :     ### RoleSubsets => ColSubsets,
20 :     ### Genomes => Genomes,
21 :     ### GenomeIndex => ToGenomeIndexHash,
22 :     ### PegHash => PegHash,
23 :     ### Colors => ColorHash,
24 :     ### Aliases => AliasHash,
25 :     ### Curator => Curator,
26 :     ### Notes => Notes,
27 :     ### Reactions => ReactionHash
28 :     ### }
29 : parrello 1.5 ###
30 :     ### Roles = pointer to a list of [Role,Abbrev,[ReactionURLs]]
31 :     ###
32 :     ### ToRoleIndexHash = a pointer to a hash: key=Role Value=RoleIndex
33 :     ###
34 :     ### ColSubsets = pointer to a list of [SubsetName,[RoleIndexesFrom0]]
35 :     ###
36 : overbeek 1.6 ### RowSubSets = pointer to a list of [SubsetName,[GenomeIndexesFrom0]]
37 :     ###
38 : parrello 1.5 ### Genomes is a pointer to a list of [Genome,Variant]
39 :     ###
40 :     ### ToGenomeIndexHash = a pointer to a hash: key=Genome value=GenomeIndex
41 :     ###
42 :     ### PegHash = a pointer to a hash of hashes such that $peg_hash->{$genome_index}->{$role_index} = a
43 :     ### pointer to a list of PEGs
44 :     ###
45 :     ### ColorHash is a hash: key=PEG value=color
46 :     ###
47 :     ### AliasHash is a hash: key=PEG value=aliases
48 :     ###
49 : overbeek 1.2 ### ReactionHash is a hash: key=Role value=[reaction-ids]
50 : overbeek 1.1
51 : overbeek 1.6 if ((ref($fig) eq "FIG") || ((ref($fig) eq 'SFXlate') && ($fig = $fig->{'fig'})))
52 : overbeek 1.1 {
53 : parrello 1.5 my $subsystem = new Subsystem($ssa,$fig,0);
54 :     my $curator = $subsystem->get_curator;
55 :     my $notes = $subsystem->get_notes;
56 :     $notes =~ s/ /\n/g;
57 :     my @roles = $subsystem->get_roles;
58 :     my $reactions = $subsystem->get_reactions;
59 :     my @genomes = $subsystem->get_genomes;
60 : overbeek 1.1 my @col_subsets = $subsystem->get_subset_namesC;
61 :    
62 : parrello 1.5 my $role_info = [];
63 :     my $roleH = {};
64 : overbeek 1.1
65 : parrello 1.5 my($i,$j,$subset,$peg);
66 :     for ($i=0; ($i < @roles); $i++)
67 :     {
68 :     my $role = $roles[$i];
69 :     my $abbrev = $subsystem->get_role_abbr( $subsystem->get_role_index( $role ) );
70 :     my $react = $reactions ? join(",", map { &HTML::reaction_link($_) } @{$reactions->{$role}}) : [];
71 :     push(@$role_info,[$role,$abbrev,$react]);
72 :     $roleH->{$role} = $i;
73 :     }
74 :    
75 :     my $subset_info = [];
76 :     foreach $subset (@col_subsets)
77 :     {
78 :     if ($subset ne 'All')
79 :     {
80 :     push(@$subset_info,[$subset,[map { $roleH->{$_} } $subsystem->get_subsetC_roles($subset)]]);
81 :     }
82 :     }
83 :    
84 :     my $genomes_info = [];
85 :     my $genomeH = {};
86 :     for ($i=0; ($i < @genomes); $i++)
87 :     {
88 :     my $genome = $genomes[$i];
89 :     my $variant = $subsystem->get_variant_code( $subsystem->get_genome_index( $genome ) );
90 :     push(@$genomes_info,[$genome,$variant]);
91 :     $genomeH->{$genome} = $i;
92 :     }
93 :    
94 :     my $pegH = {};
95 :     for ($i=0; ($i < @genomes); $i++)
96 :     {
97 :     my $genome = $genomes[$i];
98 :     for ($j=0; ($j < @roles); $j++)
99 :     {
100 :     my $role = $roles[$j];
101 :     my @pegs = $subsystem->get_pegs_from_cell($genome,$role);
102 :     $pegH->{$i}->{$j} = [@pegs];
103 :     }
104 :     }
105 : overbeek 1.7
106 :     my $row_subsets = &row_subsets($fig,$genomeH,$genomes_info);
107 :     my $active_genomes = &active_genomes($row_subsets,$active_subsetR,$focus,$genomeH,$genomes_info);
108 : overbeek 1.8
109 :     my $colorsH;
110 :     if ($peg_colors)
111 :     {
112 :     $colorsH = {};
113 :     foreach $_ (@$peg_colors)
114 :     {
115 :     my($peg,$color) = @$_;
116 :     $colorsH->{$peg} = $color;
117 :     }
118 :     }
119 :     elsif ($show_clusters)
120 :     {
121 :     $colorsH = &set_colors($fig,$pegH,$active_genomes);
122 :     }
123 :     else
124 :     {
125 :     $colorsH = {};
126 :     }
127 :    
128 : overbeek 1.7 my $aliasesH = $aliases ? &set_aliases($fig,$pegH,$active_genomes) : {};
129 : overbeek 1.6 my $reactions = $subsystem->get_reactions;
130 : parrello 1.5 my $self = { Roles => $role_info,
131 :     RoleIndex => $roleH,
132 :     RoleSubsets => $subset_info,
133 :     Genomes => $genomes_info,
134 :     GenomeIndex => $genomeH,
135 : overbeek 1.6 GenomeSubsets => $row_subsets,
136 : parrello 1.5 PegHash => $pegH,
137 :     Colors => $colorsH,
138 :     Aliases => $aliasesH,
139 :     Curator => $curator,
140 :     Notes => $notes,
141 :     Reactions => $reactions
142 :     };
143 :     bless($self, $class);
144 :     return $self;
145 : overbeek 1.1 }
146 :     else
147 :     {
148 : parrello 1.5 return undef;
149 : overbeek 1.1 }
150 :     }
151 :    
152 : overbeek 1.6 sub get_subset_namesR {
153 :     my($self) = @_;
154 :    
155 :     return map { $_->[0] } @{$self->{GenomeSubsets}};
156 :     }
157 :    
158 :     sub get_subsetR {
159 :     my($self,$set) = @_;
160 :     my($i);
161 :    
162 :     my $sets = $self->{GenomeSubsets};
163 :     for ($i=0; ($i < @$sets) && ($sets->[$i]->[0] ne $set); $i++) {}
164 :     if ($i < @$sets)
165 :     {
166 :     return map { $self->{Genomes}->[$_]->[0] } @{$sets->[$i]->[1]}
167 :     }
168 :     return undef;
169 :     }
170 :    
171 :     sub get_subsetsR {
172 :     my($self) = @_;
173 :    
174 :     my $sets = $self->{GenomeSubsets};
175 :     my @pairs = ();
176 :     my $pair;
177 :     foreach $pair (@$sets)
178 :     {
179 :     my($id,$members) = @$pair;
180 :     push(@pairs,[$id,[map { $self->{Genomes}->[$_]->[0] } @$members]]);
181 :     }
182 :     return @pairs;
183 :     }
184 :    
185 :     sub row_subsets {
186 :     my ($fig,$genomeH,$genomes_info) = @_;
187 :    
188 :     my $subsets = [];
189 :     my $taxonomic_groups = $fig->taxonomic_groups_of_complete(10);
190 : overbeek 1.9
191 : overbeek 1.6 my($pair,$id,$members);
192 :     foreach $pair (@$taxonomic_groups)
193 :     {
194 :     ($id,$members) = @$pair;
195 :     my @mem = grep { defined($_) } map { $genomeH->{$_} } @$members;
196 :     if (@mem > 10)
197 :     {
198 :     push(@$subsets,[$id,[@mem]]);
199 :     }
200 :     }
201 : overbeek 1.9 if (@$subsets == 0)
202 :     {
203 :     foreach $pair (@$taxonomic_groups)
204 :     {
205 :     ($id,$members) = @$pair;
206 :     my @mem = grep { defined($_) } map { $genomeH->{$_} } @$members;
207 :     if (@mem > 0)
208 :     {
209 :     push(@$subsets,[$id,[@mem]]);
210 :     }
211 :     }
212 :     }
213 : overbeek 1.6 return $subsets;
214 :     }
215 :    
216 : overbeek 1.4 sub set_aliases {
217 : overbeek 1.7 my($fig,$pegH,$active_genomes) = @_;
218 : overbeek 1.4 my($genomeI,$roleI,$pegs,$peg,$roleH);
219 :    
220 :     my $aliasesH = {};
221 :    
222 : overbeek 1.7 foreach $genomeI (grep { $active_genomes->{$_} } keys(%$pegH))
223 : overbeek 1.4 {
224 : parrello 1.5 $roleH = $pegH->{$genomeI};
225 :     foreach $roleI (keys(%$roleH))
226 :     {
227 :     $pegs = $roleH->{$roleI};
228 :     foreach $peg (@$pegs)
229 :     {
230 :     if (! $aliasesH->{$peg})
231 :     {
232 :     $aliasesH->{$peg} = scalar &ext_id($fig,$peg);
233 :     }
234 :     }
235 :     }
236 : overbeek 1.4 }
237 :     return $aliasesH;
238 :     }
239 :    
240 :     sub set_colors {
241 : overbeek 1.7 my($fig,$pegH,$active_genomes) = @_;
242 : overbeek 1.4 my($genomeI,$roleI,$pegs,$peg,$roleH,$peg,%pegs_in_genome);
243 :    
244 :     my $colorsH = {};
245 :    
246 : overbeek 1.7 foreach $genomeI (grep { $active_genomes->{$_} } keys(%$pegH))
247 : overbeek 1.4 {
248 : parrello 1.5 undef %pegs_in_genome;
249 :     $roleH = $pegH->{$genomeI};
250 :     foreach $roleI (keys(%$roleH))
251 :     {
252 :     $pegs = $roleH->{$roleI};
253 :     foreach $peg (@$pegs)
254 :     {
255 :     $pegs_in_genome{$peg} = 1;
256 :     }
257 :     }
258 :    
259 :     my @pegs = keys(%pegs_in_genome);
260 :     my($tuple,$peg,$color);
261 :     my $colors_for_one_genome = &set_colors_for_genome($fig,\@pegs);
262 :    
263 :     while (($peg,$color) = each %$colors_for_one_genome)
264 :     {
265 :     $colorsH->{$peg} = $colors_for_one_genome->{$peg};
266 :     }
267 : overbeek 1.4 }
268 :     return $colorsH;
269 :     }
270 :    
271 :     sub set_colors_for_genome {
272 :     my($fig,$pegs) = @_;
273 :     my($peg,@clusters,$cluster,@colors,$color,%seen,%conn,$x,$peg1,@pegs,$i);
274 :    
275 :     my $color_of = {};
276 :     foreach $peg (@$pegs) { $color_of->{$peg} = '#FFFFFF' }
277 :    
278 :     @pegs = keys(%$color_of); # Use of keys makes @pegs entries unique
279 :    
280 :     foreach $peg (@pegs)
281 :     {
282 : parrello 1.5 $conn{$peg} = [grep { $color_of->{$_} && ($_ ne $peg) } $fig->close_genes($peg,5000)];
283 : overbeek 1.4 }
284 :    
285 :     @clusters = ();
286 :     while ($peg = shift @pegs)
287 :     {
288 : parrello 1.5 if (! $seen{$peg})
289 :     {
290 :     $cluster = [$peg];
291 :     $seen{$peg} = 1;
292 :     for ($i=0; ($i < @$cluster); $i++)
293 :     {
294 :     my @tmp = grep { ! $seen{$_} } @{$conn{$cluster->[$i]}};
295 :     if (@tmp > 0)
296 :     {
297 :     foreach my $peg1 (@tmp) { $seen{$peg1} = 1 }
298 :     push(@$cluster,@tmp);
299 :     }
300 :     }
301 :     push(@clusters,$cluster);
302 :     }
303 : overbeek 1.4 }
304 :    
305 :     @colors = &cool_colors();
306 :    
307 :     @clusters = grep { @$_ > 1 } sort { @$a <=> @$b } @clusters;
308 :    
309 :     if (@clusters > @colors) { splice(@clusters,0,(@clusters - @colors)) } # make sure we have enough colors
310 :    
311 :     my($cluster);
312 :     foreach $cluster (@clusters)
313 :     {
314 : parrello 1.5 $color = shift @colors;
315 :     foreach $peg (@$cluster)
316 :     {
317 :     $color_of->{$peg} = $color;
318 :     }
319 : overbeek 1.4 }
320 :     return $color_of;
321 :     }
322 :    
323 :     sub cool_colors {
324 :     # just an array of "websafe" colors or whatever colors we want to use. Feel free to remove bad colors (hence the lines not being equal length!)
325 :     return (
326 :     '#C0C0C0', '#FF40C0', '#FF8040', '#FF0080', '#FFC040', '#40C0FF', '#40FFC0', '#C08080', '#C0FF00', '#00FF80', '#00C040',
327 :     "#6B8E23", "#483D8B", "#2E8B57", "#008000", "#006400", "#800000", "#00FF00", "#7FFFD4",
328 :     "#87CEEB", "#A9A9A9", "#90EE90", "#D2B48C", "#8DBC8F", "#D2691E", "#87CEFA", "#E9967A", "#FFE4C4", "#FFB6C1",
329 :     "#E0FFFF", "#FFA07A", "#DB7093", "#9370DB", "#008B8B", "#FFDEAD", "#DA70D6", "#DCDCDC", "#FF00FF", "#6A5ACD",
330 :     "#00FA9A", "#228B22", "#1E90FF", "#FA8072", "#CD853F", "#DC143C", "#FF6347", "#98FB98", "#4682B4",
331 :     "#D3D3D3", "#7B68EE", "#2F4F4F", "#FF7F50", "#FF69B4", "#BC8F8F", "#A0522D", "#DEB887", "#00DED1",
332 :     "#6495ED", "#800080", "#FFD700", "#F5DEB3", "#66CDAA", "#FF4500", "#4B0082", "#CD5C5C",
333 :     "#EE82EE", "#7CFC00", "#FFFF00", "#191970", "#FFFFE0", "#DDA0DD", "#00BFFF", "#DAA520", "#008080",
334 :     "#00FF7F", "#9400D3", "#BA55D3", "#D8BFD8", "#8B4513", "#3CB371", "#00008B", "#5F9EA0",
335 :     "#4169E1", "#20B2AA", "#8A2BE2", "#ADFF2F", "#556B2F",
336 :     "#F0FFFF", "#B0E0E6", "#FF1493", "#B8860B", "#FF0000", "#F08080", "#7FFF00", "#8B0000",
337 :     "#40E0D0", "#0000CD", "#48D1CC", "#8B008B", "#696969", "#AFEEEE", "#FF8C00", "#EEE8AA", "#A52A2A",
338 :     "#FFE4B5", "#B0C4DE", "#FAF0E6", "#9ACD32", "#B22222", "#FAFAD2", "#808080", "#0000FF",
339 :     "#000080", "#32CD32", "#FFFACD", "#9932CC", "#FFA500", "#F0E68C", "#E6E6FA", "#F4A460", "#C71585",
340 :     "#BDB76B", "#00FFFF", "#FFDAB9", "#ADD8E6", "#778899",
341 :     );
342 :     }
343 :    
344 :     sub ext_id {
345 :     my($fig,$peg) = @_;
346 :    
347 :     my @tmp;
348 :     my @aliases = $fig->feature_aliases($peg);
349 :     if ((@tmp = grep { $_ =~ /^uni\|/ } @aliases) > 0)
350 :     {
351 : parrello 1.5 @aliases = @tmp;
352 : overbeek 1.4 }
353 :     elsif ((@tmp = grep { $_ =~ /^sp\|/ } @aliases) > 0)
354 :     {
355 : parrello 1.5 @aliases = @tmp;
356 : overbeek 1.4 }
357 :     elsif ((@tmp = grep { $_ =~ /^gi\|/ } @aliases) > 0)
358 :     {
359 : parrello 1.5 @aliases = @tmp;
360 : overbeek 1.4 }
361 :     elsif ((@tmp = grep { $_ =~ /^kegg\|/ } @aliases) > 0)
362 :     {
363 : parrello 1.5 @aliases = @tmp;
364 : overbeek 1.4 }
365 :     else
366 :     {
367 : parrello 1.5 @aliases = ();
368 : overbeek 1.4 }
369 :    
370 :     if (wantarray())
371 :     {
372 : parrello 1.5 return @aliases;
373 : overbeek 1.4 }
374 :     else
375 :     {
376 : parrello 1.5 return $aliases[0];
377 : overbeek 1.4 }
378 :     }
379 :    
380 :    
381 : overbeek 1.2 sub subsystem_curator {
382 :     my($self) = @_;
383 :    
384 :     my $curator = $self->{Curator};
385 :     $curator =~ s/master://;
386 :     return $curator;
387 :     }
388 :    
389 :     sub get_roles {
390 :     my($self) = @_;
391 :    
392 :     return map { $_->[0] } @{$self->{Roles}};
393 :     }
394 :    
395 : overbeek 1.3 sub get_genome_index {
396 :     my($self,$genome) = @_;
397 :    
398 :     return $self->{GenomeIndex}->{$genome};
399 :     }
400 :    
401 :     sub get_genomes {
402 :     my($self) = @_;
403 :    
404 :     return map { $_->[0] } @{$self->{Genomes}};
405 :     }
406 :    
407 :     sub get_variant_code {
408 :     my($self,$genome) = @_;
409 :    
410 :     if ($genome =~ /^\d+$/)
411 :     {
412 : parrello 1.5 return $self->{Genomes}->[$genome]->[1];
413 : overbeek 1.3 }
414 :     else
415 :     {
416 : parrello 1.5 my $genomeI = $self->{GenomeIndex}->{$genome};
417 :     return $self->{Genomes}->[$genomeI]->[1];
418 : overbeek 1.3 }
419 :     }
420 :    
421 :     sub get_pegs_from_cell {
422 :     my($self,$genome,$role) = @_;
423 :    
424 :     my $genomeI = $self->{GenomeIndex}->{$genome};
425 :     my $roleI = $self->{RoleIndex}->{$role};
426 :    
427 :     my $pegs = $self->{PegHash}->{$genomeI}->{$roleI};
428 :     return $pegs ? @$pegs : ();
429 :     }
430 :    
431 :     sub get_notes {
432 :     my($self) = @_;
433 :    
434 :     return $self->{Notes};
435 :     }
436 :    
437 : overbeek 1.2 sub get_role_index {
438 :     my($self,$role) = @_;
439 :    
440 :     return $self->{RoleIndex}->{$role};
441 :     }
442 :    
443 :     sub get_role_abbr {
444 :     my($self,$roleI) = @_;
445 :    
446 :     if ($roleI !~ /^\d+$/)
447 :     {
448 : parrello 1.5 $roleI = $self->{RoleIndex}->{$roleI};
449 : overbeek 1.2 }
450 :     my $roles = $self->{Roles};
451 :     return $roles->[$roleI]->[1];
452 :     }
453 :    
454 :     sub get_reactions {
455 :     my($self) = @_;
456 :    
457 :     return $self->{Reactions};
458 :     }
459 :    
460 :     sub get_subset_namesC {
461 :     my($self) = @_;
462 :    
463 :     return map { $_->[0] } @{$self->{RoleSubsets}};
464 :     }
465 :    
466 :     sub get_subsetC_roles {
467 :     my($self,$subset) = @_;
468 :     my($i,$j);
469 :    
470 :     my $subset_info = $self->{RoleSubsets};
471 :     for ($i=0; ($i < @$subset_info) && ($subset_info->[$i]->[0] ne $subset); $i++) {}
472 :     if ($i < @$subset_info)
473 :     {
474 : parrello 1.5 my @roles = ();
475 :     foreach $j (@{$subset_info->[$i]->[1]})
476 :     {
477 :     push(@roles,$self->{Roles}->[$j]->[0]);
478 :     }
479 :     return @roles;
480 : overbeek 1.2 }
481 :     return undef;
482 :     }
483 :    
484 : overbeek 1.4 sub get_color_of {
485 :     my($self,$peg) = @_;
486 :    
487 :     return $self->{Colors}->{$peg};
488 :     }
489 :    
490 : overbeek 1.7 sub active_genomes {
491 :     my($row_subsets,$active_subsetR,$focus,$genomeH,$genomes_info) = @_;
492 :     my($i,@bestL);
493 :    
494 :     my $active_genomes = {};
495 :     if ($active_subsetR)
496 :     {
497 :     for ($i=0; ($i < @$row_subsets) && ($row_subsets->[$i]->[0] ne $active_subsetR); $i++) {}
498 :     if ($i < @$row_subsets)
499 :     {
500 :     @bestL = @{$row_subsets->[$i]->[1]};
501 :     }
502 :     else
503 :     {
504 :     $active_subsetR = 'All';
505 :     @bestL = keys(%$genomeH);
506 :     }
507 :     }
508 :     else
509 :     {
510 :     if (! $focus)
511 :     {
512 :     $active_subsetR = 'All';
513 :     @bestL = keys(%$genomeH);
514 :     }
515 :     else
516 :     {
517 :     my $bestN = undef;
518 :     @bestL = ();
519 :    
520 :     my $tuple;
521 :     foreach $tuple (@$row_subsets)
522 :     {
523 :     my($id,$genomeIs) = @$tuple;
524 :     for ($i=0; ($i < @$genomeIs) && ($genomes_info->[$genomeIs->[$i]]->[0] ne $focus); $i++) {}
525 :     if ($i < @$genomeIs)
526 :     {
527 :     if ((! $bestN) || (@$genomeIs < @bestL))
528 :     {
529 :     $bestN = $id;
530 :     @bestL = @$genomeIs;
531 :     }
532 :     }
533 :     }
534 :     $active_subsetR = $bestN;
535 :     }
536 :     }
537 :    
538 :     my %active_genomes = map { $_ => 1 } @bestL;
539 :     return \%active_genomes;
540 :     }
541 :    
542 : overbeek 1.1 1;
543 :    
544 :    

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3