[Bio] / FigKernelPackages / UnvSubsys.pm Repository:
ViewVC logotype

Annotation of /FigKernelPackages/UnvSubsys.pm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.8 - (view) (download) (as text)

1 : overbeek 1.1 package UnvSubsys;
2 :    
3 : overbeek 1.2 use Subsystem;
4 : overbeek 1.1 use Carp;
5 :     use FIG;
6 :    
7 :     use Data::Dumper;
8 :     use strict;
9 :    
10 :     sub new
11 :     {
12 : overbeek 1.8 my($class, $ssa, $fig, $active_subsetR, $focus, $show_clusters, $aliases, $peg_colors) = @_;
13 : overbeek 1.1
14 :     $ssa =~ s/ /_/g;
15 :    
16 :    
17 : parrello 1.5 ### { Roles =>Roles,
18 : overbeek 1.2 ### RoleIndex => ToRoleIndexHash,
19 :     ### RoleSubsets => ColSubsets,
20 :     ### Genomes => Genomes,
21 :     ### GenomeIndex => ToGenomeIndexHash,
22 :     ### PegHash => PegHash,
23 :     ### Colors => ColorHash,
24 :     ### Aliases => AliasHash,
25 :     ### Curator => Curator,
26 :     ### Notes => Notes,
27 :     ### Reactions => ReactionHash
28 :     ### }
29 : parrello 1.5 ###
30 :     ### Roles = pointer to a list of [Role,Abbrev,[ReactionURLs]]
31 :     ###
32 :     ### ToRoleIndexHash = a pointer to a hash: key=Role Value=RoleIndex
33 :     ###
34 :     ### ColSubsets = pointer to a list of [SubsetName,[RoleIndexesFrom0]]
35 :     ###
36 : overbeek 1.6 ### RowSubSets = pointer to a list of [SubsetName,[GenomeIndexesFrom0]]
37 :     ###
38 : parrello 1.5 ### Genomes is a pointer to a list of [Genome,Variant]
39 :     ###
40 :     ### ToGenomeIndexHash = a pointer to a hash: key=Genome value=GenomeIndex
41 :     ###
42 :     ### PegHash = a pointer to a hash of hashes such that $peg_hash->{$genome_index}->{$role_index} = a
43 :     ### pointer to a list of PEGs
44 :     ###
45 :     ### ColorHash is a hash: key=PEG value=color
46 :     ###
47 :     ### AliasHash is a hash: key=PEG value=aliases
48 :     ###
49 : overbeek 1.2 ### ReactionHash is a hash: key=Role value=[reaction-ids]
50 : overbeek 1.1
51 : overbeek 1.6 if ((ref($fig) eq "FIG") || ((ref($fig) eq 'SFXlate') && ($fig = $fig->{'fig'})))
52 : overbeek 1.1 {
53 : parrello 1.5 my $subsystem = new Subsystem($ssa,$fig,0);
54 :     my $curator = $subsystem->get_curator;
55 :     my $notes = $subsystem->get_notes;
56 :     $notes =~ s/ /\n/g;
57 :     my @roles = $subsystem->get_roles;
58 :     my $reactions = $subsystem->get_reactions;
59 :     my @genomes = $subsystem->get_genomes;
60 : overbeek 1.1 my @col_subsets = $subsystem->get_subset_namesC;
61 :    
62 : parrello 1.5 my $role_info = [];
63 :     my $roleH = {};
64 : overbeek 1.1
65 : parrello 1.5 my($i,$j,$subset,$peg);
66 :     for ($i=0; ($i < @roles); $i++)
67 :     {
68 :     my $role = $roles[$i];
69 :     my $abbrev = $subsystem->get_role_abbr( $subsystem->get_role_index( $role ) );
70 :     my $react = $reactions ? join(",", map { &HTML::reaction_link($_) } @{$reactions->{$role}}) : [];
71 :     push(@$role_info,[$role,$abbrev,$react]);
72 :     $roleH->{$role} = $i;
73 :     }
74 :    
75 :     my $subset_info = [];
76 :     foreach $subset (@col_subsets)
77 :     {
78 :     if ($subset ne 'All')
79 :     {
80 :     push(@$subset_info,[$subset,[map { $roleH->{$_} } $subsystem->get_subsetC_roles($subset)]]);
81 :     }
82 :     }
83 :    
84 :     my $genomes_info = [];
85 :     my $genomeH = {};
86 :     for ($i=0; ($i < @genomes); $i++)
87 :     {
88 :     my $genome = $genomes[$i];
89 :     my $variant = $subsystem->get_variant_code( $subsystem->get_genome_index( $genome ) );
90 :     push(@$genomes_info,[$genome,$variant]);
91 :     $genomeH->{$genome} = $i;
92 :     }
93 :    
94 :     my $pegH = {};
95 :     for ($i=0; ($i < @genomes); $i++)
96 :     {
97 :     my $genome = $genomes[$i];
98 :     for ($j=0; ($j < @roles); $j++)
99 :     {
100 :     my $role = $roles[$j];
101 :     my @pegs = $subsystem->get_pegs_from_cell($genome,$role);
102 :     $pegH->{$i}->{$j} = [@pegs];
103 :     }
104 :     }
105 : overbeek 1.7
106 :     my $row_subsets = &row_subsets($fig,$genomeH,$genomes_info);
107 :     my $active_genomes = &active_genomes($row_subsets,$active_subsetR,$focus,$genomeH,$genomes_info);
108 : overbeek 1.8
109 :     my $colorsH;
110 :     if ($peg_colors)
111 :     {
112 :     $colorsH = {};
113 :     foreach $_ (@$peg_colors)
114 :     {
115 :     my($peg,$color) = @$_;
116 :     $colorsH->{$peg} = $color;
117 :     }
118 :     }
119 :     elsif ($show_clusters)
120 :     {
121 :     $colorsH = &set_colors($fig,$pegH,$active_genomes);
122 :     }
123 :     else
124 :     {
125 :     $colorsH = {};
126 :     }
127 :    
128 : overbeek 1.7 my $aliasesH = $aliases ? &set_aliases($fig,$pegH,$active_genomes) : {};
129 : overbeek 1.6 my $reactions = $subsystem->get_reactions;
130 : parrello 1.5 my $self = { Roles => $role_info,
131 :     RoleIndex => $roleH,
132 :     RoleSubsets => $subset_info,
133 :     Genomes => $genomes_info,
134 :     GenomeIndex => $genomeH,
135 : overbeek 1.6 GenomeSubsets => $row_subsets,
136 : parrello 1.5 PegHash => $pegH,
137 :     Colors => $colorsH,
138 :     Aliases => $aliasesH,
139 :     Curator => $curator,
140 :     Notes => $notes,
141 :     Reactions => $reactions
142 :     };
143 :     bless($self, $class);
144 :     return $self;
145 : overbeek 1.1 }
146 :     else
147 :     {
148 : parrello 1.5 return undef;
149 : overbeek 1.1 }
150 :     }
151 :    
152 : overbeek 1.6 sub get_subset_namesR {
153 :     my($self) = @_;
154 :    
155 :     return map { $_->[0] } @{$self->{GenomeSubsets}};
156 :     }
157 :    
158 :     sub get_subsetR {
159 :     my($self,$set) = @_;
160 :     my($i);
161 :    
162 :     my $sets = $self->{GenomeSubsets};
163 :     for ($i=0; ($i < @$sets) && ($sets->[$i]->[0] ne $set); $i++) {}
164 :     if ($i < @$sets)
165 :     {
166 :     return map { $self->{Genomes}->[$_]->[0] } @{$sets->[$i]->[1]}
167 :     }
168 :     return undef;
169 :     }
170 :    
171 :     sub get_subsetsR {
172 :     my($self) = @_;
173 :    
174 :     my $sets = $self->{GenomeSubsets};
175 :     my @pairs = ();
176 :     my $pair;
177 :     foreach $pair (@$sets)
178 :     {
179 :     my($id,$members) = @$pair;
180 :     push(@pairs,[$id,[map { $self->{Genomes}->[$_]->[0] } @$members]]);
181 :     }
182 :     return @pairs;
183 :     }
184 :    
185 :     sub row_subsets {
186 :     my ($fig,$genomeH,$genomes_info) = @_;
187 :    
188 :     my $subsets = [];
189 :     my $taxonomic_groups = $fig->taxonomic_groups_of_complete(10);
190 :    
191 :     my($pair,$id,$members);
192 :     foreach $pair (@$taxonomic_groups)
193 :     {
194 :     ($id,$members) = @$pair;
195 :     my @mem = grep { defined($_) } map { $genomeH->{$_} } @$members;
196 :     if (@mem > 10)
197 :     {
198 :     push(@$subsets,[$id,[@mem]]);
199 :     }
200 :     }
201 :     return $subsets;
202 :     }
203 :    
204 : overbeek 1.4 sub set_aliases {
205 : overbeek 1.7 my($fig,$pegH,$active_genomes) = @_;
206 : overbeek 1.4 my($genomeI,$roleI,$pegs,$peg,$roleH);
207 :    
208 :     my $aliasesH = {};
209 :    
210 : overbeek 1.7 foreach $genomeI (grep { $active_genomes->{$_} } keys(%$pegH))
211 : overbeek 1.4 {
212 : parrello 1.5 $roleH = $pegH->{$genomeI};
213 :     foreach $roleI (keys(%$roleH))
214 :     {
215 :     $pegs = $roleH->{$roleI};
216 :     foreach $peg (@$pegs)
217 :     {
218 :     if (! $aliasesH->{$peg})
219 :     {
220 :     $aliasesH->{$peg} = scalar &ext_id($fig,$peg);
221 :     }
222 :     }
223 :     }
224 : overbeek 1.4 }
225 :     return $aliasesH;
226 :     }
227 :    
228 :     sub set_colors {
229 : overbeek 1.7 my($fig,$pegH,$active_genomes) = @_;
230 : overbeek 1.4 my($genomeI,$roleI,$pegs,$peg,$roleH,$peg,%pegs_in_genome);
231 :    
232 :     my $colorsH = {};
233 :    
234 : overbeek 1.7 foreach $genomeI (grep { $active_genomes->{$_} } keys(%$pegH))
235 : overbeek 1.4 {
236 : parrello 1.5 undef %pegs_in_genome;
237 :     $roleH = $pegH->{$genomeI};
238 :     foreach $roleI (keys(%$roleH))
239 :     {
240 :     $pegs = $roleH->{$roleI};
241 :     foreach $peg (@$pegs)
242 :     {
243 :     $pegs_in_genome{$peg} = 1;
244 :     }
245 :     }
246 :    
247 :     my @pegs = keys(%pegs_in_genome);
248 :     my($tuple,$peg,$color);
249 :     my $colors_for_one_genome = &set_colors_for_genome($fig,\@pegs);
250 :    
251 :     while (($peg,$color) = each %$colors_for_one_genome)
252 :     {
253 :     $colorsH->{$peg} = $colors_for_one_genome->{$peg};
254 :     }
255 : overbeek 1.4 }
256 :     return $colorsH;
257 :     }
258 :    
259 :     sub set_colors_for_genome {
260 :     my($fig,$pegs) = @_;
261 :     my($peg,@clusters,$cluster,@colors,$color,%seen,%conn,$x,$peg1,@pegs,$i);
262 :    
263 :     my $color_of = {};
264 :     foreach $peg (@$pegs) { $color_of->{$peg} = '#FFFFFF' }
265 :    
266 :     @pegs = keys(%$color_of); # Use of keys makes @pegs entries unique
267 :    
268 :     foreach $peg (@pegs)
269 :     {
270 : parrello 1.5 $conn{$peg} = [grep { $color_of->{$_} && ($_ ne $peg) } $fig->close_genes($peg,5000)];
271 : overbeek 1.4 }
272 :    
273 :     @clusters = ();
274 :     while ($peg = shift @pegs)
275 :     {
276 : parrello 1.5 if (! $seen{$peg})
277 :     {
278 :     $cluster = [$peg];
279 :     $seen{$peg} = 1;
280 :     for ($i=0; ($i < @$cluster); $i++)
281 :     {
282 :     my @tmp = grep { ! $seen{$_} } @{$conn{$cluster->[$i]}};
283 :     if (@tmp > 0)
284 :     {
285 :     foreach my $peg1 (@tmp) { $seen{$peg1} = 1 }
286 :     push(@$cluster,@tmp);
287 :     }
288 :     }
289 :     push(@clusters,$cluster);
290 :     }
291 : overbeek 1.4 }
292 :    
293 :     @colors = &cool_colors();
294 :    
295 :     @clusters = grep { @$_ > 1 } sort { @$a <=> @$b } @clusters;
296 :    
297 :     if (@clusters > @colors) { splice(@clusters,0,(@clusters - @colors)) } # make sure we have enough colors
298 :    
299 :     my($cluster);
300 :     foreach $cluster (@clusters)
301 :     {
302 : parrello 1.5 $color = shift @colors;
303 :     foreach $peg (@$cluster)
304 :     {
305 :     $color_of->{$peg} = $color;
306 :     }
307 : overbeek 1.4 }
308 :     return $color_of;
309 :     }
310 :    
311 :     sub cool_colors {
312 :     # just an array of "websafe" colors or whatever colors we want to use. Feel free to remove bad colors (hence the lines not being equal length!)
313 :     return (
314 :     '#C0C0C0', '#FF40C0', '#FF8040', '#FF0080', '#FFC040', '#40C0FF', '#40FFC0', '#C08080', '#C0FF00', '#00FF80', '#00C040',
315 :     "#6B8E23", "#483D8B", "#2E8B57", "#008000", "#006400", "#800000", "#00FF00", "#7FFFD4",
316 :     "#87CEEB", "#A9A9A9", "#90EE90", "#D2B48C", "#8DBC8F", "#D2691E", "#87CEFA", "#E9967A", "#FFE4C4", "#FFB6C1",
317 :     "#E0FFFF", "#FFA07A", "#DB7093", "#9370DB", "#008B8B", "#FFDEAD", "#DA70D6", "#DCDCDC", "#FF00FF", "#6A5ACD",
318 :     "#00FA9A", "#228B22", "#1E90FF", "#FA8072", "#CD853F", "#DC143C", "#FF6347", "#98FB98", "#4682B4",
319 :     "#D3D3D3", "#7B68EE", "#2F4F4F", "#FF7F50", "#FF69B4", "#BC8F8F", "#A0522D", "#DEB887", "#00DED1",
320 :     "#6495ED", "#800080", "#FFD700", "#F5DEB3", "#66CDAA", "#FF4500", "#4B0082", "#CD5C5C",
321 :     "#EE82EE", "#7CFC00", "#FFFF00", "#191970", "#FFFFE0", "#DDA0DD", "#00BFFF", "#DAA520", "#008080",
322 :     "#00FF7F", "#9400D3", "#BA55D3", "#D8BFD8", "#8B4513", "#3CB371", "#00008B", "#5F9EA0",
323 :     "#4169E1", "#20B2AA", "#8A2BE2", "#ADFF2F", "#556B2F",
324 :     "#F0FFFF", "#B0E0E6", "#FF1493", "#B8860B", "#FF0000", "#F08080", "#7FFF00", "#8B0000",
325 :     "#40E0D0", "#0000CD", "#48D1CC", "#8B008B", "#696969", "#AFEEEE", "#FF8C00", "#EEE8AA", "#A52A2A",
326 :     "#FFE4B5", "#B0C4DE", "#FAF0E6", "#9ACD32", "#B22222", "#FAFAD2", "#808080", "#0000FF",
327 :     "#000080", "#32CD32", "#FFFACD", "#9932CC", "#FFA500", "#F0E68C", "#E6E6FA", "#F4A460", "#C71585",
328 :     "#BDB76B", "#00FFFF", "#FFDAB9", "#ADD8E6", "#778899",
329 :     );
330 :     }
331 :    
332 :     sub ext_id {
333 :     my($fig,$peg) = @_;
334 :    
335 :     my @tmp;
336 :     my @aliases = $fig->feature_aliases($peg);
337 :     if ((@tmp = grep { $_ =~ /^uni\|/ } @aliases) > 0)
338 :     {
339 : parrello 1.5 @aliases = @tmp;
340 : overbeek 1.4 }
341 :     elsif ((@tmp = grep { $_ =~ /^sp\|/ } @aliases) > 0)
342 :     {
343 : parrello 1.5 @aliases = @tmp;
344 : overbeek 1.4 }
345 :     elsif ((@tmp = grep { $_ =~ /^gi\|/ } @aliases) > 0)
346 :     {
347 : parrello 1.5 @aliases = @tmp;
348 : overbeek 1.4 }
349 :     elsif ((@tmp = grep { $_ =~ /^kegg\|/ } @aliases) > 0)
350 :     {
351 : parrello 1.5 @aliases = @tmp;
352 : overbeek 1.4 }
353 :     else
354 :     {
355 : parrello 1.5 @aliases = ();
356 : overbeek 1.4 }
357 :    
358 :     if (wantarray())
359 :     {
360 : parrello 1.5 return @aliases;
361 : overbeek 1.4 }
362 :     else
363 :     {
364 : parrello 1.5 return $aliases[0];
365 : overbeek 1.4 }
366 :     }
367 :    
368 :    
369 : overbeek 1.2 sub subsystem_curator {
370 :     my($self) = @_;
371 :    
372 :     my $curator = $self->{Curator};
373 :     $curator =~ s/master://;
374 :     return $curator;
375 :     }
376 :    
377 :     sub get_roles {
378 :     my($self) = @_;
379 :    
380 :     return map { $_->[0] } @{$self->{Roles}};
381 :     }
382 :    
383 : overbeek 1.3 sub get_genome_index {
384 :     my($self,$genome) = @_;
385 :    
386 :     return $self->{GenomeIndex}->{$genome};
387 :     }
388 :    
389 :     sub get_genomes {
390 :     my($self) = @_;
391 :    
392 :     return map { $_->[0] } @{$self->{Genomes}};
393 :     }
394 :    
395 :     sub get_variant_code {
396 :     my($self,$genome) = @_;
397 :    
398 :     if ($genome =~ /^\d+$/)
399 :     {
400 : parrello 1.5 return $self->{Genomes}->[$genome]->[1];
401 : overbeek 1.3 }
402 :     else
403 :     {
404 : parrello 1.5 my $genomeI = $self->{GenomeIndex}->{$genome};
405 :     return $self->{Genomes}->[$genomeI]->[1];
406 : overbeek 1.3 }
407 :     }
408 :    
409 :     sub get_pegs_from_cell {
410 :     my($self,$genome,$role) = @_;
411 :    
412 :     my $genomeI = $self->{GenomeIndex}->{$genome};
413 :     my $roleI = $self->{RoleIndex}->{$role};
414 :    
415 :     my $pegs = $self->{PegHash}->{$genomeI}->{$roleI};
416 :     return $pegs ? @$pegs : ();
417 :     }
418 :    
419 :     sub get_notes {
420 :     my($self) = @_;
421 :    
422 :     return $self->{Notes};
423 :     }
424 :    
425 : overbeek 1.2 sub get_role_index {
426 :     my($self,$role) = @_;
427 :    
428 :     return $self->{RoleIndex}->{$role};
429 :     }
430 :    
431 :     sub get_role_abbr {
432 :     my($self,$roleI) = @_;
433 :    
434 :     if ($roleI !~ /^\d+$/)
435 :     {
436 : parrello 1.5 $roleI = $self->{RoleIndex}->{$roleI};
437 : overbeek 1.2 }
438 :     my $roles = $self->{Roles};
439 :     return $roles->[$roleI]->[1];
440 :     }
441 :    
442 :     sub get_reactions {
443 :     my($self) = @_;
444 :    
445 :     return $self->{Reactions};
446 :     }
447 :    
448 :     sub get_subset_namesC {
449 :     my($self) = @_;
450 :    
451 :     return map { $_->[0] } @{$self->{RoleSubsets}};
452 :     }
453 :    
454 :     sub get_subsetC_roles {
455 :     my($self,$subset) = @_;
456 :     my($i,$j);
457 :    
458 :     my $subset_info = $self->{RoleSubsets};
459 :     for ($i=0; ($i < @$subset_info) && ($subset_info->[$i]->[0] ne $subset); $i++) {}
460 :     if ($i < @$subset_info)
461 :     {
462 : parrello 1.5 my @roles = ();
463 :     foreach $j (@{$subset_info->[$i]->[1]})
464 :     {
465 :     push(@roles,$self->{Roles}->[$j]->[0]);
466 :     }
467 :     return @roles;
468 : overbeek 1.2 }
469 :     return undef;
470 :     }
471 :    
472 : overbeek 1.4 sub get_color_of {
473 :     my($self,$peg) = @_;
474 :    
475 :     return $self->{Colors}->{$peg};
476 :     }
477 :    
478 : overbeek 1.7 sub active_genomes {
479 :     my($row_subsets,$active_subsetR,$focus,$genomeH,$genomes_info) = @_;
480 :     my($i,@bestL);
481 :    
482 :     my $active_genomes = {};
483 :     if ($active_subsetR)
484 :     {
485 :     for ($i=0; ($i < @$row_subsets) && ($row_subsets->[$i]->[0] ne $active_subsetR); $i++) {}
486 :     if ($i < @$row_subsets)
487 :     {
488 :     @bestL = @{$row_subsets->[$i]->[1]};
489 :     }
490 :     else
491 :     {
492 :     $active_subsetR = 'All';
493 :     @bestL = keys(%$genomeH);
494 :     }
495 :     }
496 :     else
497 :     {
498 :     if (! $focus)
499 :     {
500 :     $active_subsetR = 'All';
501 :     @bestL = keys(%$genomeH);
502 :     }
503 :     else
504 :     {
505 :     my $bestN = undef;
506 :     @bestL = ();
507 :    
508 :     my $tuple;
509 :     foreach $tuple (@$row_subsets)
510 :     {
511 :     my($id,$genomeIs) = @$tuple;
512 :     for ($i=0; ($i < @$genomeIs) && ($genomes_info->[$genomeIs->[$i]]->[0] ne $focus); $i++) {}
513 :     if ($i < @$genomeIs)
514 :     {
515 :     if ((! $bestN) || (@$genomeIs < @bestL))
516 :     {
517 :     $bestN = $id;
518 :     @bestL = @$genomeIs;
519 :     }
520 :     }
521 :     }
522 :     $active_subsetR = $bestN;
523 :     }
524 :     }
525 :    
526 :     my %active_genomes = map { $_ => 1 } @bestL;
527 :     return \%active_genomes;
528 :     }
529 :    
530 : overbeek 1.1 1;
531 :    
532 :    

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3