[Bio] / FigKernelPackages / UnvSubsys.pm Repository:
ViewVC logotype

Annotation of /FigKernelPackages/UnvSubsys.pm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.6 - (view) (download) (as text)

1 : overbeek 1.1 package UnvSubsys;
2 :    
3 : overbeek 1.2 use Subsystem;
4 : overbeek 1.1 use Carp;
5 :     use FIG;
6 :    
7 :     use Data::Dumper;
8 :     use strict;
9 :    
10 :     sub new
11 :     {
12 : overbeek 1.4 my($class, $ssa, $fig, $show_clusters, $aliases) = @_;
13 : overbeek 1.1
14 :     $ssa =~ s/ /_/g;
15 :    
16 :    
17 : parrello 1.5 ### { Roles =>Roles,
18 : overbeek 1.2 ### RoleIndex => ToRoleIndexHash,
19 :     ### RoleSubsets => ColSubsets,
20 :     ### Genomes => Genomes,
21 :     ### GenomeIndex => ToGenomeIndexHash,
22 :     ### PegHash => PegHash,
23 :     ### Colors => ColorHash,
24 :     ### Aliases => AliasHash,
25 :     ### Curator => Curator,
26 :     ### Notes => Notes,
27 :     ### Reactions => ReactionHash
28 :     ### }
29 : parrello 1.5 ###
30 :     ### Roles = pointer to a list of [Role,Abbrev,[ReactionURLs]]
31 :     ###
32 :     ### ToRoleIndexHash = a pointer to a hash: key=Role Value=RoleIndex
33 :     ###
34 :     ### ColSubsets = pointer to a list of [SubsetName,[RoleIndexesFrom0]]
35 :     ###
36 : overbeek 1.6 ### RowSubSets = pointer to a list of [SubsetName,[GenomeIndexesFrom0]]
37 :     ###
38 : parrello 1.5 ### Genomes is a pointer to a list of [Genome,Variant]
39 :     ###
40 :     ### ToGenomeIndexHash = a pointer to a hash: key=Genome value=GenomeIndex
41 :     ###
42 :     ### PegHash = a pointer to a hash of hashes such that $peg_hash->{$genome_index}->{$role_index} = a
43 :     ### pointer to a list of PEGs
44 :     ###
45 :     ### ColorHash is a hash: key=PEG value=color
46 :     ###
47 :     ### AliasHash is a hash: key=PEG value=aliases
48 :     ###
49 : overbeek 1.2 ### ReactionHash is a hash: key=Role value=[reaction-ids]
50 : overbeek 1.1
51 : overbeek 1.6 if ((ref($fig) eq "FIG") || ((ref($fig) eq 'SFXlate') && ($fig = $fig->{'fig'})))
52 : overbeek 1.1 {
53 : parrello 1.5 my $subsystem = new Subsystem($ssa,$fig,0);
54 :     my $curator = $subsystem->get_curator;
55 :     my $notes = $subsystem->get_notes;
56 :     $notes =~ s/ /\n/g;
57 :     my @roles = $subsystem->get_roles;
58 :     my $reactions = $subsystem->get_reactions;
59 :     my @genomes = $subsystem->get_genomes;
60 : overbeek 1.1 my @col_subsets = $subsystem->get_subset_namesC;
61 :    
62 : parrello 1.5 my $role_info = [];
63 :     my $roleH = {};
64 : overbeek 1.1
65 : parrello 1.5 my($i,$j,$subset,$peg);
66 :     for ($i=0; ($i < @roles); $i++)
67 :     {
68 :     my $role = $roles[$i];
69 :     my $abbrev = $subsystem->get_role_abbr( $subsystem->get_role_index( $role ) );
70 :     my $react = $reactions ? join(",", map { &HTML::reaction_link($_) } @{$reactions->{$role}}) : [];
71 :     push(@$role_info,[$role,$abbrev,$react]);
72 :     $roleH->{$role} = $i;
73 :     }
74 :    
75 :     my $subset_info = [];
76 :     foreach $subset (@col_subsets)
77 :     {
78 :     if ($subset ne 'All')
79 :     {
80 :     push(@$subset_info,[$subset,[map { $roleH->{$_} } $subsystem->get_subsetC_roles($subset)]]);
81 :     }
82 :     }
83 :    
84 :     my $genomes_info = [];
85 :     my $genomeH = {};
86 :     for ($i=0; ($i < @genomes); $i++)
87 :     {
88 :     my $genome = $genomes[$i];
89 :     my $variant = $subsystem->get_variant_code( $subsystem->get_genome_index( $genome ) );
90 :     push(@$genomes_info,[$genome,$variant]);
91 :     $genomeH->{$genome} = $i;
92 :     }
93 :    
94 :     my $pegH = {};
95 :     for ($i=0; ($i < @genomes); $i++)
96 :     {
97 :     my $genome = $genomes[$i];
98 :     for ($j=0; ($j < @roles); $j++)
99 :     {
100 :     my $role = $roles[$j];
101 :     my @pegs = $subsystem->get_pegs_from_cell($genome,$role);
102 :     $pegH->{$i}->{$j} = [@pegs];
103 :     }
104 :     }
105 :     my $colorsH = $show_clusters ? &set_colors($fig,$pegH) : {};
106 :     my $aliasesH = $aliases ? &set_aliases($fig,$pegH) : {};
107 : overbeek 1.6 my $reactions = $subsystem->get_reactions;
108 :     my $row_subsets = &row_subsets($fig,$genomeH,$genomes_info);
109 : parrello 1.5 my $self = { Roles => $role_info,
110 :     RoleIndex => $roleH,
111 :     RoleSubsets => $subset_info,
112 :     Genomes => $genomes_info,
113 :     GenomeIndex => $genomeH,
114 : overbeek 1.6 GenomeSubsets => $row_subsets,
115 : parrello 1.5 PegHash => $pegH,
116 :     Colors => $colorsH,
117 :     Aliases => $aliasesH,
118 :     Curator => $curator,
119 :     Notes => $notes,
120 :     Reactions => $reactions
121 :     };
122 :     bless($self, $class);
123 :     return $self;
124 : overbeek 1.1 }
125 :     else
126 :     {
127 : parrello 1.5 return undef;
128 : overbeek 1.1 }
129 :     }
130 :    
131 : overbeek 1.6 sub get_subset_namesR {
132 :     my($self) = @_;
133 :    
134 :     return map { $_->[0] } @{$self->{GenomeSubsets}};
135 :     }
136 :    
137 :     sub get_subsetR {
138 :     my($self,$set) = @_;
139 :     my($i);
140 :    
141 :     my $sets = $self->{GenomeSubsets};
142 :     for ($i=0; ($i < @$sets) && ($sets->[$i]->[0] ne $set); $i++) {}
143 :     if ($i < @$sets)
144 :     {
145 :     return map { $self->{Genomes}->[$_]->[0] } @{$sets->[$i]->[1]}
146 :     }
147 :     return undef;
148 :     }
149 :    
150 :     sub get_subsetsR {
151 :     my($self) = @_;
152 :    
153 :     my $sets = $self->{GenomeSubsets};
154 :     my @pairs = ();
155 :     my $pair;
156 :     foreach $pair (@$sets)
157 :     {
158 :     my($id,$members) = @$pair;
159 :     push(@pairs,[$id,[map { $self->{Genomes}->[$_]->[0] } @$members]]);
160 :     }
161 :     return @pairs;
162 :     }
163 :    
164 :     sub row_subsets {
165 :     my ($fig,$genomeH,$genomes_info) = @_;
166 :    
167 :     my $subsets = [];
168 :     my $taxonomic_groups = $fig->taxonomic_groups_of_complete(10);
169 :    
170 :     my($pair,$id,$members);
171 :     foreach $pair (@$taxonomic_groups)
172 :     {
173 :     ($id,$members) = @$pair;
174 :     my @mem = grep { defined($_) } map { $genomeH->{$_} } @$members;
175 :     if (@mem > 10)
176 :     {
177 :     push(@$subsets,[$id,[@mem]]);
178 :     }
179 :     }
180 :     return $subsets;
181 :     }
182 :    
183 : overbeek 1.4 sub set_aliases {
184 :     my($fig,$pegH) = @_;
185 :     my($genomeI,$roleI,$pegs,$peg,$roleH);
186 :    
187 :     my $aliasesH = {};
188 :    
189 :     foreach $genomeI (keys(%$pegH))
190 :     {
191 : parrello 1.5 $roleH = $pegH->{$genomeI};
192 :     foreach $roleI (keys(%$roleH))
193 :     {
194 :     $pegs = $roleH->{$roleI};
195 :     foreach $peg (@$pegs)
196 :     {
197 :     if (! $aliasesH->{$peg})
198 :     {
199 :     $aliasesH->{$peg} = scalar &ext_id($fig,$peg);
200 :     }
201 :     }
202 :     }
203 : overbeek 1.4 }
204 :     return $aliasesH;
205 :     }
206 :    
207 :     sub set_colors {
208 :     my($fig,$pegH) = @_;
209 :     my($genomeI,$roleI,$pegs,$peg,$roleH,$peg,%pegs_in_genome);
210 :    
211 :     my $colorsH = {};
212 :    
213 :     foreach $genomeI (keys(%$pegH))
214 :     {
215 : parrello 1.5 undef %pegs_in_genome;
216 :     $roleH = $pegH->{$genomeI};
217 :     foreach $roleI (keys(%$roleH))
218 :     {
219 :     $pegs = $roleH->{$roleI};
220 :     foreach $peg (@$pegs)
221 :     {
222 :     $pegs_in_genome{$peg} = 1;
223 :     }
224 :     }
225 :    
226 :     my @pegs = keys(%pegs_in_genome);
227 :     my($tuple,$peg,$color);
228 :     my $colors_for_one_genome = &set_colors_for_genome($fig,\@pegs);
229 :    
230 :     while (($peg,$color) = each %$colors_for_one_genome)
231 :     {
232 :     $colorsH->{$peg} = $colors_for_one_genome->{$peg};
233 :     }
234 : overbeek 1.4 }
235 :     return $colorsH;
236 :     }
237 :    
238 :     sub set_colors_for_genome {
239 :     my($fig,$pegs) = @_;
240 :     my($peg,@clusters,$cluster,@colors,$color,%seen,%conn,$x,$peg1,@pegs,$i);
241 :    
242 :     my $color_of = {};
243 :     foreach $peg (@$pegs) { $color_of->{$peg} = '#FFFFFF' }
244 :    
245 :     @pegs = keys(%$color_of); # Use of keys makes @pegs entries unique
246 :    
247 :     foreach $peg (@pegs)
248 :     {
249 : parrello 1.5 $conn{$peg} = [grep { $color_of->{$_} && ($_ ne $peg) } $fig->close_genes($peg,5000)];
250 : overbeek 1.4 }
251 :    
252 :     @clusters = ();
253 :     while ($peg = shift @pegs)
254 :     {
255 : parrello 1.5 if (! $seen{$peg})
256 :     {
257 :     $cluster = [$peg];
258 :     $seen{$peg} = 1;
259 :     for ($i=0; ($i < @$cluster); $i++)
260 :     {
261 :     my @tmp = grep { ! $seen{$_} } @{$conn{$cluster->[$i]}};
262 :     if (@tmp > 0)
263 :     {
264 :     foreach my $peg1 (@tmp) { $seen{$peg1} = 1 }
265 :     push(@$cluster,@tmp);
266 :     }
267 :     }
268 :     push(@clusters,$cluster);
269 :     }
270 : overbeek 1.4 }
271 :    
272 :     @colors = &cool_colors();
273 :    
274 :     @clusters = grep { @$_ > 1 } sort { @$a <=> @$b } @clusters;
275 :    
276 :     if (@clusters > @colors) { splice(@clusters,0,(@clusters - @colors)) } # make sure we have enough colors
277 :    
278 :     my($cluster);
279 :     foreach $cluster (@clusters)
280 :     {
281 : parrello 1.5 $color = shift @colors;
282 :     foreach $peg (@$cluster)
283 :     {
284 :     $color_of->{$peg} = $color;
285 :     }
286 : overbeek 1.4 }
287 :     return $color_of;
288 :     }
289 :    
290 :     sub cool_colors {
291 :     # just an array of "websafe" colors or whatever colors we want to use. Feel free to remove bad colors (hence the lines not being equal length!)
292 :     return (
293 :     '#C0C0C0', '#FF40C0', '#FF8040', '#FF0080', '#FFC040', '#40C0FF', '#40FFC0', '#C08080', '#C0FF00', '#00FF80', '#00C040',
294 :     "#6B8E23", "#483D8B", "#2E8B57", "#008000", "#006400", "#800000", "#00FF00", "#7FFFD4",
295 :     "#87CEEB", "#A9A9A9", "#90EE90", "#D2B48C", "#8DBC8F", "#D2691E", "#87CEFA", "#E9967A", "#FFE4C4", "#FFB6C1",
296 :     "#E0FFFF", "#FFA07A", "#DB7093", "#9370DB", "#008B8B", "#FFDEAD", "#DA70D6", "#DCDCDC", "#FF00FF", "#6A5ACD",
297 :     "#00FA9A", "#228B22", "#1E90FF", "#FA8072", "#CD853F", "#DC143C", "#FF6347", "#98FB98", "#4682B4",
298 :     "#D3D3D3", "#7B68EE", "#2F4F4F", "#FF7F50", "#FF69B4", "#BC8F8F", "#A0522D", "#DEB887", "#00DED1",
299 :     "#6495ED", "#800080", "#FFD700", "#F5DEB3", "#66CDAA", "#FF4500", "#4B0082", "#CD5C5C",
300 :     "#EE82EE", "#7CFC00", "#FFFF00", "#191970", "#FFFFE0", "#DDA0DD", "#00BFFF", "#DAA520", "#008080",
301 :     "#00FF7F", "#9400D3", "#BA55D3", "#D8BFD8", "#8B4513", "#3CB371", "#00008B", "#5F9EA0",
302 :     "#4169E1", "#20B2AA", "#8A2BE2", "#ADFF2F", "#556B2F",
303 :     "#F0FFFF", "#B0E0E6", "#FF1493", "#B8860B", "#FF0000", "#F08080", "#7FFF00", "#8B0000",
304 :     "#40E0D0", "#0000CD", "#48D1CC", "#8B008B", "#696969", "#AFEEEE", "#FF8C00", "#EEE8AA", "#A52A2A",
305 :     "#FFE4B5", "#B0C4DE", "#FAF0E6", "#9ACD32", "#B22222", "#FAFAD2", "#808080", "#0000FF",
306 :     "#000080", "#32CD32", "#FFFACD", "#9932CC", "#FFA500", "#F0E68C", "#E6E6FA", "#F4A460", "#C71585",
307 :     "#BDB76B", "#00FFFF", "#FFDAB9", "#ADD8E6", "#778899",
308 :     );
309 :     }
310 :    
311 :     sub ext_id {
312 :     my($fig,$peg) = @_;
313 :    
314 :     my @tmp;
315 :     my @aliases = $fig->feature_aliases($peg);
316 :     if ((@tmp = grep { $_ =~ /^uni\|/ } @aliases) > 0)
317 :     {
318 : parrello 1.5 @aliases = @tmp;
319 : overbeek 1.4 }
320 :     elsif ((@tmp = grep { $_ =~ /^sp\|/ } @aliases) > 0)
321 :     {
322 : parrello 1.5 @aliases = @tmp;
323 : overbeek 1.4 }
324 :     elsif ((@tmp = grep { $_ =~ /^gi\|/ } @aliases) > 0)
325 :     {
326 : parrello 1.5 @aliases = @tmp;
327 : overbeek 1.4 }
328 :     elsif ((@tmp = grep { $_ =~ /^kegg\|/ } @aliases) > 0)
329 :     {
330 : parrello 1.5 @aliases = @tmp;
331 : overbeek 1.4 }
332 :     else
333 :     {
334 : parrello 1.5 @aliases = ();
335 : overbeek 1.4 }
336 :    
337 :     if (wantarray())
338 :     {
339 : parrello 1.5 return @aliases;
340 : overbeek 1.4 }
341 :     else
342 :     {
343 : parrello 1.5 return $aliases[0];
344 : overbeek 1.4 }
345 :     }
346 :    
347 :    
348 : overbeek 1.2 sub subsystem_curator {
349 :     my($self) = @_;
350 :    
351 :     my $curator = $self->{Curator};
352 :     $curator =~ s/master://;
353 :     return $curator;
354 :     }
355 :    
356 :     sub get_roles {
357 :     my($self) = @_;
358 :    
359 :     return map { $_->[0] } @{$self->{Roles}};
360 :     }
361 :    
362 : overbeek 1.3 sub get_genome_index {
363 :     my($self,$genome) = @_;
364 :    
365 :     return $self->{GenomeIndex}->{$genome};
366 :     }
367 :    
368 :     sub get_genomes {
369 :     my($self) = @_;
370 :    
371 :     return map { $_->[0] } @{$self->{Genomes}};
372 :     }
373 :    
374 :     sub get_variant_code {
375 :     my($self,$genome) = @_;
376 :    
377 :     if ($genome =~ /^\d+$/)
378 :     {
379 : parrello 1.5 return $self->{Genomes}->[$genome]->[1];
380 : overbeek 1.3 }
381 :     else
382 :     {
383 : parrello 1.5 my $genomeI = $self->{GenomeIndex}->{$genome};
384 :     return $self->{Genomes}->[$genomeI]->[1];
385 : overbeek 1.3 }
386 :     }
387 :    
388 :     sub get_pegs_from_cell {
389 :     my($self,$genome,$role) = @_;
390 :    
391 :     my $genomeI = $self->{GenomeIndex}->{$genome};
392 :     my $roleI = $self->{RoleIndex}->{$role};
393 :    
394 :     my $pegs = $self->{PegHash}->{$genomeI}->{$roleI};
395 :     return $pegs ? @$pegs : ();
396 :     }
397 :    
398 :     sub get_notes {
399 :     my($self) = @_;
400 :    
401 :     return $self->{Notes};
402 :     }
403 :    
404 : overbeek 1.2 sub get_role_index {
405 :     my($self,$role) = @_;
406 :    
407 :     return $self->{RoleIndex}->{$role};
408 :     }
409 :    
410 :     sub get_role_abbr {
411 :     my($self,$roleI) = @_;
412 :    
413 :     if ($roleI !~ /^\d+$/)
414 :     {
415 : parrello 1.5 $roleI = $self->{RoleIndex}->{$roleI};
416 : overbeek 1.2 }
417 :     my $roles = $self->{Roles};
418 :     return $roles->[$roleI]->[1];
419 :     }
420 :    
421 :     sub get_reactions {
422 :     my($self) = @_;
423 :    
424 :     return $self->{Reactions};
425 :     }
426 :    
427 :     sub get_subset_namesC {
428 :     my($self) = @_;
429 :    
430 :     return map { $_->[0] } @{$self->{RoleSubsets}};
431 :     }
432 :    
433 :     sub get_subsetC_roles {
434 :     my($self,$subset) = @_;
435 :     my($i,$j);
436 :    
437 :     my $subset_info = $self->{RoleSubsets};
438 :     for ($i=0; ($i < @$subset_info) && ($subset_info->[$i]->[0] ne $subset); $i++) {}
439 :     if ($i < @$subset_info)
440 :     {
441 : parrello 1.5 my @roles = ();
442 :     foreach $j (@{$subset_info->[$i]->[1]})
443 :     {
444 :     push(@roles,$self->{Roles}->[$j]->[0]);
445 :     }
446 :     return @roles;
447 : overbeek 1.2 }
448 :     return undef;
449 :     }
450 :    
451 : overbeek 1.4 sub get_color_of {
452 :     my($self,$peg) = @_;
453 :    
454 :     return $self->{Colors}->{$peg};
455 :     }
456 :    
457 : overbeek 1.1 1;
458 :    
459 :    

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3