[Bio] / FigWebServices / homologs_in_clusters.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/homologs_in_clusters.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.12 - (view) (download)

1 : olson 1.9 #
2 :     # Copyright (c) 2003-2006 University of Chicago and Fellowship
3 :     # for Interpretations of Genomes. All Rights Reserved.
4 :     #
5 :     # This file is part of the SEED Toolkit.
6 : parrello 1.10 #
7 : olson 1.9 # The SEED Toolkit is free software. You can redistribute
8 :     # it and/or modify it under the terms of the SEED Toolkit
9 : parrello 1.10 # Public License.
10 : olson 1.9 #
11 :     # You should have received a copy of the SEED Toolkit Public License
12 :     # along with this program; if not write to the University of Chicago
13 :     # at info@ci.uchicago.edu or the Fellowship for Interpretation of
14 :     # Genomes at veronika@thefig.info or download a copy from
15 :     # http://www.theseed.org/LICENSE.TXT.
16 :     #
17 :    
18 : overbeek 1.1 #### start #####
19 : overbeek 1.4 use InterfaceRoutines;
20 :    
21 : overbeek 1.1
22 :     use HTML;
23 :     use strict;
24 :     use CGI;
25 :     my $cgi = new CGI;
26 :    
27 : overbeek 1.4 use FIG;
28 :     my $sproutAvail = eval {
29 :     require SproutFIG;
30 :     require PageBuilder;
31 :     };
32 :    
33 :     my($fig_or_sprout);
34 :     my $is_sprout;
35 :     my $html = [];
36 :    
37 :     if ($cgi->param('SPROUT')) {
38 :     $is_sprout = 1;
39 :     $fig_or_sprout = new SproutFIG($FIG_Config::sproutDB, $FIG_Config::sproutData);
40 :     unshift @$html, "<TITLE>The NMPDR Homologs in Clusters Page</TITLE>\n";
41 :     } else {
42 :     $is_sprout = 0;
43 :     $fig_or_sprout = new FIG;
44 :     unshift @$html, "<TITLE>The SEED Homologs in Clusters Page</TITLE>\n";
45 :     }
46 :    
47 : overbeek 1.1 if (0)
48 :     {
49 :     my $VAR1;
50 :     eval(join("",`cat /tmp/homologs_in_clusters_parms`));
51 :     $cgi = $VAR1;
52 :     # print STDERR &Dumper($cgi);
53 :     }
54 :    
55 :     if (0)
56 :     {
57 :     print $cgi->header;
58 :     my @params = $cgi->param;
59 :     print "<pre>\n";
60 :     foreach $_ (@params)
61 :     {
62 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
63 :     }
64 :    
65 :     if (0)
66 :     {
67 :     if (open(TMP,">/tmp/homologs_in_clusters_parms"))
68 :     {
69 :     print TMP &Dumper($cgi);
70 :     close(TMP);
71 :     }
72 :     }
73 :     exit;
74 :     }
75 :    
76 :     my $prot = $cgi->param('prot');
77 :     if (! $prot)
78 :     {
79 :     push(@$html,"<h1>Sorry, you need to specify a protein</h1>\n");
80 :     &HTML::show_page($cgi,$html);
81 :     exit;
82 :     }
83 :    
84 :    
85 :     if ($prot !~ /^fig\|/)
86 :     {
87 : overbeek 1.4 my @poss = $fig_or_sprout->by_alias($prot);
88 : overbeek 1.1 if (@poss > 0)
89 :     {
90 :     $prot = $poss[0];
91 :     }
92 :     else
93 :     {
94 :     push(@$html,"<h1>Sorry, $prot appears not to have a FIG id at this point</h1>\n");
95 :     &HTML::show_page($cgi,$html);
96 :     exit;
97 :     }
98 :     }
99 :    
100 : overbeek 1.4 &compute_desired_homologs($fig_or_sprout,$cgi,$html,$prot);
101 : olson 1.5
102 :     if ($is_sprout)
103 :     {
104 : parrello 1.12 my $h = { homologs => $html,
105 :     title => "NMPDR Homologs in Clusters Page"};
106 : parrello 1.10
107 : olson 1.5 print "Content-Type: text/html\n";
108 :     print "\n";
109 : parrello 1.12 my $templ = "$FIG_Config::template_url/Homologs_tmpl.php";
110 :     print PageBuilder::Build("$templ", $h,"Html");
111 : olson 1.5 }
112 :     else
113 :     {
114 :     &HTML::show_page($cgi,$html);
115 :     }
116 : overbeek 1.1 exit;
117 :    
118 :     sub compute_desired_homologs {
119 : overbeek 1.4 my($fig_or_sprout,$cgi,$html,$peg) = @_;
120 : overbeek 1.1
121 : overbeek 1.4 my @pinned = &relevant_homologs($fig_or_sprout,$cgi,$peg);
122 : overbeek 1.1 # print STDERR &Dumper(\@pinned);
123 :    
124 : overbeek 1.4 # my @clusters = sort { (@$b <=> @$a) } &sets_of_homologs($fig_or_sprout,$cgi,$peg,\@pinned);
125 : overbeek 1.1 # print STDERR &Dumper(\@clusters);
126 :    
127 : overbeek 1.3 # my @homologs = &extract_homologs($peg,\@pinned,\@clusters);
128 : overbeek 1.1 # print STDERR &Dumper(\@homologs);
129 :    
130 :     my $sc;
131 : overbeek 1.7 my @tab = map { my($peg,$sc,$sim) = @$_; [$sim,$sc,
132 : overbeek 1.1 &HTML::fid_link($cgi,$peg),
133 : overbeek 1.4 $fig_or_sprout->genus_species($fig_or_sprout->genome_of($peg)),
134 :     scalar $fig_or_sprout->function_of($peg,$cgi->param('user')),
135 :     &HTML::set_prot_links($cgi,join( ', ', $fig_or_sprout->feature_aliases($peg) ))
136 : overbeek 1.3 ] } @pinned;
137 : overbeek 1.6 if (@tab > 0)
138 :     {
139 : overbeek 1.8 push(@$html,&HTML::make_table(["Sim. Sc.","Cluster Size","PEG","Genome", "Function","Aliases"],\@tab,"PEGs that Might Be in Clusters"));
140 : overbeek 1.6 }
141 :     else
142 :     {
143 :     push(@$html, $cgi->h1("Sorry, we have no clusters containing homologs of $peg"));
144 :     }
145 : parrello 1.10 }
146 : overbeek 1.1
147 :     sub relevant_homologs {
148 : overbeek 1.4 my($fig_or_sprout,$cgi,$peg) = @_;
149 : overbeek 1.1 my($maxN,$maxP,$genome1,$sim,$id2,$genome2,%seen);
150 :    
151 :     $maxN = $cgi->param('maxN');
152 :     $maxN = $maxN ? $maxN : 50;
153 :    
154 :     $maxP = $cgi->param('maxP');
155 :     $maxP = $maxP ? $maxP : 1.0e-10;
156 :    
157 : overbeek 1.4 my @sims = $fig_or_sprout->sims( $peg, $maxN, $maxP, "fig");
158 : overbeek 1.1
159 :     my @homologs = ();
160 :     $seen{&FIG::genome_of($peg)} = 1;
161 :     foreach $sim (@sims)
162 :     {
163 :     $id2 = $sim->id2;
164 :     $genome2 = &FIG::genome_of($id2);
165 : overbeek 1.3 my @coup;
166 : overbeek 1.4 if ((! $seen{$genome2}) && (@coup = $fig_or_sprout->coupled_to($id2)) && (@coup > 0))
167 : overbeek 1.1 {
168 :     $seen{$genome2} = 1;
169 : overbeek 1.8 push(@homologs,[$id2,@coup+1,$sim->psc]);
170 : overbeek 1.1 }
171 :     }
172 : overbeek 1.3 return sort { $b->[1] <=> $a->[1] } @homologs;
173 : overbeek 1.1 }
174 :    
175 :     sub sets_of_homologs {
176 : overbeek 1.4 my($fig_or_sprout,$cgi,$given_peg,$pinned) = @_;
177 : overbeek 1.1 my($peg,$mid,$min,$max,$feat,$fid);
178 :    
179 :     my $bound = $cgi->param('bound');
180 :     $bound = $bound ? $bound : 4000;
181 :    
182 :     my @pegs = ();
183 :     foreach $peg (($given_peg,@$pinned))
184 :     {
185 : overbeek 1.4 my $loc = $fig_or_sprout->feature_location($peg);
186 : overbeek 1.1 if ($loc)
187 :     {
188 : parrello 1.10 my($contig,$beg,$end) = $fig_or_sprout->boundaries_of($loc);
189 : overbeek 1.1 if ($contig && $beg && $end)
190 :     {
191 :     $mid = int(($beg + $end) / 2);
192 :     $min = $mid - $bound;
193 :     $max = $mid + $bound;
194 :    
195 : overbeek 1.4 ($feat,undef,undef) = &genes_in_region($fig_or_sprout,$cgi,&FIG::genome_of($peg),$contig,$min,$max);
196 : overbeek 1.1 foreach $fid (@$feat)
197 :     {
198 :     if (&FIG::ftype($fid) eq "peg")
199 :     {
200 :     push(@pegs,$fid);
201 :     }
202 :     }
203 :     }
204 :     }
205 :     }
206 :    
207 :     my %represents;
208 :     foreach $peg (@pegs)
209 :     {
210 : overbeek 1.4 my $tmp = $fig_or_sprout->maps_to_id($peg);
211 : overbeek 1.1 push(@{$represents{$tmp}},$peg);
212 : overbeek 1.4 # if ($tmp ne $peg) { push(@{$represents{$peg}},$peg) }
213 : overbeek 1.1 }
214 :     my($sim,%conn,$x,$y,$i,$j);
215 :     foreach $y (keys(%represents))
216 :     {
217 :     $x = $represents{$y};
218 :     for ($i=0; ($i < @$x); $i++)
219 :     {
220 :     for ($j=$i+1; ($j < @$x); $j++)
221 :     {
222 :     push(@{$conn{$x->[$i]}},$x->[$j]);
223 :     push(@{$conn{$x->[$j]}},$x->[$i]);
224 :     }
225 :     }
226 :     }
227 :    
228 :     my $maxN = $cgi->param('maxN');
229 :     $maxN = $maxN ? $maxN : 50;
230 :    
231 :     my $maxP = $cgi->param('maxP');
232 :     $maxP = $maxP ? $maxP : 1.0e-10;
233 :    
234 :     foreach $peg (@pegs)
235 :     {
236 : overbeek 1.4 foreach $sim ($fig_or_sprout->sims( $peg, $maxN, $maxP, "raw"))
237 : overbeek 1.1 {
238 :     if (defined($x = $represents{$sim->id2}))
239 :     {
240 :     foreach $y (@$x)
241 :     {
242 :     push(@{$conn{$peg}},$y);
243 :     }
244 :     }
245 :     }
246 :     }
247 :    
248 :     my(%seen,$k,$cluster);
249 :     my @clusters = ();
250 :     for ($i=0; ($i < @pegs); $i++)
251 :     {
252 :     $peg = $pegs[$i];
253 :     if (! $seen{$peg})
254 :     {
255 :     $cluster = [$peg];
256 :     $seen{$peg} = 1;
257 :     for ($j=0; ($j < @$cluster); $j++)
258 :     {
259 :     $x = $conn{$cluster->[$j]};
260 :     foreach $k (@$x)
261 :     {
262 :     if (! $seen{$k})
263 :     {
264 :     push(@$cluster,$k);
265 :     $seen{$k} = 1;
266 :     }
267 :     }
268 :     }
269 : parrello 1.10
270 : overbeek 1.1 if (@$cluster > 1)
271 :     {
272 :     push(@clusters,$cluster);
273 :     }
274 :     }
275 :     }
276 :     return @clusters;
277 :     }
278 :    
279 :     sub extract_homologs {
280 :     my($given_peg,$pinned,$clusters) = @_;
281 :     my(%main,$cluster,$peg,%counts,@with_counts);
282 :    
283 :     %main = map { $_ => 1 } ($given_peg,@$pinned);
284 :     foreach $cluster (@$clusters)
285 :     {
286 :     foreach $peg (@$cluster)
287 :     {
288 :     if (! $main{$peg})
289 :     {
290 :     $counts{&FIG::genome_of($peg)} += @$cluster - 1;
291 :     }
292 :     }
293 :     }
294 :    
295 :     foreach $peg (($given_peg,@$pinned))
296 :     {
297 :     push(@with_counts,[$peg,$counts{&FIG::genome_of($peg)}]);
298 :     }
299 :    
300 :     return grep { $_->[1] > 2} sort { $b->[1] <=> $a->[1] } @with_counts;
301 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3