[Bio] / FigWebServices / homologs_in_clusters.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/homologs_in_clusters.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.11 - (view) (download)

1 : olson 1.9 #
2 :     # Copyright (c) 2003-2006 University of Chicago and Fellowship
3 :     # for Interpretations of Genomes. All Rights Reserved.
4 :     #
5 :     # This file is part of the SEED Toolkit.
6 : parrello 1.10 #
7 : olson 1.9 # The SEED Toolkit is free software. You can redistribute
8 :     # it and/or modify it under the terms of the SEED Toolkit
9 : parrello 1.10 # Public License.
10 : olson 1.9 #
11 :     # You should have received a copy of the SEED Toolkit Public License
12 :     # along with this program; if not write to the University of Chicago
13 :     # at info@ci.uchicago.edu or the Fellowship for Interpretation of
14 :     # Genomes at veronika@thefig.info or download a copy from
15 :     # http://www.theseed.org/LICENSE.TXT.
16 :     #
17 :    
18 : overbeek 1.1 #### start #####
19 : overbeek 1.4 use InterfaceRoutines;
20 :    
21 : overbeek 1.1
22 :     use HTML;
23 :     use strict;
24 :     use CGI;
25 :     my $cgi = new CGI;
26 :    
27 : overbeek 1.4 use FIG;
28 :     my $sproutAvail = eval {
29 :     require SproutFIG;
30 :     require PageBuilder;
31 :     };
32 :    
33 :     my($fig_or_sprout);
34 :     my $is_sprout;
35 :     my $html = [];
36 :    
37 :     if ($cgi->param('SPROUT')) {
38 :     $is_sprout = 1;
39 :     $fig_or_sprout = new SproutFIG($FIG_Config::sproutDB, $FIG_Config::sproutData);
40 :     unshift @$html, "<TITLE>The NMPDR Homologs in Clusters Page</TITLE>\n";
41 :     } else {
42 :     $is_sprout = 0;
43 :     $fig_or_sprout = new FIG;
44 :     unshift @$html, "<TITLE>The SEED Homologs in Clusters Page</TITLE>\n";
45 :     }
46 :    
47 : overbeek 1.1 if (0)
48 :     {
49 :     my $VAR1;
50 :     eval(join("",`cat /tmp/homologs_in_clusters_parms`));
51 :     $cgi = $VAR1;
52 :     # print STDERR &Dumper($cgi);
53 :     }
54 :    
55 :     if (0)
56 :     {
57 :     print $cgi->header;
58 :     my @params = $cgi->param;
59 :     print "<pre>\n";
60 :     foreach $_ (@params)
61 :     {
62 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
63 :     }
64 :    
65 :     if (0)
66 :     {
67 :     if (open(TMP,">/tmp/homologs_in_clusters_parms"))
68 :     {
69 :     print TMP &Dumper($cgi);
70 :     close(TMP);
71 :     }
72 :     }
73 :     exit;
74 :     }
75 :    
76 :     my $prot = $cgi->param('prot');
77 :     if (! $prot)
78 :     {
79 :     push(@$html,"<h1>Sorry, you need to specify a protein</h1>\n");
80 :     &HTML::show_page($cgi,$html);
81 :     exit;
82 :     }
83 :    
84 :    
85 :     if ($prot !~ /^fig\|/)
86 :     {
87 : overbeek 1.4 my @poss = $fig_or_sprout->by_alias($prot);
88 : overbeek 1.1 if (@poss > 0)
89 :     {
90 :     $prot = $poss[0];
91 :     }
92 :     else
93 :     {
94 :     push(@$html,"<h1>Sorry, $prot appears not to have a FIG id at this point</h1>\n");
95 :     &HTML::show_page($cgi,$html);
96 :     exit;
97 :     }
98 :     }
99 :    
100 : overbeek 1.4 &compute_desired_homologs($fig_or_sprout,$cgi,$html,$prot);
101 : olson 1.5
102 :     if ($is_sprout)
103 :     {
104 :     my $h = { homologs => $html };
105 : parrello 1.10
106 : olson 1.5 print "Content-Type: text/html\n";
107 :     print "\n";
108 :     my $templ = "$FIG_Config::fig/CGI/Html/Homologs_tmpl.html";
109 : parrello 1.11 print PageBuilder::Build("<<$templ", $h,"Html");
110 : olson 1.5 }
111 :     else
112 :     {
113 :     &HTML::show_page($cgi,$html);
114 :     }
115 : overbeek 1.1 exit;
116 :    
117 :     sub compute_desired_homologs {
118 : overbeek 1.4 my($fig_or_sprout,$cgi,$html,$peg) = @_;
119 : overbeek 1.1
120 : overbeek 1.4 my @pinned = &relevant_homologs($fig_or_sprout,$cgi,$peg);
121 : overbeek 1.1 # print STDERR &Dumper(\@pinned);
122 :    
123 : overbeek 1.4 # my @clusters = sort { (@$b <=> @$a) } &sets_of_homologs($fig_or_sprout,$cgi,$peg,\@pinned);
124 : overbeek 1.1 # print STDERR &Dumper(\@clusters);
125 :    
126 : overbeek 1.3 # my @homologs = &extract_homologs($peg,\@pinned,\@clusters);
127 : overbeek 1.1 # print STDERR &Dumper(\@homologs);
128 :    
129 :     my $sc;
130 : overbeek 1.7 my @tab = map { my($peg,$sc,$sim) = @$_; [$sim,$sc,
131 : overbeek 1.1 &HTML::fid_link($cgi,$peg),
132 : overbeek 1.4 $fig_or_sprout->genus_species($fig_or_sprout->genome_of($peg)),
133 :     scalar $fig_or_sprout->function_of($peg,$cgi->param('user')),
134 :     &HTML::set_prot_links($cgi,join( ', ', $fig_or_sprout->feature_aliases($peg) ))
135 : overbeek 1.3 ] } @pinned;
136 : overbeek 1.6 if (@tab > 0)
137 :     {
138 : overbeek 1.8 push(@$html,&HTML::make_table(["Sim. Sc.","Cluster Size","PEG","Genome", "Function","Aliases"],\@tab,"PEGs that Might Be in Clusters"));
139 : overbeek 1.6 }
140 :     else
141 :     {
142 :     push(@$html, $cgi->h1("Sorry, we have no clusters containing homologs of $peg"));
143 :     }
144 : parrello 1.10 }
145 : overbeek 1.1
146 :     sub relevant_homologs {
147 : overbeek 1.4 my($fig_or_sprout,$cgi,$peg) = @_;
148 : overbeek 1.1 my($maxN,$maxP,$genome1,$sim,$id2,$genome2,%seen);
149 :    
150 :     $maxN = $cgi->param('maxN');
151 :     $maxN = $maxN ? $maxN : 50;
152 :    
153 :     $maxP = $cgi->param('maxP');
154 :     $maxP = $maxP ? $maxP : 1.0e-10;
155 :    
156 : overbeek 1.4 my @sims = $fig_or_sprout->sims( $peg, $maxN, $maxP, "fig");
157 : overbeek 1.1
158 :     my @homologs = ();
159 :     $seen{&FIG::genome_of($peg)} = 1;
160 :     foreach $sim (@sims)
161 :     {
162 :     $id2 = $sim->id2;
163 :     $genome2 = &FIG::genome_of($id2);
164 : overbeek 1.3 my @coup;
165 : overbeek 1.4 if ((! $seen{$genome2}) && (@coup = $fig_or_sprout->coupled_to($id2)) && (@coup > 0))
166 : overbeek 1.1 {
167 :     $seen{$genome2} = 1;
168 : overbeek 1.8 push(@homologs,[$id2,@coup+1,$sim->psc]);
169 : overbeek 1.1 }
170 :     }
171 : overbeek 1.3 return sort { $b->[1] <=> $a->[1] } @homologs;
172 : overbeek 1.1 }
173 :    
174 :     sub sets_of_homologs {
175 : overbeek 1.4 my($fig_or_sprout,$cgi,$given_peg,$pinned) = @_;
176 : overbeek 1.1 my($peg,$mid,$min,$max,$feat,$fid);
177 :    
178 :     my $bound = $cgi->param('bound');
179 :     $bound = $bound ? $bound : 4000;
180 :    
181 :     my @pegs = ();
182 :     foreach $peg (($given_peg,@$pinned))
183 :     {
184 : overbeek 1.4 my $loc = $fig_or_sprout->feature_location($peg);
185 : overbeek 1.1 if ($loc)
186 :     {
187 : parrello 1.10 my($contig,$beg,$end) = $fig_or_sprout->boundaries_of($loc);
188 : overbeek 1.1 if ($contig && $beg && $end)
189 :     {
190 :     $mid = int(($beg + $end) / 2);
191 :     $min = $mid - $bound;
192 :     $max = $mid + $bound;
193 :    
194 : overbeek 1.4 ($feat,undef,undef) = &genes_in_region($fig_or_sprout,$cgi,&FIG::genome_of($peg),$contig,$min,$max);
195 : overbeek 1.1 foreach $fid (@$feat)
196 :     {
197 :     if (&FIG::ftype($fid) eq "peg")
198 :     {
199 :     push(@pegs,$fid);
200 :     }
201 :     }
202 :     }
203 :     }
204 :     }
205 :    
206 :     my %represents;
207 :     foreach $peg (@pegs)
208 :     {
209 : overbeek 1.4 my $tmp = $fig_or_sprout->maps_to_id($peg);
210 : overbeek 1.1 push(@{$represents{$tmp}},$peg);
211 : overbeek 1.4 # if ($tmp ne $peg) { push(@{$represents{$peg}},$peg) }
212 : overbeek 1.1 }
213 :     my($sim,%conn,$x,$y,$i,$j);
214 :     foreach $y (keys(%represents))
215 :     {
216 :     $x = $represents{$y};
217 :     for ($i=0; ($i < @$x); $i++)
218 :     {
219 :     for ($j=$i+1; ($j < @$x); $j++)
220 :     {
221 :     push(@{$conn{$x->[$i]}},$x->[$j]);
222 :     push(@{$conn{$x->[$j]}},$x->[$i]);
223 :     }
224 :     }
225 :     }
226 :    
227 :     my $maxN = $cgi->param('maxN');
228 :     $maxN = $maxN ? $maxN : 50;
229 :    
230 :     my $maxP = $cgi->param('maxP');
231 :     $maxP = $maxP ? $maxP : 1.0e-10;
232 :    
233 :     foreach $peg (@pegs)
234 :     {
235 : overbeek 1.4 foreach $sim ($fig_or_sprout->sims( $peg, $maxN, $maxP, "raw"))
236 : overbeek 1.1 {
237 :     if (defined($x = $represents{$sim->id2}))
238 :     {
239 :     foreach $y (@$x)
240 :     {
241 :     push(@{$conn{$peg}},$y);
242 :     }
243 :     }
244 :     }
245 :     }
246 :    
247 :     my(%seen,$k,$cluster);
248 :     my @clusters = ();
249 :     for ($i=0; ($i < @pegs); $i++)
250 :     {
251 :     $peg = $pegs[$i];
252 :     if (! $seen{$peg})
253 :     {
254 :     $cluster = [$peg];
255 :     $seen{$peg} = 1;
256 :     for ($j=0; ($j < @$cluster); $j++)
257 :     {
258 :     $x = $conn{$cluster->[$j]};
259 :     foreach $k (@$x)
260 :     {
261 :     if (! $seen{$k})
262 :     {
263 :     push(@$cluster,$k);
264 :     $seen{$k} = 1;
265 :     }
266 :     }
267 :     }
268 : parrello 1.10
269 : overbeek 1.1 if (@$cluster > 1)
270 :     {
271 :     push(@clusters,$cluster);
272 :     }
273 :     }
274 :     }
275 :     return @clusters;
276 :     }
277 :    
278 :     sub extract_homologs {
279 :     my($given_peg,$pinned,$clusters) = @_;
280 :     my(%main,$cluster,$peg,%counts,@with_counts);
281 :    
282 :     %main = map { $_ => 1 } ($given_peg,@$pinned);
283 :     foreach $cluster (@$clusters)
284 :     {
285 :     foreach $peg (@$cluster)
286 :     {
287 :     if (! $main{$peg})
288 :     {
289 :     $counts{&FIG::genome_of($peg)} += @$cluster - 1;
290 :     }
291 :     }
292 :     }
293 :    
294 :     foreach $peg (($given_peg,@$pinned))
295 :     {
296 :     push(@with_counts,[$peg,$counts{&FIG::genome_of($peg)}]);
297 :     }
298 :    
299 :     return grep { $_->[1] > 2} sort { $b->[1] <=> $a->[1] } @with_counts;
300 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3