[Bio] / FigWebServices / homologs_in_clusters.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/homologs_in_clusters.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.13 - (view) (download)

1 : olson 1.9 #
2 :     # Copyright (c) 2003-2006 University of Chicago and Fellowship
3 :     # for Interpretations of Genomes. All Rights Reserved.
4 :     #
5 :     # This file is part of the SEED Toolkit.
6 : parrello 1.10 #
7 : olson 1.9 # The SEED Toolkit is free software. You can redistribute
8 :     # it and/or modify it under the terms of the SEED Toolkit
9 : parrello 1.10 # Public License.
10 : olson 1.9 #
11 :     # You should have received a copy of the SEED Toolkit Public License
12 :     # along with this program; if not write to the University of Chicago
13 :     # at info@ci.uchicago.edu or the Fellowship for Interpretation of
14 :     # Genomes at veronika@thefig.info or download a copy from
15 :     # http://www.theseed.org/LICENSE.TXT.
16 :     #
17 :    
18 : overbeek 1.1 #### start #####
19 : overbeek 1.4 use InterfaceRoutines;
20 :    
21 : overbeek 1.1
22 :     use HTML;
23 :     use strict;
24 :     use CGI;
25 : parrello 1.13 use FIG_CGI;
26 :     use FIG;
27 : overbeek 1.1
28 : overbeek 1.4 my $sproutAvail = eval {
29 :     require SproutFIG;
30 :     require PageBuilder;
31 :     };
32 :    
33 : parrello 1.13 my($fig_or_sprout, $cgi) = FIG_CGI::init();
34 :    
35 : overbeek 1.4 my $html = [];
36 :    
37 : parrello 1.13 unshift @$html, "<TITLE>The Homologs in Clusters Page</TITLE>\n";
38 : overbeek 1.4
39 : overbeek 1.1 if (0)
40 :     {
41 :     my $VAR1;
42 :     eval(join("",`cat /tmp/homologs_in_clusters_parms`));
43 :     $cgi = $VAR1;
44 :     # print STDERR &Dumper($cgi);
45 :     }
46 :    
47 :     if (0)
48 :     {
49 :     print $cgi->header;
50 :     my @params = $cgi->param;
51 :     print "<pre>\n";
52 :     foreach $_ (@params)
53 :     {
54 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
55 :     }
56 :    
57 :     if (0)
58 :     {
59 :     if (open(TMP,">/tmp/homologs_in_clusters_parms"))
60 :     {
61 :     print TMP &Dumper($cgi);
62 :     close(TMP);
63 :     }
64 :     }
65 :     exit;
66 :     }
67 :    
68 :     my $prot = $cgi->param('prot');
69 :     if (! $prot)
70 :     {
71 :     push(@$html,"<h1>Sorry, you need to specify a protein</h1>\n");
72 :     &HTML::show_page($cgi,$html);
73 :     exit;
74 :     }
75 :    
76 :    
77 :     if ($prot !~ /^fig\|/)
78 :     {
79 : overbeek 1.4 my @poss = $fig_or_sprout->by_alias($prot);
80 : overbeek 1.1 if (@poss > 0)
81 :     {
82 :     $prot = $poss[0];
83 :     }
84 :     else
85 :     {
86 :     push(@$html,"<h1>Sorry, $prot appears not to have a FIG id at this point</h1>\n");
87 :     &HTML::show_page($cgi,$html);
88 :     exit;
89 :     }
90 :     }
91 :    
92 : overbeek 1.4 &compute_desired_homologs($fig_or_sprout,$cgi,$html,$prot);
93 : olson 1.5
94 : parrello 1.13 if (ref $fig_or_sprout eq 'SFXlate')
95 : olson 1.5 {
96 : parrello 1.12 my $h = { homologs => $html,
97 :     title => "NMPDR Homologs in Clusters Page"};
98 : parrello 1.10
99 : olson 1.5 print "Content-Type: text/html\n";
100 :     print "\n";
101 : parrello 1.12 my $templ = "$FIG_Config::template_url/Homologs_tmpl.php";
102 :     print PageBuilder::Build("$templ", $h,"Html");
103 : olson 1.5 }
104 :     else
105 :     {
106 :     &HTML::show_page($cgi,$html);
107 :     }
108 : overbeek 1.1 exit;
109 :    
110 :     sub compute_desired_homologs {
111 : overbeek 1.4 my($fig_or_sprout,$cgi,$html,$peg) = @_;
112 : overbeek 1.1
113 : overbeek 1.4 my @pinned = &relevant_homologs($fig_or_sprout,$cgi,$peg);
114 : overbeek 1.1 # print STDERR &Dumper(\@pinned);
115 :    
116 : overbeek 1.4 # my @clusters = sort { (@$b <=> @$a) } &sets_of_homologs($fig_or_sprout,$cgi,$peg,\@pinned);
117 : overbeek 1.1 # print STDERR &Dumper(\@clusters);
118 :    
119 : overbeek 1.3 # my @homologs = &extract_homologs($peg,\@pinned,\@clusters);
120 : overbeek 1.1 # print STDERR &Dumper(\@homologs);
121 :    
122 :     my $sc;
123 : overbeek 1.7 my @tab = map { my($peg,$sc,$sim) = @$_; [$sim,$sc,
124 : overbeek 1.1 &HTML::fid_link($cgi,$peg),
125 : overbeek 1.4 $fig_or_sprout->genus_species($fig_or_sprout->genome_of($peg)),
126 :     scalar $fig_or_sprout->function_of($peg,$cgi->param('user')),
127 :     &HTML::set_prot_links($cgi,join( ', ', $fig_or_sprout->feature_aliases($peg) ))
128 : overbeek 1.3 ] } @pinned;
129 : overbeek 1.6 if (@tab > 0)
130 :     {
131 : overbeek 1.8 push(@$html,&HTML::make_table(["Sim. Sc.","Cluster Size","PEG","Genome", "Function","Aliases"],\@tab,"PEGs that Might Be in Clusters"));
132 : overbeek 1.6 }
133 :     else
134 :     {
135 :     push(@$html, $cgi->h1("Sorry, we have no clusters containing homologs of $peg"));
136 :     }
137 : parrello 1.10 }
138 : overbeek 1.1
139 :     sub relevant_homologs {
140 : overbeek 1.4 my($fig_or_sprout,$cgi,$peg) = @_;
141 : overbeek 1.1 my($maxN,$maxP,$genome1,$sim,$id2,$genome2,%seen);
142 :    
143 :     $maxN = $cgi->param('maxN');
144 :     $maxN = $maxN ? $maxN : 50;
145 :    
146 :     $maxP = $cgi->param('maxP');
147 :     $maxP = $maxP ? $maxP : 1.0e-10;
148 :    
149 : overbeek 1.4 my @sims = $fig_or_sprout->sims( $peg, $maxN, $maxP, "fig");
150 : overbeek 1.1
151 :     my @homologs = ();
152 :     $seen{&FIG::genome_of($peg)} = 1;
153 :     foreach $sim (@sims)
154 :     {
155 :     $id2 = $sim->id2;
156 :     $genome2 = &FIG::genome_of($id2);
157 : overbeek 1.3 my @coup;
158 : overbeek 1.4 if ((! $seen{$genome2}) && (@coup = $fig_or_sprout->coupled_to($id2)) && (@coup > 0))
159 : overbeek 1.1 {
160 :     $seen{$genome2} = 1;
161 : overbeek 1.8 push(@homologs,[$id2,@coup+1,$sim->psc]);
162 : overbeek 1.1 }
163 :     }
164 : overbeek 1.3 return sort { $b->[1] <=> $a->[1] } @homologs;
165 : overbeek 1.1 }
166 :    
167 :     sub sets_of_homologs {
168 : overbeek 1.4 my($fig_or_sprout,$cgi,$given_peg,$pinned) = @_;
169 : overbeek 1.1 my($peg,$mid,$min,$max,$feat,$fid);
170 :    
171 :     my $bound = $cgi->param('bound');
172 :     $bound = $bound ? $bound : 4000;
173 :    
174 :     my @pegs = ();
175 :     foreach $peg (($given_peg,@$pinned))
176 :     {
177 : overbeek 1.4 my $loc = $fig_or_sprout->feature_location($peg);
178 : overbeek 1.1 if ($loc)
179 :     {
180 : parrello 1.10 my($contig,$beg,$end) = $fig_or_sprout->boundaries_of($loc);
181 : overbeek 1.1 if ($contig && $beg && $end)
182 :     {
183 :     $mid = int(($beg + $end) / 2);
184 :     $min = $mid - $bound;
185 :     $max = $mid + $bound;
186 :    
187 : overbeek 1.4 ($feat,undef,undef) = &genes_in_region($fig_or_sprout,$cgi,&FIG::genome_of($peg),$contig,$min,$max);
188 : overbeek 1.1 foreach $fid (@$feat)
189 :     {
190 :     if (&FIG::ftype($fid) eq "peg")
191 :     {
192 :     push(@pegs,$fid);
193 :     }
194 :     }
195 :     }
196 :     }
197 :     }
198 :    
199 :     my %represents;
200 :     foreach $peg (@pegs)
201 :     {
202 : overbeek 1.4 my $tmp = $fig_or_sprout->maps_to_id($peg);
203 : overbeek 1.1 push(@{$represents{$tmp}},$peg);
204 : overbeek 1.4 # if ($tmp ne $peg) { push(@{$represents{$peg}},$peg) }
205 : overbeek 1.1 }
206 :     my($sim,%conn,$x,$y,$i,$j);
207 :     foreach $y (keys(%represents))
208 :     {
209 :     $x = $represents{$y};
210 :     for ($i=0; ($i < @$x); $i++)
211 :     {
212 :     for ($j=$i+1; ($j < @$x); $j++)
213 :     {
214 :     push(@{$conn{$x->[$i]}},$x->[$j]);
215 :     push(@{$conn{$x->[$j]}},$x->[$i]);
216 :     }
217 :     }
218 :     }
219 :    
220 :     my $maxN = $cgi->param('maxN');
221 :     $maxN = $maxN ? $maxN : 50;
222 :    
223 :     my $maxP = $cgi->param('maxP');
224 :     $maxP = $maxP ? $maxP : 1.0e-10;
225 :    
226 :     foreach $peg (@pegs)
227 :     {
228 : overbeek 1.4 foreach $sim ($fig_or_sprout->sims( $peg, $maxN, $maxP, "raw"))
229 : overbeek 1.1 {
230 :     if (defined($x = $represents{$sim->id2}))
231 :     {
232 :     foreach $y (@$x)
233 :     {
234 :     push(@{$conn{$peg}},$y);
235 :     }
236 :     }
237 :     }
238 :     }
239 :    
240 :     my(%seen,$k,$cluster);
241 :     my @clusters = ();
242 :     for ($i=0; ($i < @pegs); $i++)
243 :     {
244 :     $peg = $pegs[$i];
245 :     if (! $seen{$peg})
246 :     {
247 :     $cluster = [$peg];
248 :     $seen{$peg} = 1;
249 :     for ($j=0; ($j < @$cluster); $j++)
250 :     {
251 :     $x = $conn{$cluster->[$j]};
252 :     foreach $k (@$x)
253 :     {
254 :     if (! $seen{$k})
255 :     {
256 :     push(@$cluster,$k);
257 :     $seen{$k} = 1;
258 :     }
259 :     }
260 :     }
261 : parrello 1.10
262 : overbeek 1.1 if (@$cluster > 1)
263 :     {
264 :     push(@clusters,$cluster);
265 :     }
266 :     }
267 :     }
268 :     return @clusters;
269 :     }
270 :    
271 :     sub extract_homologs {
272 :     my($given_peg,$pinned,$clusters) = @_;
273 :     my(%main,$cluster,$peg,%counts,@with_counts);
274 :    
275 :     %main = map { $_ => 1 } ($given_peg,@$pinned);
276 :     foreach $cluster (@$clusters)
277 :     {
278 :     foreach $peg (@$cluster)
279 :     {
280 :     if (! $main{$peg})
281 :     {
282 :     $counts{&FIG::genome_of($peg)} += @$cluster - 1;
283 :     }
284 :     }
285 :     }
286 :    
287 :     foreach $peg (($given_peg,@$pinned))
288 :     {
289 :     push(@with_counts,[$peg,$counts{&FIG::genome_of($peg)}]);
290 :     }
291 :    
292 :     return grep { $_->[1] > 2} sort { $b->[1] <=> $a->[1] } @with_counts;
293 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3