[Bio] / FigWebServices / homologs_in_clusters.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/homologs_in_clusters.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.2 - (view) (download)

1 : overbeek 1.1 #### start #####
2 :     use FIG;
3 :     my $fig = new FIG;
4 :    
5 :     use HTML;
6 :     use strict;
7 :     use CGI;
8 :     my $cgi = new CGI;
9 :    
10 :     if (0)
11 :     {
12 :     my $VAR1;
13 :     eval(join("",`cat /tmp/homologs_in_clusters_parms`));
14 :     $cgi = $VAR1;
15 :     # print STDERR &Dumper($cgi);
16 :     }
17 :    
18 :     if (0)
19 :     {
20 :     print $cgi->header;
21 :     my @params = $cgi->param;
22 :     print "<pre>\n";
23 :     foreach $_ (@params)
24 :     {
25 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
26 :     }
27 :    
28 :     if (0)
29 :     {
30 :     if (open(TMP,">/tmp/homologs_in_clusters_parms"))
31 :     {
32 :     print TMP &Dumper($cgi);
33 :     close(TMP);
34 :     }
35 :     }
36 :     exit;
37 :     }
38 :    
39 :     my $html = [];
40 :     unshift @$html, "<TITLE>The SEED: Homologs in Clusters Page</TITLE>\n";
41 :    
42 :     my $prot = $cgi->param('prot');
43 :     if (! $prot)
44 :     {
45 :     push(@$html,"<h1>Sorry, you need to specify a protein</h1>\n");
46 :     &HTML::show_page($cgi,$html);
47 :     exit;
48 :     }
49 :    
50 :    
51 :     if ($prot !~ /^fig\|/)
52 :     {
53 :     my @poss = $fig->by_alias($prot);
54 :     if (@poss > 0)
55 :     {
56 :     $prot = $poss[0];
57 :     }
58 :     else
59 :     {
60 :     push(@$html,"<h1>Sorry, $prot appears not to have a FIG id at this point</h1>\n");
61 :     &HTML::show_page($cgi,$html);
62 :     exit;
63 :     }
64 :     }
65 :    
66 :     &compute_desired_homologs($fig,$cgi,$html,$prot);
67 :     &HTML::show_page($cgi,$html);
68 :     exit;
69 :    
70 :     sub compute_desired_homologs {
71 :     my($fig,$cgi,$html,$peg) = @_;
72 :    
73 :     my @pinned = &relevant_homologs($fig,$cgi,$peg);
74 :     # print STDERR &Dumper(\@pinned);
75 :    
76 :     my @clusters = sort { (@$b <=> @$a) } &sets_of_homologs($fig,$cgi,$peg,\@pinned);
77 :     # print STDERR &Dumper(\@clusters);
78 :    
79 :     my @homologs = &extract_homologs($peg,\@pinned,\@clusters);
80 :     # print STDERR &Dumper(\@homologs);
81 :    
82 :     my $sc;
83 :     my @tab = map { ($peg,$sc) = @$_; [$sc,
84 :     &HTML::fid_link($cgi,$peg),
85 : redwards 1.2 $fig->genus_species($fig->genome_of($peg)),
86 : overbeek 1.1 scalar $fig->function_of($peg,$cgi->param('user')),
87 :     &HTML::set_prot_links($cgi,join( ', ', $fig->feature_aliases($peg) ))
88 :     ] } @homologs;
89 : redwards 1.2 push(@$html,&HTML::make_table(["Crude Score","PEG","Genome", "Function","Aliases"],\@tab,"PEGs that Might Be in Clusters"));
90 : overbeek 1.1 }
91 :    
92 :     sub relevant_homologs {
93 :     my($fig,$cgi,$peg) = @_;
94 :     my($maxN,$maxP,$genome1,$sim,$id2,$genome2,%seen);
95 :    
96 :     $maxN = $cgi->param('maxN');
97 :     $maxN = $maxN ? $maxN : 50;
98 :    
99 :     $maxP = $cgi->param('maxP');
100 :     $maxP = $maxP ? $maxP : 1.0e-10;
101 :    
102 :     my @sims = $fig->sims( $peg, $maxN, $maxP, "fig");
103 :    
104 :     my @homologs = ();
105 :     $seen{&FIG::genome_of($peg)} = 1;
106 :     foreach $sim (@sims)
107 :     {
108 :     $id2 = $sim->id2;
109 :     $genome2 = &FIG::genome_of($id2);
110 :     if (! $seen{$genome2})
111 :     {
112 :     $seen{$genome2} = 1;
113 :     push(@homologs,$id2);
114 :     }
115 :     }
116 :     return @homologs;
117 :     }
118 :    
119 :     sub sets_of_homologs {
120 :     my($fig,$cgi,$given_peg,$pinned) = @_;
121 :     my($peg,$mid,$min,$max,$feat,$fid);
122 :    
123 :     my $bound = $cgi->param('bound');
124 :     $bound = $bound ? $bound : 4000;
125 :    
126 :     my @pegs = ();
127 :     foreach $peg (($given_peg,@$pinned))
128 :     {
129 :     my $loc = $fig->feature_location($peg);
130 :     if ($loc)
131 :     {
132 :     my($contig,$beg,$end) = &FIG::boundaries_of($loc);
133 :     if ($contig && $beg && $end)
134 :     {
135 :     $mid = int(($beg + $end) / 2);
136 :     $min = $mid - $bound;
137 :     $max = $mid + $bound;
138 :    
139 :     ($feat,undef,undef) = $fig->genes_in_region(&FIG::genome_of($peg),$contig,$min,$max);
140 :     foreach $fid (@$feat)
141 :     {
142 :     if (&FIG::ftype($fid) eq "peg")
143 :     {
144 :     push(@pegs,$fid);
145 :     }
146 :     }
147 :     }
148 :     }
149 :     }
150 :    
151 :     my %represents;
152 :     foreach $peg (@pegs)
153 :     {
154 :     my $tmp = $fig->maps_to_id($peg);
155 :     push(@{$represents{$tmp}},$peg);
156 :     }
157 :     my($sim,%conn,$x,$y,$i,$j);
158 :     foreach $y (keys(%represents))
159 :     {
160 :     $x = $represents{$y};
161 :     for ($i=0; ($i < @$x); $i++)
162 :     {
163 :     for ($j=$i+1; ($j < @$x); $j++)
164 :     {
165 :     push(@{$conn{$x->[$i]}},$x->[$j]);
166 :     push(@{$conn{$x->[$j]}},$x->[$i]);
167 :     }
168 :     }
169 :     }
170 :    
171 :     my $maxN = $cgi->param('maxN');
172 :     $maxN = $maxN ? $maxN : 50;
173 :    
174 :     my $maxP = $cgi->param('maxP');
175 :     $maxP = $maxP ? $maxP : 1.0e-10;
176 :    
177 :     foreach $peg (@pegs)
178 :     {
179 :     foreach $sim ($fig->sims($peg,$maxN,$maxP,"raw"))
180 :     {
181 :     if (defined($x = $represents{$sim->id2}))
182 :     {
183 :     foreach $y (@$x)
184 :     {
185 :     push(@{$conn{$peg}},$y);
186 :     }
187 :     }
188 :     }
189 :     }
190 :    
191 :     my(%seen,$k,$cluster);
192 :     my @clusters = ();
193 :     for ($i=0; ($i < @pegs); $i++)
194 :     {
195 :     $peg = $pegs[$i];
196 :     if (! $seen{$peg})
197 :     {
198 :     $cluster = [$peg];
199 :     $seen{$peg} = 1;
200 :     for ($j=0; ($j < @$cluster); $j++)
201 :     {
202 :     $x = $conn{$cluster->[$j]};
203 :     foreach $k (@$x)
204 :     {
205 :     if (! $seen{$k})
206 :     {
207 :     push(@$cluster,$k);
208 :     $seen{$k} = 1;
209 :     }
210 :     }
211 :     }
212 :    
213 :     if (@$cluster > 1)
214 :     {
215 :     push(@clusters,$cluster);
216 :     }
217 :     }
218 :     }
219 :     return @clusters;
220 :     }
221 :    
222 :     sub extract_homologs {
223 :     my($given_peg,$pinned,$clusters) = @_;
224 :     my(%main,$cluster,$peg,%counts,@with_counts);
225 :    
226 :     %main = map { $_ => 1 } ($given_peg,@$pinned);
227 :     foreach $cluster (@$clusters)
228 :     {
229 :     foreach $peg (@$cluster)
230 :     {
231 :     if (! $main{$peg})
232 :     {
233 :     $counts{&FIG::genome_of($peg)} += @$cluster - 1;
234 :     }
235 :     }
236 :     }
237 :    
238 :     foreach $peg (($given_peg,@$pinned))
239 :     {
240 :     push(@with_counts,[$peg,$counts{&FIG::genome_of($peg)}]);
241 :     }
242 :    
243 :     return grep { $_->[1] > 2} sort { $b->[1] <=> $a->[1] } @with_counts;
244 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3