[Bio] / FigWebServices / homologs_in_clusters.cgi Repository:
ViewVC logotype

Annotation of /FigWebServices/homologs_in_clusters.cgi

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.1 - (view) (download)

1 : overbeek 1.1 #### start #####
2 :     use FIG;
3 :     my $fig = new FIG;
4 :    
5 :     use HTML;
6 :     use strict;
7 :     use CGI;
8 :     my $cgi = new CGI;
9 :    
10 :     if (0)
11 :     {
12 :     my $VAR1;
13 :     eval(join("",`cat /tmp/homologs_in_clusters_parms`));
14 :     $cgi = $VAR1;
15 :     # print STDERR &Dumper($cgi);
16 :     }
17 :    
18 :     if (0)
19 :     {
20 :     print $cgi->header;
21 :     my @params = $cgi->param;
22 :     print "<pre>\n";
23 :     foreach $_ (@params)
24 :     {
25 :     print "$_\t:",join(",",$cgi->param($_)),":\n";
26 :     }
27 :    
28 :     if (0)
29 :     {
30 :     if (open(TMP,">/tmp/homologs_in_clusters_parms"))
31 :     {
32 :     print TMP &Dumper($cgi);
33 :     close(TMP);
34 :     }
35 :     }
36 :     exit;
37 :     }
38 :    
39 :     my $html = [];
40 :     unshift @$html, "<TITLE>The SEED: Homologs in Clusters Page</TITLE>\n";
41 :    
42 :     my $prot = $cgi->param('prot');
43 :     if (! $prot)
44 :     {
45 :     push(@$html,"<h1>Sorry, you need to specify a protein</h1>\n");
46 :     &HTML::show_page($cgi,$html);
47 :     exit;
48 :     }
49 :    
50 :    
51 :     if ($prot !~ /^fig\|/)
52 :     {
53 :     my @poss = $fig->by_alias($prot);
54 :     if (@poss > 0)
55 :     {
56 :     $prot = $poss[0];
57 :     }
58 :     else
59 :     {
60 :     push(@$html,"<h1>Sorry, $prot appears not to have a FIG id at this point</h1>\n");
61 :     &HTML::show_page($cgi,$html);
62 :     exit;
63 :     }
64 :     }
65 :    
66 :     &compute_desired_homologs($fig,$cgi,$html,$prot);
67 :     &HTML::show_page($cgi,$html);
68 :     exit;
69 :    
70 :     sub compute_desired_homologs {
71 :     my($fig,$cgi,$html,$peg) = @_;
72 :    
73 :     my @pinned = &relevant_homologs($fig,$cgi,$peg);
74 :     # print STDERR &Dumper(\@pinned);
75 :    
76 :     my @clusters = sort { (@$b <=> @$a) } &sets_of_homologs($fig,$cgi,$peg,\@pinned);
77 :     # print STDERR &Dumper(\@clusters);
78 :    
79 :     my @homologs = &extract_homologs($peg,\@pinned,\@clusters);
80 :     # print STDERR &Dumper(\@homologs);
81 :    
82 :     my $sc;
83 :     my @tab = map { ($peg,$sc) = @$_; [$sc,
84 :     &HTML::fid_link($cgi,$peg),
85 :     scalar $fig->function_of($peg,$cgi->param('user')),
86 :     &HTML::set_prot_links($cgi,join( ', ', $fig->feature_aliases($peg) ))
87 :     ] } @homologs;
88 :     push(@$html,&HTML::make_table(["Crude Score","PEG","Function","Aliases"],\@tab,"PEGs that Might Be in Clusters"));
89 :     }
90 :    
91 :     sub relevant_homologs {
92 :     my($fig,$cgi,$peg) = @_;
93 :     my($maxN,$maxP,$genome1,$sim,$id2,$genome2,%seen);
94 :    
95 :     $maxN = $cgi->param('maxN');
96 :     $maxN = $maxN ? $maxN : 50;
97 :    
98 :     $maxP = $cgi->param('maxP');
99 :     $maxP = $maxP ? $maxP : 1.0e-10;
100 :    
101 :     my @sims = $fig->sims( $peg, $maxN, $maxP, "fig");
102 :    
103 :     my @homologs = ();
104 :     $seen{&FIG::genome_of($peg)} = 1;
105 :     foreach $sim (@sims)
106 :     {
107 :     $id2 = $sim->id2;
108 :     $genome2 = &FIG::genome_of($id2);
109 :     if (! $seen{$genome2})
110 :     {
111 :     $seen{$genome2} = 1;
112 :     push(@homologs,$id2);
113 :     }
114 :     }
115 :     return @homologs;
116 :     }
117 :    
118 :     sub sets_of_homologs {
119 :     my($fig,$cgi,$given_peg,$pinned) = @_;
120 :     my($peg,$mid,$min,$max,$feat,$fid);
121 :    
122 :     my $bound = $cgi->param('bound');
123 :     $bound = $bound ? $bound : 4000;
124 :    
125 :     my @pegs = ();
126 :     foreach $peg (($given_peg,@$pinned))
127 :     {
128 :     my $loc = $fig->feature_location($peg);
129 :     if ($loc)
130 :     {
131 :     my($contig,$beg,$end) = &FIG::boundaries_of($loc);
132 :     if ($contig && $beg && $end)
133 :     {
134 :     $mid = int(($beg + $end) / 2);
135 :     $min = $mid - $bound;
136 :     $max = $mid + $bound;
137 :    
138 :     ($feat,undef,undef) = $fig->genes_in_region(&FIG::genome_of($peg),$contig,$min,$max);
139 :     foreach $fid (@$feat)
140 :     {
141 :     if (&FIG::ftype($fid) eq "peg")
142 :     {
143 :     push(@pegs,$fid);
144 :     }
145 :     }
146 :     }
147 :     }
148 :     }
149 :    
150 :     my %represents;
151 :     foreach $peg (@pegs)
152 :     {
153 :     my $tmp = $fig->maps_to_id($peg);
154 :     push(@{$represents{$tmp}},$peg);
155 :     }
156 :     my($sim,%conn,$x,$y,$i,$j);
157 :     foreach $y (keys(%represents))
158 :     {
159 :     $x = $represents{$y};
160 :     for ($i=0; ($i < @$x); $i++)
161 :     {
162 :     for ($j=$i+1; ($j < @$x); $j++)
163 :     {
164 :     push(@{$conn{$x->[$i]}},$x->[$j]);
165 :     push(@{$conn{$x->[$j]}},$x->[$i]);
166 :     }
167 :     }
168 :     }
169 :    
170 :     my $maxN = $cgi->param('maxN');
171 :     $maxN = $maxN ? $maxN : 50;
172 :    
173 :     my $maxP = $cgi->param('maxP');
174 :     $maxP = $maxP ? $maxP : 1.0e-10;
175 :    
176 :     foreach $peg (@pegs)
177 :     {
178 :     foreach $sim ($fig->sims($peg,$maxN,$maxP,"raw"))
179 :     {
180 :     if (defined($x = $represents{$sim->id2}))
181 :     {
182 :     foreach $y (@$x)
183 :     {
184 :     push(@{$conn{$peg}},$y);
185 :     }
186 :     }
187 :     }
188 :     }
189 :    
190 :     my(%seen,$k,$cluster);
191 :     my @clusters = ();
192 :     for ($i=0; ($i < @pegs); $i++)
193 :     {
194 :     $peg = $pegs[$i];
195 :     if (! $seen{$peg})
196 :     {
197 :     $cluster = [$peg];
198 :     $seen{$peg} = 1;
199 :     for ($j=0; ($j < @$cluster); $j++)
200 :     {
201 :     $x = $conn{$cluster->[$j]};
202 :     foreach $k (@$x)
203 :     {
204 :     if (! $seen{$k})
205 :     {
206 :     push(@$cluster,$k);
207 :     $seen{$k} = 1;
208 :     }
209 :     }
210 :     }
211 :    
212 :     if (@$cluster > 1)
213 :     {
214 :     push(@clusters,$cluster);
215 :     }
216 :     }
217 :     }
218 :     return @clusters;
219 :     }
220 :    
221 :     sub extract_homologs {
222 :     my($given_peg,$pinned,$clusters) = @_;
223 :     my(%main,$cluster,$peg,%counts,@with_counts);
224 :    
225 :     %main = map { $_ => 1 } ($given_peg,@$pinned);
226 :     foreach $cluster (@$clusters)
227 :     {
228 :     foreach $peg (@$cluster)
229 :     {
230 :     if (! $main{$peg})
231 :     {
232 :     $counts{&FIG::genome_of($peg)} += @$cluster - 1;
233 :     }
234 :     }
235 :     }
236 :    
237 :     foreach $peg (($given_peg,@$pinned))
238 :     {
239 :     push(@with_counts,[$peg,$counts{&FIG::genome_of($peg)}]);
240 :     }
241 :    
242 :     return grep { $_->[1] > 2} sort { $b->[1] <=> $a->[1] } @with_counts;
243 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3