[Bio] / FigKernelScripts / get_ON_probes.pl Repository:
ViewVC logotype

Annotation of /FigKernelScripts/get_ON_probes.pl

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.4 - (view) (download) (as text)

1 : overbeek 1.1 use strict;
2 :     use Data::Dumper;
3 : olson 1.2 #use SAPserver;
4 :     #my $sapO = new SAPserver;
5 :     use SeedUtils;
6 :    
7 :     use ExpressionDir;
8 :    
9 :     my $usage = "usage: get_ON_probes ExprDir outProbesOnFile outPegsOnFile";
10 :     #my $usage = "usage: get_ON_probes Genome probe.occ.table peg.probe.table raw_data.tab > Probe-PEG-Func Table";
11 :     my($genome,$probe_occF,$probe_pegF,$raw_dataF, $expr_dir, $output_probesF, $output_pegsF);
12 : overbeek 1.1 (
13 : olson 1.2 ($expr_dir = shift @ARGV) &&
14 :     ($output_probesF = shift @ARGV) &&
15 :     ($output_pegsF = shift @ARGV)
16 : overbeek 1.1 )
17 :     || die $usage;
18 :    
19 : olson 1.2 my $exprO = ExpressionDir->new($expr_dir);
20 :    
21 :     $genome = $exprO->genome_id;
22 :     $probe_occF = $exprO->expr_dir . "/probe.occ.table";
23 :     $probe_pegF = $exprO->expr_dir . "/peg.probe.table";
24 :     $raw_dataF = $exprO->expr_dir . "/rma_normalized.tab";
25 :    
26 : overbeek 1.1 my %known_pegs = map { ($_ =~ /^(fig\|\d+\.\d+\.[^\.]+\.\d+)/) ? ($1 => 1) : () } `cut -f1 $raw_dataF`;
27 :    
28 : olson 1.2 #my $hashG = $sapO->all_features( -ids => [$genome], -type => 'peg' );
29 :     #my @pegs = grep { $known_pegs{$_} } @{$hashG->{$genome}};
30 :     #my $hashF = $sapO->ids_to_functions(-ids => \@pegs);
31 :    
32 :     my @pegs = $exprO->all_features('peg');
33 :     my $hashF = $exprO->ids_to_functions(\@pegs);
34 : overbeek 1.1
35 :     my %ONfunc = map { chomp; $_ => 1 } <DATA>;
36 :     my %ON = map { $ONfunc{$hashF->{$_}} ? ($_ => $hashF->{$_}) : () } keys(%$hashF);
37 :    
38 : olson 1.3 my $good_probes;
39 : olson 1.2
40 : olson 1.3 if (open(PO, "<", $probe_occF))
41 : overbeek 1.1 {
42 : olson 1.3 while (<PO>)
43 : olson 1.2 {
44 : olson 1.3 if ($_ =~ /^(\S+)\t0\t/)
45 :     {
46 :     $good_probes->{$1} = 1;
47 :     }
48 : olson 1.2 }
49 : olson 1.3 close(PO);
50 :     }
51 :     else
52 :     {
53 :     warn "Cannot open $probe_occF: $!. Treating all probes as good.";
54 : overbeek 1.1 }
55 :    
56 :     my @keep;
57 : olson 1.2
58 :     my %pegs;
59 : olson 1.4 if (open(PP, "<", $probe_pegF))
60 : overbeek 1.1 {
61 : olson 1.4
62 :     while (<PP>)
63 :     {
64 :     if (($_ =~ /^(\S+)\t(\S+)/) && $ON{$1} && (!defined($good_probes) || $good_probes->{$2}))
65 :     {
66 :     push(@keep,"$2\t$1\t$ON{$1}");
67 :     $pegs{$1}++;
68 :     }
69 :     }
70 :     close(PP);
71 :    
72 :     open(PFILE, ">", $output_probesF) or die "cannot write $output_probesF: $!";
73 :    
74 :     foreach my $x (sort { my($a1,$a2) = ($a =~ /^(\d+)_(\d+)/);
75 :     my($b1,$b2) = ($b =~ /^(\d+)_(\d+)/);
76 :     ($a1 <=> $b1) or ($a2 <=> $b2) } @keep)
77 : overbeek 1.1 {
78 : olson 1.4 print PFILE "$x\n";
79 : overbeek 1.1 }
80 : olson 1.4 close(PFILE);
81 : overbeek 1.1 }
82 : olson 1.4 else
83 : overbeek 1.1 {
84 : olson 1.4 warn "Cannot open $probe_pegF: $!; using all pegs";
85 :     $pegs{$_}++ for keys %ON;
86 : overbeek 1.1 }
87 : olson 1.2
88 :     open(PFILE, ">", $output_pegsF) or die "cannot write $output_pegsF: $!";
89 : olson 1.4 for my $peg (sort { SeedUtils::by_fig_id($a, $b) } keys %pegs)
90 :     {
91 :     if ($known_pegs{$peg})
92 :     {
93 :     print PFILE "$peg\n";
94 :     }
95 :     }
96 : olson 1.2 close(PFILE);
97 : overbeek 1.1
98 :     __DATA__
99 :     Alanyl-tRNA synthetase (EC 6.1.1.7)
100 :     Arginyl-tRNA synthetase (EC 6.1.1.19)
101 :     Asparaginyl-tRNA synthetase (EC 6.1.1.22)
102 :     Aspartyl-tRNA synthetase (EC 6.1.1.12)
103 :     Cysteinyl-tRNA synthetase (EC 6.1.1.16)
104 :     DNA-directed RNA polymerase alpha subunit (EC 2.7.7.6)
105 :     DNA-directed RNA polymerase beta subunit (EC 2.7.7.6)
106 :     DNA-directed RNA polymerase beta' subunit (EC 2.7.7.6)
107 :     DNA-directed RNA polymerase omega subunit (EC 2.7.7.6)
108 :     Glutaminyl-tRNA synthetase (EC 6.1.1.18)
109 :     Glutamyl-tRNA synthetase (EC 6.1.1.17)
110 :     Glycyl-tRNA synthetase alpha chain (EC 6.1.1.14)
111 :     Glycyl-tRNA synthetase beta chain (EC 6.1.1.14)
112 :     Histidyl-tRNA synthetase (EC 6.1.1.21)
113 :     Isoleucyl-tRNA synthetase (EC 6.1.1.5)
114 :     LSU ribosomal protein L10p (P0)
115 :     LSU ribosomal protein L11p (L12e)
116 :     LSU ribosomal protein L13p (L13Ae)
117 :     LSU ribosomal protein L14p (L23e)
118 :     LSU ribosomal protein L15p (L27Ae)
119 :     LSU ribosomal protein L16p (L10e)
120 :     LSU ribosomal protein L17p
121 :     LSU ribosomal protein L18p (L5e)
122 :     LSU ribosomal protein L19p
123 :     LSU ribosomal protein L1p (L10Ae)
124 :     LSU ribosomal protein L20p
125 :     LSU ribosomal protein L21p
126 :     LSU ribosomal protein L22p (L17e)
127 :     LSU ribosomal protein L23p (L23Ae)
128 :     LSU ribosomal protein L24p (L26e)
129 :     LSU ribosomal protein L25p
130 :     LSU ribosomal protein L27p
131 :     LSU ribosomal protein L28p
132 :     LSU ribosomal protein L29p (L35e)
133 :     LSU ribosomal protein L2p (L8e)
134 :     LSU ribosomal protein L30p (L7e)
135 :     LSU ribosomal protein L31p
136 :     LSU ribosomal protein L32p
137 :     LSU ribosomal protein L33p
138 :     LSU ribosomal protein L34p
139 :     LSU ribosomal protein L35p
140 :     LSU ribosomal protein L36p
141 :     LSU ribosomal protein L3p (L3e)
142 :     LSU ribosomal protein L4p (L1e)
143 :     LSU ribosomal protein L5p (L11e)
144 :     LSU ribosomal protein L6p (L9e)
145 :     LSU ribosomal protein L7/L12 (L23e)
146 :     LSU ribosomal protein L9p
147 :     Leucyl-tRNA synthetase (EC 6.1.1.4)
148 :     Lysyl-tRNA synthetase (class II) (EC 6.1.1.6)
149 :     Methionyl-tRNA synthetase (EC 6.1.1.10)
150 :     Phenylalanyl-tRNA synthetase alpha chain (EC 6.1.1.20)
151 :     Phenylalanyl-tRNA synthetase beta chain (EC 6.1.1.20)
152 :     Prolyl-tRNA synthetase (EC 6.1.1.15)
153 :     SSU ribosomal protein S10p (S20e)
154 :     SSU ribosomal protein S11p (S14e)
155 :     SSU ribosomal protein S12p (S23e)
156 :     SSU ribosomal protein S13p (S18e)
157 :     SSU ribosomal protein S14p (S29e)
158 :     SSU ribosomal protein S15p (S13e)
159 :     SSU ribosomal protein S16p
160 :     SSU ribosomal protein S17p (S11e)
161 :     SSU ribosomal protein S18p
162 :     SSU ribosomal protein S19p (S15e)
163 :     SSU ribosomal protein S1p
164 :     SSU ribosomal protein S20p
165 :     SSU ribosomal protein S21p
166 :     SSU ribosomal protein S2p (SAe)
167 :     SSU ribosomal protein S3p (S3e)
168 :     SSU ribosomal protein S4p (S9e)
169 :     SSU ribosomal protein S5p (S2e)
170 :     SSU ribosomal protein S6p
171 :     SSU ribosomal protein S7p (S5e)
172 :     SSU ribosomal protein S8p (S15Ae)
173 :     SSU ribosomal protein S9p (S16e)
174 :     Seryl-tRNA synthetase (EC 6.1.1.11)
175 :     Threonyl-tRNA synthetase (EC 6.1.1.3)
176 :     Tryptophanyl-tRNA synthetase (EC 6.1.1.2) ## proteobacterial type
177 :     Tyrosyl-tRNA synthetase (EC 6.1.1.1)
178 :     Valyl-tRNA synthetase (EC 6.1.1.9)

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3