[Bio] / FigKernelPackages / RC.pm Repository:
ViewVC logotype

Annotation of /FigKernelPackages/RC.pm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.1 - (view) (download) (as text)

1 : efrank 1.1 package RC;
2 :    
3 :     use Carp;
4 :    
5 :     sub show_page {
6 :     my($cgi,$html) = @_;
7 :    
8 :     print $cgi->header;
9 :     print @$html;
10 :     }
11 :    
12 :    
13 :     sub make_table {
14 :     my($col_hdrs,$tab,$title) = @_;
15 :     my(@tab);
16 :    
17 :     push(@tab,"<table border><caption><b>$title</b></caption>\n");
18 :     push(@tab,"<tr><th>" . join("</th><th>",@$col_hdrs) . "</th></tr>\n");
19 :     foreach $_ (@$tab)
20 :     {
21 :     push(@tab,"<tr><td>" . join("</td><td>",@$_) . "</td></tr>\n");
22 :     }
23 :     push(@tab,"</table>\n");
24 :     return join("",@tab);
25 :     }
26 :    
27 :     sub same_func {
28 :     my($func1,$func2) = @_;
29 :     my(@ecs1,@ecs2,$ec,$func1n,$func2n);
30 :    
31 :     (defined($func1) && defined($func2)) || confess "func1=$func1 func2=$func2";
32 :    
33 :     if (&hypo($func1) )
34 :     {
35 :     return &hypo($func2);
36 :     }
37 :     elsif (&hypo($func2))
38 :     {
39 :     return 0;
40 :     }
41 :    
42 :     $func1n = &normalize($func1);
43 :     $func2n = &normalize($func2);
44 :     # print STDERR "$func1n\n$func2n\n";
45 :    
46 :     if ($func1n && $func2n &&
47 :     ((index($func1n,$func2n) > -1) ||
48 :     (index($func2n,$func1n) > -1)))
49 :     {
50 :     # print STDERR "same: $func1\t$func2\n";
51 :     return 1;
52 :     }
53 :    
54 :     @ecs1 = ($func1 =~ /\d+\.\d+\.\d+\.\d+/g);
55 :     foreach $ec (@ecs1)
56 :     {
57 :     if ($func2 !~ /\b$ec\b/)
58 :     {
59 :     return 0;
60 :     }
61 :     }
62 :    
63 :     @ecs2 = ($func2 =~ /\d+\.\d+\.\d+\.\d+/g);
64 :     foreach $ec (@ecs2)
65 :     {
66 :     if ($func1 !~ /\b$ec\b/)
67 :     {
68 :     return 0;
69 :     }
70 :     }
71 :    
72 :     if (@ecs1) { return 1; }
73 :    
74 :     # print STDERR "diff: $func1\t$func2\n";
75 :     return 0;
76 :     }
77 :    
78 :     sub normalize {
79 :     my($func) = @_;
80 :    
81 :     $func =~ s/[,\.\(\)\[\]\']//g;
82 :     $func = uc($func);
83 :     $func =~ s/SUBUNIT \S+//;
84 :     $func =~ s/\d+ kda? SUBUNIT//i;
85 :     $func =~ s/ SUBUNIT$//i;
86 :     $func =~ s/(PROBABLE|PUTATIVE|PRECURSOR|HOMOLOG|IMPORTED|PRIME)//i;
87 :     $func =~ s/^.*TRANSCRIPTION.*REGULAT.*$/transcription regulator/;
88 :     $func =~ s/SINGLE-STRANDED/SINGLE-STRAND/i;
89 :     $func =~ s/ */ /g;
90 :     $func =~ s/^\s+//;
91 :     $func =~ s/\s+$//;
92 :    
93 :     return $func;
94 :     }
95 :    
96 :     sub hypo {
97 :     my $x = (@_ == 1) ? $_[0] : $_[1];
98 :    
99 :     return ((! $x) ||
100 :     ($x =~ /hypoth/i) ||
101 :     ($x =~ /,.*genes/i) ||
102 :     ($x =~ /gene \d/i) ||
103 :     ($x =~ /\d{3}.pep/i) ||
104 :     ($x =~ /\bFROM\b/i) ||
105 :     ($x =~ /\bA\.L/i) ||
106 :     ($x =~ /\bA\d\d/i) ||
107 :     ($x =~ /^C$/i) ||
108 :     ($x =~ /^\([A-Z]+\d+\)$/) ||
109 :     ($x =~ /putative/i) ||
110 :     ($x =~ /tentative/i) ||
111 :     ($x =~ /predicted/i) ||
112 :     # ($x =~ /homolog/i) ||
113 :     ($x =~ /dna fragment/i) ||
114 :     ($x =~ /conserved protein\b/) ||
115 :     ($x =~ /^[XY]\d\S+/i) ||
116 :     ($x =~ /^[Yy][a-z]{2}[A-Z]/) ||
117 :     ($x =~ /^[Yy][A-Z]{3}\b/) ||
118 :     ($x =~ /weak similarity/i) ||
119 :     ($x =~ /similar to/i) ||
120 :     ($x =~ /gene product/i) ||
121 :     ($x =~ /ORF_/) ||
122 :     ($x =~ /NO SWISS-PROT/) ||
123 :     ($x =~ /predicted coding/i) ||
124 :     ($x =~ /predicted by/i) ||
125 :     ($x =~ /pct identical/i) ||
126 :     ($x =~ /\borf\d+/i) ||
127 :     ($x =~ /\bcosmid\d+\b/i) ||
128 :     ($x =~ /^[a-zA-Z0-9]+\d+[a-z]?$/i) ||
129 :     ($x =~ /^[a-zA-Z0-9]+[\.-]\d+[a-z]?$/i) ||
130 :     ($x =~ /^[a-zA-Z0-9]+[\.-]\d+[a-z]?\s+PROTEIN$/i) ||
131 :     ($x =~ /^cosmid\s+\S+$/i) ||
132 :     ($x =~ /^\([A-Z0-9]+\) [A-Z][a-z]{2}[a-zA-Z] \[\S+ \S+\]\s*$/) ||
133 :     ($x =~ /region orf/i) ||
134 :     ($x =~ /UNNAMED PROTEIN PRODUCT/) ||
135 :     ($x =~ /HYDROPHOBIC PROTEIN/) ||
136 :     ($x =~ /\bORF\b/i) ||
137 :     ($x =~ /protein similarity/) ||
138 :     ($x =~ /Uncharacterized/) ||
139 :     ($x =~ /UNIDENTIFIED/) ||
140 :     ($x =~ /belongs to the family/) ||
141 :     ($x =~ /predicted protein/) ||
142 :     ($x =~ /1-EVIDENCE=PREDICTED BY MATCH/) ||
143 :     ($x =~ /INTERGENIC REGION/) ||
144 :     ($x =~ /NO SWISS-PROT SIMILARITIES/) ||
145 :     ($x =~ /no known similarities/) ||
146 :     ($x =~ /alternate gene name/) ||
147 :     ($x =~ /alternate open reading frame/) ||
148 :     ($x =~ /similar to GenBank Accession Number/) ||
149 :     ($x =~ /family with/) ||
150 :     ($x =~ /No definition/) ||
151 :     ($x =~ /id:/i) ||
152 :     ($x =~ /cDNA/) ||
153 :     ($x =~ /SP:/) ||
154 :     ($x =~ /COMPLETE CDS/) ||
155 :     ($x =~ /GENE CLUSTER/) ||
156 :     ($x =~ /\dp,Lp/) ||
157 :     ($x =~ /3\' END/) ||
158 :     ($x =~ /START CODON/) ||
159 :     ($x =~ /_\S+_/) ||
160 :     ($x =~ /GTG START/i) ||
161 :     ($x =~ /TTG START/i) ||
162 :     ($x =~ /chain length determinant/i) ||
163 :     ($x =~ /f135/i) ||
164 :     ($x =~ /KDA PROTEIN/i) ||
165 :     ($x =~ /yole/i) ||
166 :     ($x =~ /\bMAP\b/) ||
167 :     ($x =~ /\(\d+-\d+\)/i) ||
168 :     ($x =~ /D9719.36p/i) ||
169 :     ($x =~ /THYMOCYTE PROTEIN CTHY28KD/i) ||
170 :     ($x =~ /PHAC1, PHAC2 AND PHAD GENES/i) ||
171 :     ($x =~ /OR23peptide/i) ||
172 :     ($x =~ /\(AE/i) ||
173 :     ($x =~ /Bem3p,Lph12p/i) ||
174 :     ($x =~ /Rlm1p,Lpg19p/i) ||
175 :     ($x =~ /unknown/i));
176 :     }
177 :    
178 :     sub check_sum {
179 :     my($file) = @_;
180 :    
181 :     my @tmp = `cksum $file`;
182 :     $tmp[0] =~ /^(\d+\s+\d+)/;
183 :     return $1;
184 :     }
185 :    
186 :     1

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3