[Bio] / FigKernelPackages / Assignments.pm Repository:
ViewVC logotype

Annotation of /FigKernelPackages/Assignments.pm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.8 - (view) (download) (as text)

1 : olson 1.4 #
2 :     # Copyright (c) 2003-2006 University of Chicago and Fellowship
3 :     # for Interpretations of Genomes. All Rights Reserved.
4 :     #
5 :     # This file is part of the SEED Toolkit.
6 :     #
7 :     # The SEED Toolkit is free software. You can redistribute
8 :     # it and/or modify it under the terms of the SEED Toolkit
9 :     # Public License.
10 :     #
11 :     # You should have received a copy of the SEED Toolkit Public License
12 :     # along with this program; if not write to the University of Chicago
13 :     # at info@ci.uchicago.edu or the Fellowship for Interpretation of
14 :     # Genomes at veronika@thefig.info or download a copy from
15 :     # http://www.theseed.org/LICENSE.TXT.
16 :     #
17 :    
18 : overbeek 1.1 package Assignments;
19 :    
20 :     use Carp;
21 :     use Data::Dumper;
22 :     use FIG;
23 :     use SameFunc;
24 :    
25 :     sub default_parms {
26 :    
27 :     my $x = <<END
28 :     genome 198214.1 4 Shigella flexneri 2a str. 301
29 :     genome 198215.1 4 Shigella flexneri 2a str. 2457T
30 :     genome 216598.1 4 Shigella dysenteriae M131649
31 :     genome 216599.1 4 Shigella sonnei 53G
32 :     genome 630.2 4 Yersinia enterocolitica 8081
33 :     genome 633.2 4 Yersinia pseudotuberculosis (Livermore)
34 :     genome 187410.1 4 Yersinia pestis KIM
35 :     genome 214092.1 4 Yersinia pestis CO92
36 :     genome 229193.1 4 Yersinia pestis biovar Medievalis str. 91001
37 :     genome 273123.1 4 Yersinia pseudotuberculosis IP 32953
38 :     genome 594.1 4 Salmonella enterica subsp. enterica serovar Gallinarum
39 :     genome 99287.1 4 Salmonella typhimurium LT2
40 :     genome 119912.1 4 Salmonella enterica serovar Choleraesuis SC-B67
41 :     genome 209261.1 4 Salmonella enterica subsp. enterica serovar Typhi Ty2
42 :     genome 220341.1 4 Salmonella enterica subsp. enterica serovar Typhi str. CT18
43 :     genome 83333.1 4 Escherichia coli K12
44 :     genome 83334.1 4 Escherichia coli O157:H7
45 :     genome 155864.1 4 Escherichia coli O157:H7 EDL933
46 :     genome 199310.1 4 Escherichia coli CFT073
47 :     genome 216592.1 4 Escherichia coli 042
48 :     genome 216593.1 4 Escherichia coli E2348/69
49 :     genome 192222.1 4 Campylobacter jejuni subsp. jejuni NCTC 11168
50 :     genome 224308.1 2 Bacillus subtilis subsp. subtilis str. 168
51 :     external sp 4
52 : overbeek 1.3 external uni 1.3
53 : overbeek 1.1 external kegg 1
54 : overbeek 1.8 subsystems trusted 20
55 : overbeek 1.3 ABC_transporter_alkylphosphonate_(TC_3.A.1.9.1) master:MattC
56 :     ABC_transporter_arabinose_(TC_3.A.1.2.2) master:MattC
57 :     ABC_transporter_branched-chain_amino_acid_(TC_3.A.1.4.1) master:MattC
58 :     ABC_transporter_dipeptide_(TC_3.A.1.5.2) master:MattC
59 :     ABC_transporter_ferric_enterobactin_(TC_3.A.1.14.2) master:MattC
60 :     ABC_transporter_ferrichrome_(TC_3.A.1.14.3) master:MattC
61 :     ABC_transporter_galactose_(TC_3.A.1.2.3) master:MattC
62 :     ABC_transporter_glutamate_aspartate_(TC_3.A.1.3.4) master:MattC
63 :     ABC_transporter_glutamine_(TC_3.A.1.3.2) master:MattC
64 :     ABC_transporter_glycerol_(TC_3.A.1.1.3) master:MattC
65 :     ABC_transporter_heme_(TC3.A.1.107.1) master:MattC
66 :     ABC_transporter_histidine_lysine_arginine_ornithine_(TC_3.A.1.3.1) master:MattC
67 :     ABC_transporter_iron(III)_dicitrate_(TC_3.A.1.14.1) master:MattC
68 : overbeek 1.8 ABC_transporter_Iron_(II)_and_Manganese master:JenZ
69 : overbeek 1.3 ABC_transporter_L-proline_glycine_betaine_(TC_3.A.1.12.1) master:MattC
70 :     ABC_transporter_macrolide master:MattC
71 :     ABC_transporter_maltose master:MattC
72 :     ABC_transporter_molybdenum_(TC_3.A.1.8.1) master:MattC
73 :     ABC_transporter_nickel_(TC_3.A.1.5.3) master:MattC
74 :     ABC_transporter_oligopeptide_(TC_3.A.1.5.1) master:MattC
75 :     ABC_transporter_peptide_(TC_3.A.1.5.5) master:MattC
76 :     ABC_transporter_phosphate_(TC_3.A.1.7.1) master:MattC
77 :     ABC_transporter_polyamine_putrescine_spermidine_(TC_3.A.1.11.1) master:MattC
78 :     ABC_transporter_putrescine_(TC_3.A.1.11.2) master:MattC
79 :     ABC_transporter_ribose_(TC_3.A.1.2.1) master:MattC
80 :     ABC_transporter_tungstate_(TC_3.A.1.6.2) master:gjo
81 :     Accessory_Gene_Regulator master:jcassat
82 : overbeek 1.8 Adhesion_of_Campylobacter master:OlgaZ
83 :     Aerobactin_siderophore_biosynthesis master:JenZ
84 : overbeek 1.3 Alanine_Biosynthesis master:Straw
85 :     Alkanesulfonate_assimilation master:OlgaV
86 :     Alkanesulfonates_Utilization master:RobE
87 :     Allantoin_degradation master:MattC
88 :     Ammonia_assimilation master:EdF
89 :     Anaerobic_respiratory_reductases master:OlgaV
90 :     Anthracycline_biosynthesis master:OlgaV
91 : overbeek 1.8 Archease master:gjo
92 :     Arginine_Biosynthesis master:RickS
93 : overbeek 1.3 Arginine_Putrescine_and_4-aminobutyrate_degradation master:MattC
94 :     Aromatic_Amin_Catabolism master:OlgaV
95 :     Aromatic_amino_acid_degradation master:OlgaV
96 : overbeek 1.8 Arsenic_resistance master:JenZ
97 : overbeek 1.3 Asp-Glu-tRNA(Asn-Gln)_transamidation master:gjo
98 :     Bacterial_Cell_Division master:RickS
99 :     Bacterial_Chemotaxis master:RickS
100 : overbeek 1.8 Bacteriocin-like_peptides_Blp master:RamyA
101 : overbeek 1.3 Benzoate_degradation master:OlgaV
102 :     Betaine_biosynthesis master:MattC
103 : overbeek 1.8 Biogenesis_of_c-type_cytochromes master:SvetaG
104 :     Biogenesis_of_cbb3-type_cytochrome_c_oxidases master:SvetaG
105 : overbeek 1.3 Biotin_biosynthesis master:rodionov
106 :     Biphenyl_Degradation master:OlgaV
107 :     Branched-Chain_Amino_Acid_Biosynthesis master:RossO
108 : overbeek 1.8 Butanol_Biosynthesis master:RickS
109 :     Campylobacter_Iron_Metabolism master:OlgaZ
110 : overbeek 1.3 Capsular_heptose_biosynthesis master:OlgaZ
111 :     Capsular_polysaccharide_biosynthesis_in_Staphylococcus master:JenZ
112 : overbeek 1.8 Capsular_Polysaccharide_Biosynthesis_in_Vibrio master:JenZ
113 : overbeek 1.3 Capsular_surface_virulence_antigen_loci master:JenZ
114 :     Carbon_monoxide_dehydrogenases master:rodionov
115 :     carnitine_metabolism master:MattC
116 :     Catechol_branch_of_beta-ketoadipate_pathway master:OlgaV
117 :     CbiQO-type_ABC_transporter_systems master:rodionov
118 :     Central_meta-cleavage_pathway_of_aromatic_compound_degradation master:OlgaV
119 :     Chloroaromatic_degradation_pathway master:OlgaV
120 :     Cholera_toxin master:VeronikaV
121 :     Choline_Transport master:RobE
122 :     Chorismate_Synthesis master:VeronikaV
123 :     Clavulanic_acid_biosynthesis master:OlgaV
124 :     CMP-N-acetylneuraminate_Biosynthesis master:OlgaZ
125 : overbeek 1.8 Coagulation_cascade master:rodionov
126 : overbeek 1.3 Cobalamin_synthesis master:gjo
127 : overbeek 1.8 CobW master:vcrecy
128 : overbeek 1.3 Coenzyme_A_Biosynthesis master:AndreiO
129 :     Coenzyme_F420-H2_dehydrogenase_(methanophenazine) master:gjo
130 :     Coenzyme_F420_hydrogenase master:gjo
131 :     Coenzyme_F420_synthesis master:gjo
132 :     Coenzyme_PQQ_synthesis master:gjo
133 :     Colanic_acid_biosynthesis master:JenZ
134 : overbeek 1.8 Cyanate_hydrolysis master:gjo
135 : overbeek 1.3 Cyanobacterial_Circadian_Clock master:OlgaZ
136 : overbeek 1.8 Cytochrome_B6-F_complex master:SvetaG
137 : overbeek 1.3 Cytolethal_distending_toxin_of_Campylobacter_jejuni master:OlgaZ
138 : overbeek 1.8 Cytolysin_and_Lipase_operon_in_Vibrio master:JenZ
139 : overbeek 1.3 D-alanyl_lipoteichoic_acid_Biosynthesis master:OlgaZ
140 :     D-arabinose_degradation master:MattC
141 :     D-galactarate_degradation master:MattC
142 :     D-galacturonate_degradation master:MattC
143 :     D-tyrosyl-tRNA(Tyr)_deacylase master:gjo
144 :     De_Novo_Purine_Biosynthesis master:RossO
145 :     De_Novo_Pyrimidine_Synthesis master:RossO
146 :     Denitrification master:rodionov
147 : overbeek 1.8 Di-Inositol-Phosphate_biosynthesis master:rodionov
148 : overbeek 1.3 DNA-replication master:RickS
149 :     DNA_repair,_bacterial master:gjo
150 :     DNA_repair_and_recombination_eukaryotic master:gjo
151 : overbeek 1.8 DNA_replication,_archaeal master:gjo
152 :     DNA_structural_proteins,_bacterial master:gjo
153 :     DNA_topoisomerases master:gjo
154 :     DNA_topoisomerases,_Type_I,_ATP-independent master:gjo
155 :     DNA_topoisomerases,_Type_II,_ATP-dependent master:gjo
156 : overbeek 1.3 dTDP-rhamnose_synthesis master:MikeK
157 :     Embden-Meyerhof_and_Gluconeogenesis master:SvetaG
158 : overbeek 1.8 Energy-conserving_hydrogenase_(ferredoxin) master:gjo
159 : overbeek 1.3 Entner-Doudoroff_Pathway master:SvetaG
160 : overbeek 1.8 ESAT-6_proteins_secretion_system_in_Actinobacteria master:SvetaG
161 :     ESAT-6_proteins_secretion_system_in_Firmicutes master:SvetaG
162 : overbeek 1.3 Ethanolamine_utilization master:gjo
163 :     F0F1-type_ATP_synthase master:RickS
164 :     Fatty_Acid_Biosynthesis_FASII master:AndreiO
165 :     Fe-S_cluster_assembly master:rodionov
166 :     Fermentations:_Lactate master:SvetaG
167 :     Fermentations:_Mixed_acid master:SvetaG
168 :     Flagellum master:RickS
169 : overbeek 1.8 Flagellum_in_Campylobacter master:JenZ
170 : overbeek 1.3 FMN_and_FAD_biosynthesis master:AndreiO
171 :     Folate_Biosynthesis master:vcrecy
172 : overbeek 1.8 Formaldehyde_assimilation:_Ribulose_monophosphate_pathway master:SvetaG
173 : overbeek 1.3 Formate_dehydrogenase master:gjo
174 :     Formate_hydrogenase master:OlgaV
175 :     Glycerol_fermenation_to_1,3-propanediol master:gjo
176 :     Glycerolipid_and_glycerphospholipid_metabolism master:VasiliyP_UCSD
177 :     Glycine_reductase,_sarcosine_reductase_and_betaine_reductase master:gjo
178 :     Glycine_synthesis master:MikeK
179 :     Glyoxylate_Synthesis master:RickS
180 :     GroEL_GroES master:MikeK
181 :     Heme-bound_Iron_Scavenge_Pathway master:RickS
182 : overbeek 1.8 Hfl_operon master:gjo
183 : overbeek 1.3 Histidine_Biosynthesis master:RossO
184 :     Histidine_Degradation master:RossO
185 :     HMG_CoA_Synthesis master:VeronikaV
186 :     Homogentisate_pathway_of_aromatic_compound_degradation master:OlgaV
187 : overbeek 1.8 Hydantoin_metabolism master:OlgaV
188 : overbeek 1.3 Hydrogenases master:OlgaV
189 : overbeek 1.8 Hyperosmotic_ectoine_biosynthesis master:JenZ
190 : overbeek 1.3 Inositol_catabolism master:VeronikaV
191 : overbeek 1.8 Inteins master:gjo
192 : overbeek 1.3 Isoprenoid_Biosynthesis master:OlgaZ
193 :     KDO2-Lipid_A_biosynthesis master:OlgaZ
194 : overbeek 1.8 L-ascorbate_utilization_(and_related_gene_clusters) master:SvetaG
195 :     Lactate_utilization master:rodionov
196 :     Lactose_utilization master:gjo
197 : overbeek 1.3 Leucine_Degradation_and_HMG-CoA_Metabolism master:VeronikaV
198 :     Lipoic_acid_metabolism master:gjo
199 : overbeek 1.8 Lipopolysaccharide_biosynthesis_2 master:OlgaV
200 : overbeek 1.3 Listeria_Pathogenicity_Island_LIPI-1_extended master:SvetaG
201 :     Listeria_surface_proteins:_Internalin-like_proteins master:SvetaG
202 :     Listeria_surface_proteins:_LPXTG_motif master:SvetaG
203 :     LMPTP_YfkJ_cluster master:AndreiO
204 :     LMPTP_YwlE_cluster master:AndreiO
205 :     LOS_core_oligosaccharide_biosynthesis master:OlgaZ
206 :     Lysine_Biosynthesis_DAP_Pathway master:AndreiO
207 :     Malonate_decarboxylase master:VeronikaV
208 :     Mannose-sensitive_hemagglutinin_type_4_pilus master:RobE
209 :     Mannose_and_fructose_metabolism master:HanYuC_UCSD
210 :     Membrane-bound_Ni,_Fe-hydrogenase master:rodionov
211 :     Mercury_resistance_operon master:JenZ
212 :     Methanogenesis master:gjo
213 :     Methanogenesis_from_methylated_compounds master:gjo
214 :     Methanophenazine_hydrogenase master:gjo
215 : overbeek 1.8 Methicillin_resistance_in_Staphylococci master:SvetaG
216 : overbeek 1.3 Methionine_Biosynthesis master:rodionov
217 :     Methionine_Salvage master:gjo
218 :     MLST master:RobE
219 :     Molybdopterin_biosynthesis master:JenZ
220 : overbeek 1.8 Motility_of_Campylobacter master:OlgaZ
221 : overbeek 1.3 N-Acetyl-D-Glucosamine_Utilization master:OlgaZ
222 :     N-linked_Glycosylation_in_Bacteria master:OlgaZ
223 :     n-Phenylalkanoic_acid_degradation master:OlgaV
224 :     Na(+)-translocating_NADH-quinone_oxidoreductase_and_rnf-like_group_of_electron_transport_complexes master:OlgaV
225 :     NAD_and_NADP_cofactor_biosynthesis_global master:AndreiO
226 : overbeek 1.8 NAG_short master:rodionov
227 : overbeek 1.3 NiFe_hydrogenase_maturation master:gjo
228 :     Nitrate_and_nitrite_ammonification master:rodionov
229 :     Nitrosative_stress master:rodionov
230 : overbeek 1.8 Nudix_proteins_(nucleoside_triphosphate_hydrolases) master:gjo
231 : overbeek 1.3 NusA-TFII_Cluster master:gjo
232 : overbeek 1.8 One-carbon_metabolism_by_tetrahydropterines master:OlgaV
233 : overbeek 1.3 Osmotically_activated_L-carnitine_ABC_transporter_in_Listeria master:JenZ
234 :     Oxidative_stress master:OlgaV
235 :     p-Hydroxybenzoate_degradation master:OlgaV
236 :     Pentose_phosphate_pathway master:SvetaG
237 :     Peptidoglycan_Biosynthesis master:RickS
238 : overbeek 1.8 Peptidyl-prolyl_cis-trans_isomerase master:gjo
239 : overbeek 1.3 Phenylacetate_pathway_of_aromatic_compound_degradation master:OlgaV
240 :     Phenylalanine_synthesis master:MikeK
241 :     Phenylpropionate_Degradation master:OlgaV
242 : overbeek 1.8 Phosphorylcholine_incorporation_in_LPS master:OlgaZ
243 : overbeek 1.3 Phosphotransferase_enzyme_II_-_Glucose_class_permease master:JenZ
244 :     Phosphotransferase_enzyme_II_-_Lactose_class_permease master:JenZ
245 :     Phosphotransferase_enzyme_II_-_Mannitol_class_permease master:JenZ
246 :     Phosphotransferase_enzyme_II_-_Mannose_family_permease master:JenZ
247 :     Photosystem_I master:SvetaG
248 :     Photosystem_II master:SvetaG
249 : overbeek 1.8 PnuC-like_transporters master:rodionov
250 : overbeek 1.3 Polyadenylation_bacterial master:gjo
251 : overbeek 1.8 Polyhydroxybutyrate_metabolism master:OlgaV
252 : overbeek 1.3 Porphyrin,_Heme,_and_Siroheme_Biosynthesis master:SvetaG
253 :     ppGpp_biosynthesis master:MikeK
254 : overbeek 1.8 Proline_reductase master:gjo
255 : overbeek 1.3 Proline_Synthesis master:RickS
256 :     Propanediol_utilization master:gjo
257 :     Prophage-encoded_Exotoxins master:RamyA
258 :     Proteasome_archaeal master:gjo
259 :     Proteasome_eukaryotic master:gjo
260 :     Protein_degradation master:gjo
261 :     Protocatechuate_branch_of_beta-ketoadipate_pathway master:OlgaV
262 :     Pterin_biosynthesis master:vcrecy
263 :     Purine_conversions master:OlgaV
264 : overbeek 1.8 Purine_Utilization master:OlgaV
265 :     Putative_sulfate_assimilation_cluster master:OlgaV
266 :     Pyridoxin_(Vitamin_B6)_Biosynthesis master:OlgaZ
267 : overbeek 1.3 Pyruvate:ferredoxin_oxidoreductase master:SvetaG
268 :     Pyruvate_Alanine_Serine_Interconversions master:JasonS_UCSD
269 :     Pyruvate_metabolism_I:_anaplerotic_reactions,_PEP master:SvetaG
270 : overbeek 1.8 Pyruvate_metabolism_II:_acetyl-CoA,_acetogenesis_from_pyruvate master:SvetaG
271 : overbeek 1.3 Queuosine-Archaeosine_Biosynthesis master:vcrecy
272 :     Quorum_Sensing:_Autoinducer-2_Synthesis master:AndrewJ
273 :     Respiratory_Complex_I master:OlgaV
274 :     Respiratory_dehydrogenases_1 master:OlgaV
275 :     Riboflavin_metabolism master:rodionov
276 :     Ribonuclease_P_archaeal_and_eukaryal master:gjo
277 :     Ribonucleotide_reduction master:rodionov
278 :     Ribosome_biogenesis_bacterial master:gjo
279 :     Ribosome_LSU_bacterial master:gjo
280 :     Ribosome_LSU_chloroplast master:gjo
281 :     Ribosome_LSU_eukaryotic_and_archaeal master:gjo
282 :     Ribosome_LSU_mitochondrial master:gjo
283 :     Ribosome_SSU_bacterial master:gjo
284 :     Ribosome_SSU_chloroplast master:gjo
285 :     Ribosome_SSU_eukaryotic_and_archaeal master:gjo
286 :     Ribosome_SSU_mitochondrial master:gjo
287 : overbeek 1.8 RNA_3'-terminal_phosphate_cyclase master:gjo
288 : overbeek 1.3 RNA_polymerase_archaeal master:gjo
289 :     RNA_polymerase_archaeal_initiation_factors master:gjo
290 :     RNA_polymerase_bacterial master:gjo
291 :     RNA_polymerase_chloroplast master:gjo
292 :     RNA_polymerase_I master:gjo
293 :     RNA_polymerase_II master:gjo
294 :     RNA_polymerase_II_initiation_factors master:gjo
295 :     RNA_polymerase_III master:gjo
296 :     Rrf2_family_transcriptional_regulators master:rodionov
297 : overbeek 1.8 SA:14-24 master:RossO
298 : overbeek 1.3 Salicylate_ester_degradation master:OlgaV
299 :     Selenocysteine_metabolism master:gjo
300 : overbeek 1.8 Serine-glyoxylate_cycle master:OlgaV
301 : overbeek 1.3 Serine_Biosynthesis master:MikeK
302 : overbeek 1.8 Sialic_Acid_Metabolism master:OlgaZ
303 : overbeek 1.3 Sodium_Hydrogen_Antiporter master:JenZ
304 :     Soluble_cytochromes_and_functionally_related_electron_carriers master:OlgaV
305 :     SpeB-SpeF_extended_regulon master:RamyA
306 :     Spliceosome master:gjo
307 :     Spore_Coat master:RickS
308 :     Streptococcal_Mga_Regulon master:RamyA
309 : overbeek 1.8 Streptococcus_pneumoniae_Vancomycin_Tolerance_Locus master:RamyA
310 :     Streptococcus_pyogenes_recombinatorial_zone master:RamyA
311 : overbeek 1.3 Streptococcus_pyogenes_Virulome master:RamyA
312 :     Streptolysin_S_Biosynthesis_and_Transport master:RamyA
313 :     Streptomycin_biosynthesis master:OlgaV
314 :     Succinate_dehydrogenase master:OlgaV
315 : overbeek 1.8 Sugar-phosphate_stress_regulation master:gjo
316 : overbeek 1.3 Sulfate_to_Sulfide master:RobE
317 :     Taurine_Utilization master:RobE
318 :     TCA_Cycle master:OlgaV
319 : overbeek 1.8 Teichoic_and_lipoteichoic_acids_biosynthesis master:OlgaV
320 :     Teichuronic_acid_biosynthesis master:OlgaV
321 : overbeek 1.3 Terminal_cytochrome_C_oxidases master:OlgaV
322 :     Terminal_cytochrome_oxidases master:OlgaV
323 : overbeek 1.8 Tetrathionate_respiration master:gjo
324 : overbeek 1.3 The_Tartronate_Semialdehyde_Hub master:RossO
325 :     Thiamin_biosynthesis master:rodionov
326 :     Thioredoxin-disulfide_reductase master:gjo
327 :     Threonine_degradation master:OlgaV
328 :     Threonine_synthesis master:MikeK
329 :     Transcription_factors_bacterial master:gjo
330 :     Transcription_factors_cyanobacterial_RpoD-like_sigma_factors master:gjo
331 :     Translation_elongation_factors_eukaryotic_and_archaeal master:gjo
332 :     Translation_factors_bacterial master:gjo
333 :     Translation_initiation_factors_eukaryotic_and_archaeal master:gjo
334 :     Transport_of_Nickel_and_Cobalt master:rodionov
335 :     Tricarballylate_Utilization master:RossO
336 :     tRNA_aminoacylation master:gjo
337 :     tRNA_aminoacylation,_mitochondrial master:gjo
338 :     tRNA_processing master:gjo
339 :     tRNA_splicing master:gjo
340 :     Tryptophan_synthesis master:VeronikaV
341 : overbeek 1.8 Two-component_regulatory_systems_in_Campylobacter master:OlgaZ
342 : overbeek 1.3 Tyrosine_synthesis master:MikeK
343 :     Ubiquinone_Biosynthesis master:OlgaZ
344 :     Ubiquinone_Menaquinone-cytochrome_c_reductase_complexes master:OlgaV
345 :     UDP-N-acetylmuramate_from_Fructose-6-phosphate_Biosynthesis master:vasiliyP
346 :     Universal_GTPases master:gjo
347 :     Urea_decomposition master:rodionov
348 :     Utilization_of_glutathione_as_a_sulphur_source master:OlgaV
349 :     V-Type_ATP_synthase master:RickS
350 : overbeek 1.8 Vibrio_pathogenicity_island master:JenZ
351 :     Wyeosine-MimG_Biosynthesis master:vcrecy
352 :     Xylose_utilization master:rodionov
353 :     yrdC master:vcrecy
354 : overbeek 1.1 //
355 :     END
356 :     ;
357 : overbeek 1.2 return split(/\n/,$x);
358 : overbeek 1.1 }
359 :    
360 : overbeek 1.3
361 : overbeek 1.1 sub choose_best_assignment {
362 :     my($fig,$parms,$pegs,$external_ids) = @_;
363 :     my($peg,$id);
364 :    
365 :     my $functions = {};
366 :     foreach $peg (@$pegs)
367 :     {
368 :     &load_peg_function($fig,$parms,$peg,$functions);
369 :     }
370 :    
371 :     foreach $id (@$external_ids)
372 :     {
373 :     &load_ext_function($fig,$parms,$id,$functions);
374 :     }
375 :    
376 :     return &cleanup(&pick_function($fig,$parms,$functions));
377 :     }
378 :    
379 :    
380 :     sub cleanup {
381 :     my($func) = @_;
382 :    
383 :     if (! $func) { return "hypothetical protein" }
384 :     if ($func =~ /^hypothetical (\S+ )?protein .*$/i) { return "hypothetical protein" }
385 :     if ($func =~ /^[a-zA-Z]{1,2}\d{2,5}( protein)?$/i) { return "hypothetical protein" }
386 : overbeek 1.5 if ($func =~ /^similar to ORF\d+$/) { return "hypothetical protein" }
387 :     if ($func =~ /^(Alr|As|All|Tlr|Tll|Glr|Blr|Slr|SEW|pANL)\d+( protein)?$/i) { return "hypothetical protein" }
388 : overbeek 1.6 if ($func =~ /^\d{5}/) { return "hypothetical protein" }
389 : overbeek 1.5 if ($func =~ /unknown protein/) { return "hypothetical protein" }
390 :    
391 : overbeek 1.1 return $func;
392 :     }
393 :    
394 :     sub pick_function {
395 :     my($fig,$parms,$functions) = @_;
396 :     my($set,$score,$best_source,$poss_function);
397 :     my(@scored);
398 :    
399 :     my @partitions = &SameFunc::group_funcs(keys(%$functions));
400 :     if ($ENV{'VERBOSE'}) { print STDERR "partition: ",&Dumper(\@partitions,$functions); }
401 :    
402 :     foreach $set (@partitions)
403 :     {
404 :     $score = &score_set($set,$functions);
405 :     # print STDERR &Dumper([$score,$set]);
406 :    
407 :     # print STDERR "picking from set ",&Dumper($set);
408 :     ($poss_function,$best_source) = &pick_specific($fig,$parms,$set,$functions);
409 : overbeek 1.7 # print STDERR "picked $poss_function from $best_source\n";
410 : overbeek 1.1 push(@scored,[$score,$poss_function,$best_source]);
411 :     }
412 :     @scored = sort { $b->[0] <=> $a->[0] } @scored;
413 :    
414 :     if ((@scored > 1) && $ENV{'VERBOSE'})
415 :     {
416 :     foreach $_ (@scored)
417 :     {
418 :     print STDERR join("\t",@$_),"\n";
419 :     }
420 :     print STDERR "//\n";
421 :     }
422 :     return (@scored > 0) ? $scored[0]->[1] : "";
423 :     }
424 :    
425 :     sub score_set {
426 :     my($set,$functions) = @_;
427 :     my($func,$x);
428 :    
429 :     my $score = 0;
430 :     foreach $func (@$set)
431 :     {
432 :     if ($x = $functions->{$func})
433 :     {
434 :     foreach $_ (@$x)
435 :     {
436 :     $score += $_->[0];
437 :     }
438 :     }
439 :     }
440 :     return $score;
441 :     }
442 :    
443 :     sub pick_specific {
444 :     my($fig,$parms,$set,$functions) = @_;
445 :     my($best_func,$best_score,$func,$x,$best_source);
446 :    
447 :     $best_func = "";
448 : overbeek 1.7 $best_score = 0;
449 : overbeek 1.1 $best_source = "";
450 :    
451 :     foreach $func (@$set)
452 :     {
453 :     if ($x = $functions->{$func})
454 :     {
455 :     my $incr = @$x;
456 :     foreach $_ (@$x)
457 :     {
458 : overbeek 1.3 my($sc,$peg,$in_sub) = @$_;
459 :     $sc += $in_sub ? 10000 : 0;
460 :    
461 :     if (((100 * $sc) + $incr) > $best_score)
462 : overbeek 1.1 {
463 : overbeek 1.3 $best_score = (100 * $sc) + $incr;
464 : overbeek 1.1 $best_func = $func;
465 : overbeek 1.3 $best_source = $peg;
466 : overbeek 1.1 }
467 :     }
468 :     }
469 :     }
470 :     if ($ENV{'VERBOSE'}) { print STDERR &Dumper(["picked best source",$set,$functions,$best_func,$best_source]) }
471 :     return ($best_func,$best_source);
472 :     }
473 :    
474 :     sub load_ext_function {
475 :     my($fig,$parms,$id,$functions) = @_;
476 :    
477 :     my $func = $fig->function_of($id);
478 :     if ($func && # (! &FIG::hypo($func)) &&
479 :     ($id =~ /^([A-Za-z]{2,4})\|/) && ($_ = $parms->{'external'}->{$1}))
480 :     {
481 :     push(@{$functions->{$func}},[$_,$id]);
482 :     }
483 :     }
484 :    
485 :     sub load_peg_function {
486 :     my($fig,$parms,$peg,$functions) = @_;
487 :    
488 :     my $func = $fig->function_of($peg);
489 :     if ($func) # (! &FIG::hypo($func))
490 :     {
491 :     my $value = 1;
492 :    
493 :     my $genome = &FIG::genome_of($peg);
494 :     if ($_ = $parms->{'genome'}->{$genome})
495 :     {
496 :     $value += $_;
497 :     }
498 :    
499 :     my $subv = 0;
500 :     my @subs = $fig->peg_to_subsystems($peg);
501 :     my $sub;
502 : overbeek 1.3 my $in_sub = 0;
503 : overbeek 1.1 foreach $sub (@subs)
504 :     {
505 : overbeek 1.3 if ($_ = $parms->{'subsystems'}->{$sub})
506 : overbeek 1.1 {
507 : overbeek 1.3 if ($_ > $subv)
508 :     {
509 :     $subv = $_;
510 :     }
511 :     $in_sub = 1;
512 : overbeek 1.1 }
513 :     }
514 :     $value += $subv;
515 : overbeek 1.3 push(@{$functions->{$func}},[$value,$peg,$in_sub]);
516 : overbeek 1.1 }
517 :     }
518 :    
519 :     sub equivalent_ids {
520 :     my($fig,$parms,$pegs) = @_;
521 :     my($peg,@aliases,$alias,%external_ids,%pegs,$tuple);
522 :    
523 :     foreach $peg (@$pegs)
524 :     {
525 :     $pegs{$peg} = 1;
526 :     @aliases = $fig->feature_aliases($peg);
527 :     foreach $alias (@aliases)
528 :     {
529 :     if (($alias =~ /^([A-Za-z]{2,4})\|\S+$/) && $parms->{"external"}->{$1})
530 :     {
531 :     $external_ids{$alias} = 1;
532 :     }
533 :     }
534 :     foreach $tuple ($fig->mapped_prot_ids($peg))
535 :     {
536 : overbeek 1.8 if (($tuple->[0] =~ /^fig\|/) && $fig->is_real_feature($tuple->[0]))
537 : overbeek 1.1 {
538 :     $pegs{$tuple->[0]} = 1;
539 :     }
540 :     elsif (($tuple->[0] =~ /^([A-Za-z]{2,4})\|\S+$/) && $parms->{"external"}->{$1})
541 :     {
542 :     $external_ids{$tuple->[0]} = 1;
543 :     }
544 :     }
545 :     }
546 :     return ([sort { &FIG::by_fig_id($a,$b) } keys(%pegs)],[sort keys(%external_ids)]);
547 :     }
548 :    
549 :     sub load_parms {
550 :     my($parmsF) = @_;
551 :     my @parmsS;
552 :    
553 :     my $wts = {};
554 :    
555 :     if ($parmsF)
556 :     {
557 :     @parmsS = `cat $parmsF`;
558 :     }
559 :     else
560 :     {
561 :     @parmsS = &default_parms;
562 :     }
563 :     while ($_ = shift @parmsS)
564 :     {
565 :     chomp;
566 :     my($type,$data,$val) = split(/\t/,$_);
567 :     if ($type eq 'subsystems')
568 :     {
569 :     my $x;
570 :     while (($x = shift @parmsS) && ($x !~ /^\/\//))
571 :     {
572 :     if ($x =~ /^(\S[^\t]+\S)/)
573 :     {
574 :     $wts->{$type}->{$1} = $val;
575 :     }
576 :     }
577 :     }
578 :     else
579 :     {
580 :     $wts->{$type}->{$data} = $val;
581 :     }
582 :     }
583 :     return $wts;
584 :     }
585 :    
586 :     sub print_parms {
587 :     my($parms) = @_;
588 :     my($type,$data,$val,$wt_by_type);
589 :    
590 :     print STDERR "Parameters:\n";
591 :     foreach $type (sort keys(%$parms))
592 :     {
593 :     print STDERR "\n\t$type\n";
594 :     $wt_by_type = $parms->{$type};
595 :     foreach $data (sort keys(%$wt_by_type))
596 :     {
597 :     $val = $wt_by_type->{$data};
598 :     print STDERR "\t\t$data\t$val\n";
599 :     }
600 :     }
601 :     print STDERR "\n";
602 :     }
603 :    
604 :    
605 :     1;

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3