[Bio] / FigKernelScripts / seed2tbl.pl Repository:
ViewVC logotype

Annotation of /FigKernelScripts/seed2tbl.pl

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.3 - (view) (download) (as text)

1 : bartels 1.1 #!/usr/bin/env perl
2 :    
3 :     use Getopt::Std;
4 :     use strict;
5 :     use warnings;
6 :     use Data::Dumper;
7 :     use FIGV;
8 :     use Carp;
9 :    
10 : bartels 1.2 our ( $opt_o, $opt_s, $opt_l, $opt_p, $opt_i, $opt_r, $opt_e, $opt_x, $opt_a );
11 :     getopts( 'o:s:l:p:i:r:e:x:a:' );
12 : bartels 1.1
13 :    
14 :     #my %preimages_of;
15 :     my %images_of;
16 :    
17 :     ###################
18 :     # view the inputs #
19 :     ###################
20 :    
21 :     #* org_dir *#
22 :     my $org_dir = $opt_o;
23 :     if ( !( -d $org_dir) ) {
24 :     &usage;
25 :     die "No orgdir $org_dir\n";
26 :     }
27 :     my $fig = FIGV->new($org_dir);
28 :    
29 :     #* submitter id *#
30 :     my $submitter_ID = $opt_s;
31 :     if ( !defined( $submitter_ID ) ) {
32 :     &usage;
33 :     die "No submitter ID given\n";
34 :     }
35 :    
36 :     #* pseudo genes *#
37 :     my $pseudo_list;
38 :     if ( defined( $opt_p ) ) {
39 :     $pseudo_list = load_pseudo_list( $opt_p );
40 :     }
41 :    
42 : bartels 1.2 #* partial genes *#
43 :     my $partial_list;
44 :     if ( defined( $opt_a ) ) {
45 :     $partial_list = load_partial_list( $opt_a );
46 :     }
47 :    
48 : bartels 1.1 #* locus tag prefix *#
49 :     my $locus_tag_prefix = $opt_l;
50 :     if ( !defined( $locus_tag_prefix ) ) {
51 :     &usage;
52 :     die "No locus tag prefix given\n";
53 :     }
54 :    
55 :     #* prot ID prefix *#
56 :     my $prot_ID_prefix = $opt_i;
57 :     if ( !defined( $prot_ID_prefix ) ) {
58 : bartels 1.2 $prot_ID_prefix = $locus_tag_prefix;
59 : bartels 1.1 }
60 :    
61 :     #* bad ECs file *#
62 :     my $bad_ECs_file = $opt_e;
63 :     if ( !defined( $bad_ECs_file ) ) {
64 :     $bad_ECs_file = 'ECs_deleted_and_transferred.txt';
65 :     }
66 :    
67 :     #* results file *#
68 :     my $res_file = $opt_r;
69 :     if ( !defined( $res_file ) ) {
70 :     &usage;
71 :     die "No output file given\n";
72 :     }
73 :     #* xls file *#
74 :     my $xls_log_file = $opt_x;
75 :     if ( !defined( $xls_log_file ) ) {
76 :     $xls_log_file = $res_file;
77 :     $xls_log_file =~ s/\.tbl/\.xls/;
78 :     }
79 :    
80 :     open ( RES, ">$res_file" ) or die "can't open $res_file!\n";
81 :     open ( XLS_LOG, qq(>$xls_log_file)) || die qq(Could not write-open $xls_log_file);
82 :    
83 :     ###############################################
84 :     # load hashes for keep caps and special cases #
85 :     ###############################################
86 :     my $keep_caps = &load_keep_caps;
87 :     my $special_cases = &load_special_cases();
88 :     my $map_EC_to = &load_bad_EC_numbers( $bad_ECs_file );
89 :    
90 :     ##################
91 :     # Some Constants #
92 :     ##################
93 :    
94 :     use constant ENTRY => 0;
95 :     use constant FILE => 1;
96 :     use constant FID => 2;
97 :     use constant LOCUS => 3;
98 :     use constant CONTIG => 4;
99 :     use constant START => 5;
100 :     use constant STOP => 6;
101 :     use constant LEN => 7;
102 :     use constant STRAND => 8;
103 :     use constant FUNC => 9;
104 :    
105 :     #################################
106 :     # load sequences for the genome #
107 :     #################################
108 :     my $contigs_file = "$org_dir/contigs";
109 :     my ($seq_of, $len_of) = &load_contigs($contigs_file);
110 :    
111 :     ##################
112 :     # load tbl files #
113 :     ##################
114 :     my @tbl_files;
115 :     my $tmp = "$org_dir/Features/rna/tbl";
116 :     if (-s $tmp) { push @tbl_files, $tmp; } else { push @tbl_files, "/dev/null"; }
117 :    
118 :     $tmp = "$org_dir/Features/peg/tbl";
119 :     if (-s $tmp) { push @tbl_files, $tmp; } else { die "PEG tbl file $tmp does not exist"; }
120 :    
121 :     my $tbl = &load_tbls(@tbl_files);
122 :    
123 :     ##################
124 :     # load functions #
125 :     ##################
126 :     my %func_of = map { chomp; m/^(\S+)\t(.*)$/o ? ($1 => $2) : () } `cat $org_dir/assigned_functions`;
127 :    
128 :    
129 :     ##############################################
130 :     # Now start the process - go through contigs #
131 :     ##############################################
132 :    
133 :     my $done_fids;
134 :     foreach my $contig_id (sort keys %$seq_of) {
135 :     print RES ">Feature\t$contig_id\n";
136 :    
137 :     my $contig_features = $tbl->{ $contig_id };
138 :     foreach my $entry ( @$contig_features ) {
139 :     # this was put in for pseudogenes, where the second/following
140 :     # part is already part of the pseudogene
141 :     next if $done_fids->{ $entry->[FID] };
142 :    
143 :     # get entry type
144 :     my $type = &type_of( $entry );
145 :     if ( !defined( $type ) ) {
146 :     die ( qq(aborting with entry = ), $fig->flatten_dumper($entry), qq(\n), Dumper( $contig_features ) );
147 :     }
148 :    
149 :     # get entry function
150 :     $entry->[FUNC] = $func_of{ $entry->[FID] };
151 :    
152 :     # get the feature number
153 :     my $feature_number;
154 :     if ( $entry->[FID] =~ m/\.(\d+)$/ ) {
155 :     $feature_number = $1;
156 :     }
157 :     else {
158 :     die "Could not parse FID $entry->[FID]";
159 :     }
160 :    
161 :     if ( defined( $pseudo_list->{ $entry->[FID] } ) ) {
162 :     &output_PSEUDO( $entry, $feature_number, $locus_tag_prefix, *RES, $pseudo_list->{ $entry->[FID] }, $done_fids, $contig_features );
163 :     next;
164 :     }
165 :     if ( $type eq qq(CDS) ) {
166 : bartels 1.2 &output_CDS( $entry, $feature_number, $locus_tag_prefix, $partial_list, *RES, *XLS_LOG );
167 : bartels 1.1 }
168 :     elsif ( $type =~ m/RNA/o ) {
169 :     &output_RNA( $entry, $feature_number, $locus_tag_prefix, *RES );
170 :     }
171 :     else {
172 :     die "Unsupported feature type:\n", Dumper($entry);
173 :     }
174 :     }
175 :     }
176 :    
177 :    
178 :    
179 :     ##################
180 :     # close up stuff #
181 :     ##################
182 :    
183 :     close RES;
184 :     close XLS_LOG;
185 :    
186 :    
187 :    
188 :    
189 :    
190 :     #-----------#
191 :     #############
192 :     ## METHODS ##
193 :     #############
194 :     #-----------#
195 :    
196 :    
197 :     #################
198 :     # Write PSEUDOS #
199 :     #################
200 :     sub output_PSEUDO {
201 :     my ( $entry, $feature_number, $locus_tag_prefix, $RES, $otherones, $donehash, $contig_features ) = @_;
202 :    
203 :     $feature_number = &zero_pad( 6, $feature_number );
204 :     my $locus_tag = $locus_tag_prefix . $feature_number;
205 :    
206 :     my $strand = 'fw';
207 :     my ( $nonsense, $beg, $end ) = $fig->boundaries_of( $entry->[LOCUS] );
208 :     if ( $beg > $end ) {
209 :     $strand = 'rv';
210 :     }
211 :    
212 :     $donehash->{ $entry->[FID] } = 1;
213 :     foreach my $oo ( @$otherones ) {
214 :    
215 :     my $thisentry;
216 :     foreach my $te ( @$contig_features ) {
217 :     if ( $te->[FID] eq $oo ) {
218 :     my ($beg1, $end1);
219 :     (undef, $beg1, $end1) = $fig->boundaries_of( $te->[LOCUS] );
220 :     if ( $strand eq 'fw' ) {
221 :     $end = $end1;
222 :     }
223 :     else {
224 :     $beg = $beg1;
225 :     }
226 :     }
227 :     }
228 :    
229 :     $donehash->{ $oo } = 1;
230 :     }
231 :    
232 :     my $func = $entry->[FUNC];
233 :    
234 :     $func =~ s/\s+/ /go;
235 :     my ($product, $prot_desc, $notesP, $ec_numsP, $tc_numsP, $famsP) = &normalize_function( $entry->[FID], $func, 0);
236 :     if ( !defined( $product ) || $product eq '' ) {
237 :     $product = $prot_desc;
238 :     }
239 :     if ( $product =~ /(.*)\s\# frameshift$/ ) {
240 :     $product = $1;
241 :     }
242 :    
243 :     print $RES (join(qq(\t), ($beg, $end, 'gene')), qq(\n));
244 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(gene_desc), $product)), qq(\n);
245 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(locus_tag), $locus_tag)), qq(\n));
246 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(pseudo)), qq(\n)));
247 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(note), qq(frameshift)), qq(\n)));
248 :     }
249 :    
250 :     ##############
251 :     # Write RNAs #
252 :     ##############
253 :     sub output_RNA {
254 :     my ( $entry, $feature_number, $locus_tag_prefix, $RES ) = @_;
255 :    
256 :     $feature_number = &zero_pad( 6, $feature_number, qq(rna) );
257 :     my $locus_tag = $locus_tag_prefix . $feature_number;
258 :    
259 :     my ( $nonsense, $beg, $end ) = $fig->boundaries_of($entry->[LOCUS]);
260 :    
261 :     print $RES ( join( qq(\t), ($beg, $end, qq(gene))), qq(\n),
262 :     join( qq(\t), (qq(), qq(), qq(), qq(locus_tag), $locus_tag)), qq(\n),
263 :     );
264 :    
265 :     my $trunc = $fig->possibly_truncated( $entry->[FID] );
266 :     if ($beg < $end) {
267 :     if ( $trunc eq qq(start) ) {
268 :     $beg = qq(<$beg);
269 :     }
270 :     elsif ( $trunc eq qq(stop) ) {
271 :     $end = qq(>$end);
272 :     }
273 :     }
274 :     else {
275 :     if ( $trunc eq qq(start) ) {
276 :     $beg = qq(>$beg);
277 :     }
278 :     elsif ( $trunc eq qq(stop) ) {
279 :     $end = qq(<$end);
280 :     }
281 :     }
282 :    
283 :     my $type = &type_of($entry);
284 :    
285 :     my $func = $entry->[FUNC];
286 :     if ($func =~ m/5S\s*RNA/o) {
287 :     #...No change
288 :     $func = qq(5S rRNA);
289 :     }
290 :     elsif ($func =~ m/SSU\s*rRNA/o) {
291 :     $func = qq(16S rRNA);
292 :     }
293 :     elsif ($func =~ m/LSU\s*rRNA/o) {
294 :     $func = qq(23S rRNA);
295 :     }
296 :     elsif ($func =~ m/^tRNA/o) {
297 :     # try to cut off the codon (anticodon?) information
298 :     if ( $func =~ /^(tRNA-\w{3}).*/ ) {
299 :     $func = $1;
300 :     }
301 :     }
302 :     else {
303 :     $func = qq(misc_RNA);
304 :     }
305 :    
306 :     print $RES (join(qq(\t), ($beg, $end, $type)), qq(\n));
307 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(product), $func)), qq(\n));
308 :    
309 :     return 1;
310 :     }
311 :    
312 :     ##############
313 :     # Write CDSs #
314 :     ##############
315 :     sub output_CDS {
316 : bartels 1.2 my ( $entry, $feature_number, $locus_tag_prefix, $partial_list, $RES, $XLS_LOG ) = @_;
317 :     my $fid = $entry->[FID];
318 : bartels 1.1
319 :     $feature_number = &zero_pad( 6, $feature_number );
320 :     my $locus_tag = $locus_tag_prefix . $feature_number;
321 :    
322 :     # get entry location on the contig
323 :     my ( $nonsense, $region_beg, $region_end ) = $fig->boundaries_of( $entry->[LOCUS] );
324 : bartels 1.2 if ( defined( $partial_list->{ $fid } ) ) {
325 :     my ( $st, $val ) = @{ $partial_list->{ $fid } };
326 :     if ( $st eq 'start' ) {
327 :     $region_beg = $val;
328 :     }
329 :     if ( $st eq 'stop' ) {
330 :     $region_end = $val;
331 :     }
332 :     }
333 : bartels 1.1
334 :     print $RES ( join( qq(\t), ($region_beg, $region_end, qq(gene))), qq(\n),
335 :     join( qq(\t), (qq(), qq(), qq(), qq(locus_tag), $locus_tag)), qq(\n),
336 :     );
337 :    
338 :     my @products = ();
339 :     my @prot_descs = ();
340 :     my @notes = ();
341 :     my @ec_nums = ();
342 :     my @tc_nums = ();
343 :     my @fams = ();
344 :    
345 :     ###########################
346 :     # Write locus information #
347 :     ###########################
348 :     my @chunks = split( m/,/, $entry->[LOCUS] );
349 :    
350 :     my $first_chunk = shift @chunks;
351 :     my ( $nonsense2, $beg, $end ) = $fig->boundaries_of( $first_chunk );
352 : bartels 1.2
353 :     if ( defined( $partial_list->{ $fid } ) ) {
354 :     my ( $st, $val ) = @{ $partial_list->{ $fid } };
355 :     if ( $st eq 'start' ) {
356 :     $beg = $val;
357 :     }
358 :     if ( $st eq 'stop' ) {
359 :     $end = $val;
360 :     }
361 :     }
362 : bartels 1.1
363 :     print $RES ( join( qq(\t), ( $beg, $end, qq(CDS) ) ), qq(\n) );
364 :     foreach my $chunk (@chunks) {
365 :     ( undef, $beg, $end ) = $fig->boundaries_of( $chunk );
366 :     print $RES ( join( qq(\t), ($beg, $end) ), qq(\n) );
367 :     }
368 :    
369 :     ##############################
370 :     # Now about the CDS function #
371 :     ##############################
372 :     my $func = $entry->[FUNC];
373 :     $func =~ s/\s+/ /go;
374 :     my $original_func = $func;
375 :    
376 :     # Trim off "comment" field; save it as a "note" if it "propagates"
377 :     if ( $func =~ m/(\#{1,2})\s+(.*)$/ ) {
378 :     if ( $1 eq qq(\#\#) ) {
379 :     push @notes, $2;
380 :     }
381 :     $func =~ s/\#.*$//o;
382 :     }
383 :    
384 :     # Check type of assignment
385 :     my $assignment_type = q();
386 :     if ($func =~ m{ \/ }) {
387 :     $assignment_type = qq(multifunctional enzyme);
388 :     }
389 :     elsif ($func =~ m{\@ }) {
390 :     $assignment_type = qq(enzyme with broad specificity);
391 :     }
392 :     elsif ($func =~ m{\; }) {
393 :     $assignment_type = qq(most likely function alternative not yet resolved);
394 :     }
395 :    
396 :     #...Split on " / ", '; ', or " @ "
397 :     my @funcs = split m{ \/ |\; | \@ }, $func;
398 :     my @tmp = @funcs;
399 :     @tmp = grep { &weasel_words($_) } map { s{ [\(\[] [ET] C [^\)\]]+ [\)\]] }{}gox; $_ } @tmp;
400 :    
401 :     ############################
402 :     # Now go through functions #
403 :     ############################
404 :     foreach $func ( @funcs ) {
405 :     my $prenormalized_func = $func;
406 :    
407 :     my $x;
408 :     if ( defined( $x = $special_cases->{$original_func} ) ) {
409 :    
410 :     if ( defined( $x->{ prod } ) ) {
411 :     push ( @products, @{ $x->{ prod } } );
412 :     }
413 :    
414 :     if ( defined( $x->{ desc } ) ) {
415 :     push ( @prot_descs, @{ $x->{ desc } } );
416 :     }
417 :    
418 :     if ( defined( $x->{ note } ) ) {
419 :     push ( @notes, @{ $x->{ note } } );
420 :     }
421 :    
422 :     if ( defined( $x->{ ecnu } ) ) {
423 :     push ( @ec_nums, @{ $x->{ ecnu } } );
424 :     }
425 :     last;
426 :     }
427 :     elsif ( defined( $x = $special_cases->{$func} ) ) {
428 :    
429 :     if ( defined( $x->{ prod } ) ) {
430 :     push ( @products, @{ $x->{ prod } } );
431 :     }
432 :    
433 :     if ( defined( $x->{ desc } ) ) {
434 :     push ( @prot_descs, @{ $x->{ desc } } );
435 :     }
436 :    
437 :     if ( defined( $x->{ note } ) ) {
438 :     push ( @notes, @{ $x->{ note } } );
439 :     }
440 :    
441 :     if ( defined( $x->{ ecnu } ) ) {
442 :     push ( @ec_nums, @{ $x->{ ecnu } } );
443 :     }
444 :     }
445 :     else {
446 :     my ( $product, $prot_desc, $notesP, $ec_numsP, $tc_numsP, $famsP ) = &normalize_function( $fid, $func );
447 :    
448 :     push (@products, $product) if $product;
449 :     push (@prot_descs, $prot_desc) if $prot_desc;
450 :     push (@notes, @$notesP);
451 :     push (@ec_nums, @$ec_numsP);
452 :     push (@tc_nums, @$tc_numsP);
453 :     push (@fams, @$famsP);
454 :    
455 :     #...Add note for PEGs marked "(fragment)," and set "pseudogene" flag as required by NCBI
456 :     if ($func =~ /fragment/io) {
457 :     unshift @notes, qq(Fragment);
458 :     $func =~ s/\s*\(?fragment\)?//i;
459 :     }
460 :     }
461 :    
462 :     # if ( !defined( $notesP ) ) {
463 :     # $notesP = [];
464 :     # }
465 :    
466 :     # if ($product) {
467 :     # if (not defined($preimages_of{$product})) { $preimages_of{$product} = {}; }
468 :     # $preimages_of{$product}->{$func} = [ qq(prod), @$notesP ];
469 :     # }
470 :    
471 :     # if ($prot_desc) {
472 :     # if (not defined($preimages_of{$prot_desc})) { $preimages_of{$prot_desc} = {}; }
473 :     # $preimages_of{$prot_desc}->{$func} = [ qq(desc), @$notesP ];
474 :     # }
475 :     }
476 :    
477 :     if ( $assignment_type ) {
478 :     if ( $assignment_type eq qq(multifunctional enzyme) ) {
479 :     if ( @products ) {
480 :     my $product = join( qq(/), @products );
481 :     @products = ( $product );
482 :     }
483 :     else {
484 :     unshift @notes, $assignment_type;
485 :     }
486 :     }
487 :     else {
488 :     unshift @notes, $assignment_type;
489 :     }
490 :     }
491 :    
492 :     if ( @products == 0 ) {
493 :     push @products, qq(hypothetical protein);
494 :     }
495 :    
496 :     @products = @{ uniquify( \@products ) };
497 :     foreach my $product (@products) {
498 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(product), $product)), qq(\n);
499 :     }
500 :    
501 :     @prot_descs = @{ uniquify( \@prot_descs ) };
502 :     foreach my $prot_desc ( @prot_descs ) {
503 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(prot_desc), $prot_desc)), qq(\n);
504 :     }
505 :    
506 :     @ec_nums = @{ uniquify( \@ec_nums ) };
507 :     foreach my $ec_num ( @ec_nums ) {
508 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(EC_number), $ec_num)), qq(\n);
509 :     }
510 :    
511 :     my @notestmp = @tc_nums;
512 :     push @notestmp, @fams;
513 :     push @notestmp, @notes;
514 :     @notes = @{ uniquify( \@notestmp ) };
515 :     foreach my $note ( @notes ) {
516 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(note), $note)), qq(\n);
517 :     }
518 :    
519 :     @tmp = ();
520 :     push @tmp, map { qq(prod: $_) } @products;
521 :     push @tmp, map { qq(desc: $_) } @prot_descs;
522 :     push @tmp, map { qq(note: $_) } @notes;
523 :     my $first_annot = shift(@tmp) || qq();
524 :     print $XLS_LOG (join(qq(\t), ($fid, $original_func, $first_annot, join(qq( ), @ec_nums))), qq(\n));
525 :     foreach my $tmp (@tmp) {
526 :     print $XLS_LOG (join(qq(\t), (q(), q(), qq(), $tmp, qq())), qq(\n));
527 :     }
528 :    
529 :     my $fid_num = 0;
530 :     if ( $fid =~ m/\.(\d+)$/ ) {
531 :     $fid_num = $1;
532 :     $fid_num = ( "0" x ( 6 - length( $fid_num ) ) ) . $fid_num;
533 :     }
534 :     else {
535 :     die "Could not parse FID $entry->[FID]";
536 :     }
537 :    
538 :     # print the protein id #
539 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(protein_id), qq(gnl\|$submitter_ID\|$prot_ID_prefix).$fid_num)), qq(\n));
540 :    
541 :     return 1;
542 :     }
543 :    
544 :     #############################
545 :     # constructs the protein id #
546 :     #############################
547 :     sub zero_pad {
548 :     my ($num_digits, $number, $prefix) = @_;
549 :     $prefix = defined($prefix) ? $prefix : qq();
550 :    
551 :     my $prefix_length = length($prefix);
552 :     my $number_length = length($number);
553 :    
554 :     if ($num_digits < $prefix_length + $number_length) {
555 :     die "!!! Too many digits: digits=$num_digits, number=$number, prefix=$prefix";
556 :     }
557 :    
558 :     return ($prefix . ("0" x ($num_digits - $prefix_length - $number_length)) . $number);
559 :     }
560 :    
561 :     ###############################
562 :     # through double entries away #
563 :     ###############################
564 :     sub uniquify {
565 :     my ( $array ) = @_;
566 :    
567 :     my @retarray;
568 :     my %used;
569 :     foreach ( @$array ) {
570 :     next if ( defined( $used{ $_ } ) );
571 :     $used{ $_ } = 1;
572 :     push @retarray, $_;
573 :     }
574 :     return \@retarray;
575 :     }
576 :    
577 :     sub type_of {
578 :     my ($entry) = @_;
579 :    
580 :     my $fid = $entry->[FID];
581 :     my $func = $entry->[FUNC] || qq();
582 :    
583 :     if ($fid =~ m/\.peg\./o) {
584 :     return qq(CDS);
585 :     }
586 :     elsif ($fid =~ m/\.rna\./o) {
587 :     if (($func =~ m/rRNA/o) || ($func =~ m/5S RNA/o)) {
588 :     return qq(rRNA);
589 :     }
590 :     elsif ($func =~ m/tRNA/o) {
591 :     return qq(tRNA);
592 :     }
593 :     else {
594 :     return qq(misc_RNA);
595 :     }
596 :     }
597 :     else {
598 :     die "This Can't Happen !!!";
599 :     }
600 :    
601 :     die "This Can't Happen !!!";
602 :     }
603 :    
604 :     sub weasel_words {
605 :     #...Attempt to catch things NCBI bitches about in protein names
606 :     my ($x) = @_;
607 :    
608 :     #...protein names should not contain molecular weights
609 :     # if ($x =~ /\bkDa\b/io) { return 1 }
610 :    
611 :     #...fragments are not "real" genes, but are demoted to "pseudogenes"
612 :     # if ($x =~ /fragment/io) { return 2 }
613 :    
614 :     #...protein names should not mention cellular location
615 :     # if ($x =~ /inner[- ]membrane/io) { return 3 }
616 :     # if ($x =~ /periplasmic/io) { return 4 }
617 :    
618 :     #...protein names should not contain any hint of ambiguity
619 :     # if ($x =~ /predicted/io) { return 5 }
620 :     # if ($x =~ /probable/io) { return 6 }
621 :     # if ($x =~ /putative/io) { return 7 }
622 :     # if ($x =~ /hypothetical/io) { return 8 }
623 :    
624 :     #...protein names should not be descriptive phrases
625 :     if ($x =~ /,\s/io) { return 9 }
626 :     # if ($x =~ /\sand\s/io) { return 10 }
627 :     # if ($x =~ /of\s+the\b.*\b(super)?family/io) { return 100 }
628 :     # if ($x =~ /fused\s+to/io) { return 11 }
629 :     # if ($x =~ /involved\s+in/io) { return 12 }
630 :     # if ($x =~ /component.*\bof\b/io) { return 13 }
631 :     # if ($x =~ /exported\s+protein/io) { return 14 }
632 :    
633 :     #...protein names should not contain references to homology
634 :     # if ($x =~ /motif/io) { return 15 }
635 :     # if ($x =~ /containing/io) { return 16 }
636 :     # if ($x =~ /analog\s+of/io) { return 17 }
637 :     # if ($x =~ /[- ]like/io) { return 18 }
638 :     # if ($x =~ /similar\s+to/io) { return 19 }
639 :     # if ($x =~ /similarity/io) { return 20 }
640 :     # if ($x =~ /homolog(ous)?/io) { return 21 }
641 :     # if ($x =~ /ortholog(ous)?/io) { return 22 }
642 :     # if ($x =~ /structural\s+feature/io) { return 23 }
643 :     # if ($x =~ /conserved.*\bdomain\b/io) { return 24 }
644 :     # if ($x =~ /conserved\s+in/io) { return 25 }
645 :     # if ($x =~ /binding[- ]site/io) { return 26 }
646 :    
647 :     return 0;
648 :     }
649 :    
650 :    
651 :     sub normalize_function {
652 :    
653 :     my ($fid, $func) = @_;
654 :    
655 :     my $product = qq();
656 :     my $prot_desc = qq();
657 :     my $notesP = [];
658 :     my $ec_numsP = [];
659 :     my $tc_numsP = [];
660 :     my $famsP = [];
661 :    
662 :     #...Trim leading and trailing spaces, and collapse multiple spaces
663 :     $func =~s/^\s+//o;
664 :     $func =~s/\s+$//o;
665 :     $func =~s/\s+/ /go;
666 :    
667 :     #...Remove whitespace before commas
668 :     $func =~ s/\s+,/,/go;
669 :    
670 :     #...Remove space between ")" and "-"
671 :     $func =~ s/\)\s+\-/\)\-/go;
672 :    
673 :     #...Remove references to FIGfam membership
674 : disz 1.3 if ($func =~ m/^(FIG\d+)/) {
675 : bartels 1.1 #...We are currently suppressing FIGfam-IDs
676 : disz 1.3 $func =~ s/^FIG\d+[:_ ]\s*//o;
677 :     $func =~ s/^FIG\d+\s+\(not\s+subsystem\s+based\):\s+//o;
678 : bartels 1.1 }
679 :    
680 :     #...Move references to EC-numbers into @$ec_numsP
681 :     # print STDERR qq($fid\t$func\n);
682 :     while ($func =~ m/[\(\]]\s*EC[_:]?\s*([^\)\]]+)[\)\]]/o) {
683 :     my $contents = $1;
684 :     # print STDERR qq(\t$contents:);
685 :     foreach my $token (split(m/[, ]\s*/, $contents)) {
686 :     if ($token =~ m/(\d+\.([0-9]+|-)\.([0-9]+|-)\.([0-9]+|-))/o) {
687 :     my $ec_num = $1;
688 :     # print STDERR qq(\t$ec_num);
689 :    
690 :     if ($ec_num =~ m/\.\-$/o) {
691 :     #...Skip partials
692 :     next;
693 :     }
694 :     elsif (defined($map_EC_to->{$ec_num})) {
695 :     #...Skip any changed EC
696 :     next;
697 :    
698 :     # if ($map_EC_to->{$ec_num} eq qq(-1)) {
699 :     # #...Skip --- EC is either split or deleted
700 :     # next;
701 :     # }
702 :     # else{
703 :     # #...Replace EC if uniquely mappable
704 :     # $ec_num = $map_EC_to->{$ec_num};
705 :     # }
706 :     }
707 :    
708 :     push @$ec_numsP, $ec_num;
709 :     }
710 :     else {
711 :     push @$notesP, $token;
712 :     }
713 :     }
714 :    
715 :     $func =~ s/[\(\]]\s*EC[_:]?\s*([^\)\]]+)[\)\]]//o;
716 :     }
717 :    
718 :     #...Move references to TC-numbers into @$tc_numsP
719 :     if ($func =~ m/\(\s*TC[_:]?\s*([^\)]+)\)/o) {
720 :     push @$tc_numsP, qq(TC $1);
721 :     $func =~ s/\(\s*TC[^\)]+\)//;
722 :     }
723 :    
724 :     #...Move references to COGs into @fams (will become "note")
725 :     $func =~ s/^COGs\s*//o;
726 :     if ($func =~ m/COG/) {
727 :     if ($func =~ s/^((COG\d{4})[,:_]?\*(family)?)\s*/$2 $3/o) {
728 :     push @$notesP, $func;
729 :     $func = qq();
730 :     }
731 :     else {
732 :     while ($func =~ s/,?\s*(COG\d{4}):?\s*//o) {
733 :     push @$famsP, $1;
734 :     }
735 :     }
736 :     }
737 :    
738 :     #...Again trim leading and trailing spaces, collapse multiple spaces, and snug up commas
739 :     $func =~s/^\s*,?\s+//o;
740 :     $func =~s/\s+$//o;
741 :     $func =~s/\s+/ /go;
742 :     $func =~ s/\s+,/,/go;
743 :    
744 :     #...Attempt to downcase "ALL CAPS"
745 :     if ($func !~ m/[a-z]/) {
746 :     $func = lc($func);
747 :     }
748 :    
749 :     #...If first word is capitalized, and not on list of known gene-names,
750 :     # downcase initial cap
751 :     if ($func =~ m/^(\w+)/) {
752 :     my $first_token = $1;
753 :     if (($first_token =~ m/^[A-Z][a-z]+$/o) && (not $keep_caps->{$first_token})) {
754 :     substr($func, 0, 1) = lc( substr($func, 0, 1) );
755 :     }
756 :     }
757 :    
758 :     if ( my $code = weasel_words( $func ) ) {
759 :     if ( $code == 9 ) {
760 :     my $newfunc = transform($func, $special_cases, $keep_caps);
761 :     $func = join( "/", @{ $newfunc->{prod} });
762 :     $product = $func;
763 :    
764 :     if (my $code = weasel_words($func)) {
765 :     # print STDERR "AGAIN: $code $func\n";
766 :     }
767 :     }
768 :     else {
769 :     $prot_desc = $func;
770 :     }
771 :     }
772 :     else {
773 :     $product = $func;
774 :     }
775 :     # }
776 :    
777 :     return ($product, $prot_desc, $notesP, $ec_numsP, $tc_numsP, $famsP);
778 :     }
779 :    
780 :    
781 :    
782 :     ################
783 :     # load contigs #
784 :     ################
785 :     sub load_contigs
786 :     {
787 :     my ($contigs_file) = @_;
788 :    
789 :     my $seq_of = {};
790 :     my $len_of = {};
791 :    
792 :     open (CONTIGS, "<$contigs_file") or die "could not open $contigs_file to read";
793 :     while ( (! eof(CONTIGS)) && ( my ($id, $seqP) = &FIG::read_fasta_record(\*CONTIGS) ) )
794 :     {
795 :     $$seqP =~ tr/a-z/A-Z/;
796 :     $seq_of->{$id} = $$seqP;
797 :     $len_of->{$id} = length($$seqP);
798 :     }
799 :     close(CONTIGS) or die "could not close $contigs_file";
800 :    
801 :     return ($seq_of, $len_of);
802 :     }
803 :    
804 :     ##################
805 :     # load tbl files #
806 :     ##################
807 :     sub load_tbls
808 :     {
809 :     my (@tbl_files) = @_;
810 :     my ($entry, $fid, $org, $locus, $contig, $beg, $end, $strand, $len);
811 :    
812 :     my $tbl = {};
813 :     my $file = 0;
814 :     foreach my $tbl_file (@tbl_files)
815 :     {
816 :     my $num_fids = 0;
817 :     open(TBL,"<$tbl_file") || die "could not open $tbl_file";
818 :     print STDERR "Loading $tbl_file ...\n" if $ENV{VERBOSE};
819 :    
820 :     while (defined($entry = <TBL>))
821 :     {
822 :     ++$num_fids;
823 :     chomp $entry;
824 :     if ($entry =~ /^(\S+)\s+(\S+)/)
825 :     {
826 :     ($fid, $locus) = ($1, $2);
827 :     if ($fid =~ m/^fig\|(\d+\.\d+)/) { $org = $1; } else { die "Invalid FID $fid"; }
828 :    
829 :     ($contig, $beg, $end) = $fig->boundaries_of($locus);
830 :    
831 :     if ($beg < $end) { $strand = '+'; } else { $strand = '-'; }
832 :    
833 :     $len = 1 + abs($end-$beg);
834 :    
835 :     unless (defined($tbl->{$contig})) { $tbl->{$contig} = []; }
836 :     push(@ { $tbl->{$contig} }
837 :     , [$entry, $file, $fid, $locus, $contig, $beg, $end, $len, $strand]
838 :     );
839 :     }
840 :     else
841 :     {
842 :     print STDERR "Skipping invalid entry $entry\n";
843 :     }
844 :     }
845 :     print STDERR "Loaded $num_fids features from $tbl_file\n\n" if $ENV{VERBOSE};
846 :     close(TBL);
847 :     ++$file;
848 :     }
849 :    
850 :     foreach my $contig (keys(%$tbl))
851 :     {
852 :     my $x = $tbl->{$contig};
853 :     $tbl->{$contig} = [sort { &FIG::min($a->[START],$a->[STOP]) <=> &FIG::min($b->[START],$b->[STOP]) } @$x];
854 :     }
855 :    
856 :     return $tbl;
857 :     }
858 :    
859 :    
860 :     ###############################
861 :     # Names that should stay caps #
862 :     ###############################
863 :     sub load_keep_caps {
864 :     my $keep_caps = {};
865 :    
866 :     my $entry;
867 :     while ( defined( $entry = <DATA> ) ) {
868 :     last if ( $entry eq qq(///\n) );
869 :     chomp $entry;
870 :     $keep_caps->{ $entry } = 1;
871 :     }
872 :    
873 :     return $keep_caps;
874 :     }
875 :    
876 :     #######################
877 :     # list of pseudogenes #
878 :     #######################
879 :     sub load_pseudo_list {
880 :     my ( $pseudo_file ) = @_;
881 :    
882 :     my $pseudo_list;
883 :     open ( PL, $pseudo_file ) or die "cannot open $pseudo_file";
884 :    
885 :     while ( <PL> ) {
886 :     chomp;
887 :     next if ( !defined( $_ ) );
888 :     my @frags = split( "\t", $_ );
889 :     my $first = shift @frags;
890 :     $pseudo_list->{ $first } = \@frags;
891 :     }
892 :    
893 :     close PL;
894 :     return $pseudo_list;
895 :     }
896 :    
897 : bartels 1.2 #########################
898 :     # list of partial genes #
899 :     #########################
900 :     sub load_partial_list {
901 :     my ( $partial_file ) = @_;
902 :    
903 :     my $partial_list;
904 :     open ( PL, $partial_file ) or die "cannot open $partial_file";
905 :    
906 :     while ( <PL> ) {
907 :     chomp;
908 :     next if ( !defined( $_ ) );
909 :     my ( $peg, $st, $val ) = split( "\t", $_ );
910 :     $partial_list->{ $peg } = [ $st, $val ];
911 :     }
912 :    
913 :     close PL;
914 :     return $partial_list;
915 :     }
916 :    
917 : bartels 1.1
918 :     #########
919 :     # usage #
920 :     #########
921 :     sub usage {
922 :     print STDERR "seed2tbl -o ORGDIR
923 :     -s SUBMITTER_ID
924 :     -l LOCUS_TAG_PREFIX
925 :     -p PSEUDO_FILE
926 :     -i PROT_ID_PREFIX
927 :     -r RESULT_TBL_FILE
928 :     ";
929 :     }
930 :    
931 :     ##################
932 :     # bad EC numbers #
933 :     ##################
934 :     sub load_bad_EC_numbers {
935 :     my ($bad_EC_file) = @_;
936 :    
937 :     open(BAD_ECs, qq(<$bad_EC_file))
938 :     || die qq(Could not read-open \`$bad_EC_file\');
939 :    
940 :     my $record;
941 :     my $map_EC_to = {};
942 :     while (defined($record = <BAD_ECs>)) {
943 :     if ($record =~ m/^(\S+)/o) {
944 :     my $old_ec = $1;
945 :     if ($record =~ m/^\S+\t(\S+)/o) {
946 :     my $new_ec = $1;
947 :     if (not defined($map_EC_to->{$old_ec})) {
948 :     $map_EC_to->{$old_ec} = $new_ec;
949 :     }
950 :     else {
951 :     #...Split EC
952 :     $map_EC_to->{$old_ec} = -1;
953 :     }
954 :     }
955 :     else {
956 :     #...Deleted EC
957 :     $map_EC_to->{$old_ec} = -1;
958 :     }
959 :     }
960 :     else {
961 :     die "Could not parse $bad_EC_file record $.: $record";
962 :     }
963 :     }
964 :     close(BAD_ECs);
965 :    
966 :     return $map_EC_to;
967 :     }
968 :    
969 :    
970 :     #################
971 :     # special cases #
972 :     #################
973 :     sub load_special_cases {
974 :     my $old_eol;
975 :     my $special_cases = {};
976 :    
977 :     my $record;
978 :     ($old_eol, $/) = ($/, qq(\n//\n));
979 :     while ( defined( $record = <DATA> ) ) {
980 :     chomp $record;
981 :     my @entries = split( /\n/, $record );
982 :    
983 :     my $func = shift @entries;
984 :     $func =~ s/^func:\t//o;
985 :    
986 :     my $x = $special_cases->{$func} = {};
987 :    
988 :     foreach my $entry ( @entries ) {
989 :     my ( $type, $val ) = split( /\:\t/, $entry );
990 :     push @ { $x->{$type} }, $val;
991 :     }
992 :     }
993 :     $/ = $old_eol;
994 :    
995 :     return $special_cases;
996 :     }
997 :    
998 :    
999 :     sub transform {
1000 :     my ($func, $special, $keep_caps) = @_;
1001 :    
1002 :     $func =~ s/\s{2,10}/ /g;
1003 :     # $func =~ s/\) -methyl/)-methyl/g;
1004 :     if ((! $func) || ($func =~ m/^hypothetical\s*$/o)) {
1005 :     $func = "hypothetical protein";
1006 :     }
1007 :     my $pieces = {};
1008 :    
1009 :     if ( $special->{ $func } ) {
1010 :     $func = $special->{ $func }
1011 :     }
1012 :     if ( $func =~ /HASH/ ) {
1013 :     $func = join( '/', @{ $func->{ prod } } );
1014 :     }
1015 :    
1016 :     my $func0 = &clean_comments($func);
1017 :     $func = $func0;
1018 :    
1019 :     my @funcs = split(/ \/ | \@ |\; /,$func);
1020 :     foreach my $x (@funcs)
1021 :     {
1022 :     &transform1($x,$pieces,$special,$keep_caps);
1023 :     }
1024 :     my %prods = map { $_ => 1 } @{$pieces->{prod}};
1025 :     $pieces->{prod} = [sort keys(%prods)];
1026 :     if (@funcs > 1) {
1027 :     $pieces->{prod} = [ join( "/", @{$pieces->{prod} } ) ];
1028 :     }
1029 :     return $pieces;
1030 :     }
1031 :    
1032 :     sub transform1 {
1033 :     my($func, $pieces, $special, $keep_caps) = @_;
1034 :     my $note;
1035 :    
1036 :     if ($special->{$func}) { $func = $special->{$func} }
1037 :    
1038 :     my($func1,$ecs) = &clean_ecs($func);
1039 :     if (@$ecs > 0) { push(@{$pieces->{ecs}},@$ecs) }
1040 :     $func = $func1;
1041 :    
1042 :     my($func2,$tcs) = &clean_tcs($func);
1043 :     if (@$tcs > 0) { push(@{$pieces->{tcs}},@$tcs) }
1044 :     $func = $func2;
1045 :    
1046 :     #...NOTE: &clean_clustered_with() must be called before &clean_commas()
1047 :     my $func9;
1048 :     ($func9, $note) = &clean_clustered_with($func);
1049 :     if ($note) { push(@{$pieces->{notes}}, $note); }
1050 :     $func = $func9;
1051 :    
1052 :     my $func3 = &clean_commas($func);
1053 :     $func = $func3;
1054 :    
1055 :     my ($func8, $pseudo) = &clean_fragment($func);
1056 :     if ($pseudo) {
1057 :     #...This is klutzy, but I see no other work-around... :-(
1058 :     push @ { $pieces->{pseudo} }, qq(fragment);
1059 :     }
1060 :     $func = $func8;
1061 :    
1062 :     my $func5 = &clean_cogs($func);
1063 :     $func = $func5;
1064 :    
1065 :     my($func6,$wts) = &clean_weights($func);
1066 :     $func = $func6;
1067 :     if (@$wts > 0) { push(@{$pieces->{notes}},@$wts) }
1068 :    
1069 :     my $func7 = &clean_rrna($func);
1070 :     $func = $func7;
1071 :    
1072 :     my($func4,$notes) = &clean_locations($func);
1073 :     $func = $func4;
1074 :     if (@$notes > 0) { push(@{$pieces->{notes}},@$notes) }
1075 :    
1076 :     my $func_final = &fix_caps($func, $keep_caps);
1077 :     $func = $func_final;
1078 :    
1079 :     if (not $func) { $func = qq(hypothetical protein); }
1080 :    
1081 :     push(@{$pieces->{prod}}, $func);
1082 :     return $pieces;
1083 :     }
1084 :    
1085 :    
1086 :     sub clean_clustered_with {
1087 :     #...NOTE: Must be called before &clean_commas()
1088 :     my ($func) = @_;
1089 :     my $note;
1090 :    
1091 :     if ($func =~ s/\s*\((clustered\s+with\s+[^\)]+)\)//o) {
1092 :     $note = $1;
1093 :     }
1094 :     elsif ($func =~ s/,?(\s+in)?\s+cluster(ed)?\s+(with.*)$//o) {
1095 :     $note = qq(clustered with $3);
1096 :     }
1097 :    
1098 :     return ($func, $note);
1099 :     }
1100 :    
1101 :     sub fix_caps {
1102 :     my ($func, $keep_caps) = @_;
1103 :    
1104 :     if (($func =~ m/^(\w+)/o) && (defined($keep_caps->{$1}))) {
1105 :     #...First token of $func is on the keep list; return unchanged
1106 :     return $func;
1107 :     }
1108 :     elsif ($func !~ m/[a-z]/o) {
1109 :     #...Convert to lower-case, since NCBI hates "ALL CAPS"
1110 :     $func = lc( $func );
1111 :     }
1112 :     else {
1113 :     #...Convert first letter to lower-case
1114 :     $func =~ s/^\s*//o; #...Make sure first char is not "whitespace"
1115 :     substr($func, 0, 1) = lc( substr($func, 0, 1) );
1116 :     }
1117 :    
1118 :     return $func;
1119 :     }
1120 :    
1121 :     sub clean_fragment {
1122 :     my ($func) = @_;
1123 :    
1124 :     my $pseudo = qq();
1125 :     if ($func =~ s/\s*[\(]?fragment[\)]?//io) {
1126 :     $pseudo = 1;
1127 :     }
1128 :     return ($func, $pseudo);
1129 :     }
1130 :    
1131 :     sub clean_rrna {
1132 :     my($func) = @_;
1133 :    
1134 :     $func =~ s/23s r?rna/LSU rRNA/i;
1135 :     $func =~ s/16s r?rna/SSU rRNA/i;
1136 :     return $func;
1137 :     }
1138 :    
1139 :     sub clean_weights {
1140 :     my($func) = @_;
1141 :    
1142 :     my $wts = [];
1143 :     if ($func =~ s/\b(\d+ kda)\s*//i)
1144 :     {
1145 :     push(@$wts,$1);
1146 :     }
1147 :     return ($func,$wts);
1148 :     }
1149 :    
1150 :     sub clean_cogs {
1151 :     my($func) = @_;
1152 :    
1153 :     $func =~ s/^COGs\s+//;
1154 :     $func =~ s/COG\d{4}[:,_]?\s*//;
1155 :     return $func;
1156 :     }
1157 :    
1158 :     sub clean_locations {
1159 :     my($func) = @_;
1160 :    
1161 :     my $notes = [];
1162 :     while ($func =~ s/\s*(outer membrane|inner membrane|cytoplasmic|periplasmic)( protein)?//i)
1163 :     {
1164 :     push(@$notes, lc(qq($1 protein)));
1165 :     }
1166 :     $func =~ s/^\s+//;
1167 :     return ($func,$notes);
1168 :     }
1169 :    
1170 :     sub clean_comments {
1171 :     my($func) = @_;
1172 :    
1173 :     $func =~ s/\s*\#.*$//;
1174 :     return $func;
1175 :     }
1176 :    
1177 :     ##################################
1178 :     # clean commas from the function #
1179 :     ##################################
1180 :     sub clean_commas {
1181 :     my( $func ) = @_;
1182 :    
1183 :     # only if followed by space
1184 :     $func =~ s/, / /g;
1185 :     return $func;
1186 :     }
1187 :    
1188 :     #################################
1189 :     # get EC nums from the function #
1190 :     #################################
1191 :     sub clean_ecs {
1192 :     my( $func ) = @_;
1193 :    
1194 :     my $ecs = [];
1195 :     while ( $func =~ s/\s*[\(\[]EC\s+([0-9\-\.]+)[\)\]],?//g ) {
1196 :     my $ec = $1;
1197 :     # only take them if no '-' is in there
1198 :     if ($ec !~ /\-/) {
1199 :     push( @$ecs, $1 );
1200 :     }
1201 :     }
1202 :     return ( $func, $ecs );
1203 :     }
1204 :    
1205 :     #################################
1206 :     # get TC nums from the function #
1207 :     #################################
1208 :     sub clean_tcs {
1209 :     my($func) = @_;
1210 :    
1211 :     my $tcs = [];
1212 :     while ( $func =~ s/\s*[\(\[]TC\s+([a-zA-Z0-9\-\.]+)[\)\]],?//g ) {
1213 :     push(@$tcs,$1);
1214 :     }
1215 :     return ( $func, $tcs );
1216 :     }
1217 :    
1218 :     __DATA__
1219 :     ABC
1220 :     TRAP
1221 :     ATPase
1222 :     ComM
1223 :     CRISPR
1224 :     C4
1225 :     P6
1226 :     OmpA
1227 :     MotB
1228 :     ATPase
1229 :     YjeE
1230 :     FKBP
1231 :     SSU
1232 :     LSU
1233 :     NADH
1234 :     DNA
1235 :     RNA
1236 :     rRNA
1237 :     tRNA
1238 :     mRNA
1239 :     TRP
1240 :     AmpG
1241 :     AnkB
1242 :     ApaG
1243 :     Apo
1244 :     AraC
1245 :     ArdK
1246 :     AsmA
1247 :     AzlC
1248 :     BarA
1249 :     BatA
1250 :     BatD
1251 :     BolA
1252 :     BsuBI
1253 :     CapK
1254 :     CbbY
1255 :     CcdB
1256 :     Ccm2
1257 :     Che
1258 :     CheW
1259 :     ClpB
1260 :     Cob
1261 :     CopG
1262 :     CreA
1263 :     Cro
1264 :     CtxA
1265 :     CymA
1266 :     CymJ
1267 :     DamX
1268 :     DedA
1269 :     DedD
1270 :     DinG
1271 :     DnaJ
1272 :     DnaK
1273 :     ElaA
1274 :     FlaF
1275 :     FAD
1276 :     FxsA
1277 :     FyuA
1278 :     GatB
1279 :     GlcNAc
1280 :     GlpG
1281 :     GlpM
1282 :     GTP
1283 :     HflC
1284 :     HflK
1285 :     HigB
1286 :     High
1287 :     HipA
1288 :     HlyD
1289 :     IcmF
1290 :     IncF
1291 :     IncW
1292 :     IstB
1293 :     Kef
1294 :     Kup
1295 :     LppC
1296 :     LptA
1297 :     LuxA
1298 :     LuxB
1299 :     LuxC
1300 :     LuxD
1301 :     LuxE
1302 :     LuxG
1303 :     LysR
1304 :     MadN
1305 :     Maf
1306 :     MiaB
1307 :     Mlc
1308 :     Mll3428
1309 :     MotA
1310 :     MoxR
1311 :     Mrp
1312 :     Mrr
1313 :     MshO
1314 :     MutT
1315 :     Na+
1316 :     NAD
1317 :     NfuA
1318 :     NhaP
1319 :     NnrS
1320 :     NupC
1321 :     OpgC
1322 :     OsmC
1323 :     OxaI
1324 :     ParA
1325 :     ParE
1326 :     PmbA
1327 :     ProQ
1328 :     PrpF
1329 :     Psp
1330 :     PutR
1331 :     PvcB
1332 :     PTS
1333 :     RarD
1334 :     Rare
1335 :     RbmA
1336 :     RbmD
1337 :     RecA
1338 :     RelB
1339 :     RelE
1340 :     RfbT
1341 :     Rhs
1342 :     RhsD
1343 :     RloF
1344 :     Rod
1345 :     RstA
1346 :     RstB
1347 :     Rtn
1348 :     O-antigen
1349 :     SanA
1350 :     SeqA
1351 :     SgrR
1352 :     Sll1503
1353 :     Smp
1354 :     SohB
1355 :     SsrA
1356 :     StrA
1357 :     Sua5
1358 :     Syd
1359 :     TagA
1360 :     TagE
1361 :     TetA
1362 :     TetD
1363 :     Tfp
1364 :     TldD
1365 :     TnpA
1366 :     Tol
1367 :     TolA
1368 :     TonB
1369 :     TonB2
1370 :     TorCAD
1371 :     ToxR
1372 :     TraA
1373 :     TraD
1374 :     TraE
1375 :     TraF
1376 :     TraG
1377 :     TraH
1378 :     TraI
1379 :     TraO
1380 :     Trk
1381 :     TrkA
1382 :     Trp
1383 :     TyrA
1384 :     VgrG
1385 :     VirK
1386 :     VvgS
1387 :     WavQ
1388 :     WblB
1389 :     Wzy
1390 :     Xaa
1391 :     Ycg4D
1392 :     YciO
1393 :     YgfY
1394 :     YihE
1395 :     YjeF
1396 :     Ync
1397 :     Ynd
1398 :     ///
1399 :     func: BarA-associated response regulator UvrY (= GacA = SirA)))
1400 :     prod: BarA-associated response regulator UvrY
1401 :     note: Similar to UvrY, GacA, and SirA
1402 :     //
1403 :     func: Putative cytoplasmic protein ,probably associated with Glutathione-regulated potassium-efflux
1404 :     prod: hypothetical protein
1405 :     note: Putative cytoplasmic protein, probably associated with Glutathione-regulated potassium-efflux
1406 :     //
1407 :     func: Aminomethyltransferase (glycine cleavage system T protein)
1408 :     prod: aminomethyltransferase
1409 :     note: glycine cleavage system T protein
1410 :     //
1411 :     func: Outer membrane protein YfgL, lipoprotein component of the protein assembly complex (forms a complex with YaeT, YfiO, and NlpB)
1412 :     prod: YfgL protein
1413 :     note: outer membrane protein
1414 :     note: lipoprotein component of the protein assembly complex; forms a complex with YaeT, YfiO, and NlpB
1415 :     //
1416 :     func: 50S ribosomal subunit maturation GTPase RbgA (B. subtilis YlqF)
1417 :     prod: 50S ribosomal subunit maturation GTPase RbgA
1418 :     //
1419 :     func: Survival protein surA precursor (Peptidyl-prolyl cis-trans isomerase surA)
1420 :     prod: peptidyl-prolyl cis-trans isomerase SurA
1421 :     note: survival protein surA precursor
1422 :     //
1423 :     func: Glycine dehydrogenase [decarboxylating] (glycine cleavage system P protein)
1424 :     prod: glycine dehydrogenase [decarboxylating]
1425 :     note: glycine cleavage system P protein
1426 :     //
1427 :     func: Flavohemoprotein (Hemoglobin-like protein) (Flavohemoglobin) (Nitric oxide dioxygenase)
1428 :     prod: flavohemoprotein
1429 :     //
1430 :     func: Flavohemoprotein (Hemoglobin-like protein) (Flavohemoglobin) (Nitric oxide dioxygenase) (EC 1.14.12.17)
1431 :     prod: flavohemoprotein
1432 :     ecnu: 1.14.12.17
1433 :     //
1434 :     func: Protein export cytoplasm chaperone protein (SecB, maintains protein to be exported in unfolded state)
1435 :     prod: chaperone protein SecB
1436 :     note: cytoplasmic protein
1437 :     note: maintains exported protein in unfolded state
1438 :     //
1439 :     func: GlpG protein (membrane protein of glp regulon)
1440 :     desc: protein GlpG
1441 :     note: membrane protein of glp regulon
1442 :     //
1443 :     func: BatA (Bacteroides aerotolerance operon)
1444 :     prod: protein BatA
1445 :     note: Bacteroides aerotolerance operon
1446 :     //
1447 :     func: Putative inner membrane protein YjeT (clustered with HflC)
1448 :     prod: protein YjeT
1449 :     note: inner membrane protein
1450 :     note: clustered with HflC
1451 :     //
1452 :     func: Putative inner membrane protein (Fragment)
1453 :     prod: hypothetical protein
1454 :     //
1455 :     func: Proline dehydrogenase (Proline oxidase)
1456 :     prod: proline dehydrogenase
1457 :     prod: proline oxidase
1458 :     //
1459 :     func: Signal recognition particle receptor protein FtsY (=alpha subunit) (TC 3.A.5.1.1)
1460 :     desc: signal recognition particle receptor protein FtsY
1461 :     note: alpha subunit
1462 :     note: TC 3.A.5.1.1
1463 :     //
1464 :     func: Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
1465 :     prod: ferredoxin-NADPH reductase
1466 :     note: flavodoxin reductases, family 1
1467 :     //
1468 :     func: Ferredoxin-type protein NapF (periplasmic nitrate reductase)
1469 :     prod: nitrate reductase
1470 :     desc: ferredoxin-type protein NapF
1471 :     note: periplasmic
1472 :     //
1473 :     func: Aminoacyl-histidine dipeptidase (Peptidase D)
1474 :     prod: aminoacyl-histidine dipeptidase
1475 :     desc: Peptidase D
1476 :     //
1477 :     func: Signal recognition particle receptor protein FtsY (=alpha subunit)
1478 :     prod: signal recognition particle receptor protein FtsY
1479 :     note: alpha subunit
1480 :     //
1481 :     func: 23S rRNA (guanine-N-2-) -methyltransferase rlmL EC 2.1.1.-)
1482 :     prod: 23S rRNA (guanine-N-2-)-methyltransferase rlmL
1483 :     //
1484 :     func: Beta N-acetyl-glucosaminidase( EC 3.2.1.52 )
1485 :     prod: beta N-acetyl-glucosaminidase
1486 :     ecnu: 3.2.1.52
1487 :     //
1488 :     func: (U59485) AttH
1489 :     prod: hypothetical protein
1490 :     //
1491 :     func: 18K peptidoglycan-associated outer membrane lipoprotein
1492 :     prod: peptidoglycan-associated outer membrane lipoprotein
1493 :     //
1494 :     func: OmpA/MotB precursor
1495 :     prod: OmpA precursor
1496 :     //
1497 :     func: (GlcNAc)2 ABC transporter, periplasmic substrate-binding protein
1498 :     prod: (GlcNAc)2 ABC transporter: substrate-binding protein
1499 :     //
1500 :     func: Peptidoglycan-associated lipoprotein precursor
1501 :     prod: Peptidoglycan-associated lipoprotein
1502 :     //
1503 :     func: CRISPR-associated helicase Cas3, protein
1504 :     prod: CRISPR-associated helicase Cas3
1505 :     //
1506 :     func: Homolog of E. coli HemX protein
1507 :     prod: HemX-like protein
1508 :     //
1509 :     func: Homolog of E. coli HemY protein
1510 :     prod: HemY-like protein
1511 :     //
1512 :     func: Hypothetical protein
1513 :     prod: hypothetical protein
1514 :     //
1515 :     func: hypothetical protein
1516 :     prod: hypothetical protein
1517 :     //
1518 :     func: conserved domain protein
1519 :     prod: hypothetical protein
1520 :     //
1521 :     func: Conserved domain protein
1522 :     prod: hypothetical protein
1523 :     //
1524 :     func: unknown
1525 :     prod: hypothetical protein
1526 :     //
1527 :     func: predicted by FrameD
1528 :     prod: hypothetical protein
1529 :     //
1530 :     func: Frataxin homolog CyaY, facilitates iron supply for heme A synthesis or Fe-S cluster assembly
1531 :     prod: frataxin CyaY
1532 :     note: facilitates iron supply for heme A synthesis or Fe-S cluster assembly
1533 :     //
1534 :     func: ATPase YjeE, predicted to have essential role in cell wall biosynthesis
1535 :     prod: ATPase YjeE
1536 :     note: predicted to have essential role in cell wall biosynthesis
1537 :     //
1538 :     func: Permease of the drug/metabolite transporter (DMT) superfamily
1539 :     prod: permease
1540 :     desc: permease of the drug/metabolite transporter (DMT) superfamily
1541 :     //
1542 :     func: Permeases of the drug/metabolite transporter (DMT) superfamily
1543 :     prod: permease
1544 :     desc: permease of the drug/metabolite transporter (DMT) superfamily
1545 :     //
1546 :     func: Phosphate transport regulator (distant homolog of PhoU)
1547 :     prod: phosphate transport regulator
1548 :     note: distant homolog of PhoU
1549 :     //
1550 :     func: Unsaturated fatty acid biosythesis repressor FabR, TetR family
1551 :     prod: unsaturated fatty acid biosythesis repressor FabR
1552 :     note: TetR family regulator
1553 :     //
1554 :     func: 33 kDa chaperonin
1555 :     prod: heat-shock chaperonin
1556 :     //
1557 :     func: Ribosome-associated heat shock protein implicated in the recycling of the 50S subunit (S4 paralog)
1558 :     prod: ribosome-associated heat shock protein
1559 :     note: implicated in the recycling of the LSU (S4 paralog)
1560 :     //
1561 :     func: TRANSCRIPTION ACCESSORY PROTEIN (S1 RNA binding domain)
1562 :     prod: transcription accessory protein
1563 :     note: S1 RNA binding domain
1564 :     //
1565 :     func: MiaB-like tRNA modifying enzyme YliG, TIGR01125
1566 :     prod: MiaB-like tRNA modifying enzyme YliG
1567 :     note: TIGR01125
1568 :     //
1569 :     func: Phosphoribulokinase (EC 2.7.1.19) homolog, function unknown
1570 :     prod: hypothetical protein
1571 :     note: phosphoribulokinase homolog of unknown function
1572 :     //
1573 :     func: Hydrolase, alpha/beta fold family functionally coupled to Phosphoribulokinase
1574 :     prod: alpha/beta fold family hydrolase
1575 :     note: functionally coupled to phosphoribulokinase
1576 :     //
1577 :     func: LptA, protein essential for LPS transport across the periplasm
1578 :     prod: LptA protein
1579 :     note: essential for LPS transport across the periplasm
1580 :     //
1581 :     func: Uncharacterized protein YrbK clustered with lipopolysaccharide transporters
1582 :     prod: YrbK protein
1583 :     note: clustered with lipopolysaccharide transporters
1584 :     //
1585 :     func: Inner membrane protein YrbG, predicted calcium/sodium:proton antiporter
1586 :     prod: YrbG protein
1587 :     note: inner membrane protein, predicted calcium/sodium:proton antiporter
1588 :     //
1589 :     func: Uncharacterized ABC transporter, periplasmic component YrbD
1590 :     prod: uncharacterized ABC transporter, periplasmic component YrbD
1591 :     //
1592 :     func: Phosphate starvation-inducible protein PhoH, predicted ATPase
1593 :     prod: phosphate starvation-inducible protein PhoH
1594 :     note: predicted ATPase
1595 :     //
1596 :     func: HD-GYP domain
1597 :     prod: HD-GYP domain-containing protein
1598 :     //
1599 :     func: Predicted ATP-dependent endonuclease of the OLD family
1600 :     prod: ATP-dependent endonuclease
1601 :     note: predicted ATP-dependent endonuclease of the OLD family
1602 :     //
1603 :     func: No significant database matches
1604 :     prod: hypothetical protein
1605 :     //
1606 :     func: COG0110: Acetyltransferase (isoleucine patch superfamily)
1607 :     prod: acetyltransferase
1608 :     note: isoleucine patch superfamily
1609 :     //
1610 :     func: Metalloprotease, putative zinc-binding domain
1611 :     prod: metalloprotease
1612 :     note: putative zinc-binding domain
1613 :     //
1614 :     func: YjeF protein, function unknown
1615 :     prod: YjeF protein
1616 :     //
1617 :     func: Phosphate ABC transporter, periplasmic phosphate-binding protein pstS (TC 3.A.1.7.1)
1618 :     prod: phosphate ABC transporter, periplasmic phosphate-binding protein pstS
1619 :     note: TC 3.A.1.7.1
1620 :     //
1621 :     func: Methyl-accepting chemotaxis protein III (mcp-III) (ribose and galactose chemoreceptor protein)
1622 :     prod: methyl-accepting chemotaxis protein III
1623 :     note: ribose and galactose chemoreceptor protein
1624 :     //
1625 :     func: ABC transporter, transmembrane region:ABC transporter:Peptidase C39, bacteriocin processing
1626 :     prod: ABC transporter transmembrane region
1627 :     //
1628 :     func: fig|345076.3.peg.2944 homologs, predicted periplasmic protein
1629 :     prod: hypothetical protein
1630 :     note: predicted periplasmic protein
1631 :     //
1632 :     func: Phosphosugar mutase of unknown sugar (see annotation)
1633 :     prod: phosphosugar mutase
1634 :     note: phosphosugar mutase of unknown sugar
1635 :     //
1636 :     func: Maltoporin (maltose/maltodextrin high-affinity receptor, phage lambda receptor protein)
1637 :     prod: maltoporin
1638 :     note: maltose/maltodextrin high-affinity receptor, phage lambda receptor protein
1639 :     //
1640 :     func: Predicted Lactate-responsive regulator, LysR family
1641 :     prod: transcriptional regulator LysR family
1642 :     note: predicted Lactate-responsive regulator
1643 :     //
1644 :     func: Permease of the major facilitator superfamily
1645 :     prod: permease
1646 :     note: permease of the major facilitator superfamily
1647 :     //
1648 :     func: Maltose/maltodextrin ABC transporter, substrate binding periplasmic protein MalE
1649 :     prod: maltose/maltodextrin ABC transporter substrate binding periplasmic protein MalE
1650 :     //
1651 :     func: AraC-type DNA-binding domain-containing protein
1652 :     prod: AraC-type DNA-binding domain-containing protein
1653 :     //
1654 :     func: Transposase and inactivated derivatives
1655 :     prod: transposase
1656 :     //
1657 :     func: ABC-type phosphate transport system, periplasmic component
1658 :     prod: ABC-type phosphate transport system periplasmic component
1659 :     //
1660 :     func: Arginine ABC transporter, periplasmic arginine-binding protein ArtI
1661 :     prod: arginine ABC transporter periplasmic arginine-binding protein ArtI
1662 :     //
1663 :     func: Unknown, probable transcription regulator
1664 :     prod: hypothetical protein
1665 :     desc: probable transcription regulator
1666 :     //
1667 :     func: orf, conserved hypothetical protein
1668 :     prod: hypothetical protein
1669 :     //
1670 :     func: Iron-containing alcohol dehydrogenase
1671 :     prod: iron-containing alcohol dehydrogenase
1672 :     //
1673 :     func: NnrS protein involved in response to NO
1674 :     prod: NnrS protein
1675 :     desc: involved in response to NO
1676 :     //
1677 :     func: Uncharacterized protein, similar to the N-terminal domain of Lon protease
1678 :     prod: hypothetical protein
1679 :     note: similar to the N-terminal domain of Lon protease
1680 :     //
1681 :     func: Holin-like protein cidA
1682 :     prod: holin-like protein cidA
1683 :     //
1684 :     func: TRAP-type transport system, periplasmic component, predicted N-acetylneuraminate-binding protein
1685 :     prod: TRAP-type transport system periplasmic component
1686 :     note: predicted N-acetylneuraminate-binding protein
1687 :     //
1688 :     func: TRAP-type transport system, small permease component, predicted N-acetylneuraminate transporter
1689 :     prod: TRAP-type transport system small permease component
1690 :     note: predicted N-acetylneuraminate transporter
1691 :     //
1692 :     func: TRAP-type transport system, large permease component, predicted N-acetylneuraminate transporter
1693 :     prod: TRAP-type transport system large permease component
1694 :     note: predicted N-acetylneuraminate transporter
1695 :     //
1696 :     func: Type III secretion inner membrane channel protein (LcrD,HrcV,EscV,SsaV)
1697 :     prod: Type III secretion inner membrane channel protein
1698 :     note: LcrD, HrcV, EscV, SsaV
1699 :     //
1700 :     func: Type III secretion inner membrane protein (YscU,SpaS,EscU,HrcU,SsaU, homologous to flagellar export components)
1701 :     prod: Type III secretion inner membrane protein
1702 :     desc: homologous to flagellar export components
1703 :     note: YscU, SpaS, EscU, HrcU, SsaU
1704 :     //
1705 :     func: Type III secretion cytoplasmic ATP synthase (EC 3.6.3.14, YscN,SpaL,MxiB,HrcN,EscN)
1706 :     prod: Type III secretion cytoplasmic ATP synthase
1707 :     ecnu: 3.6.3.14
1708 :     //
1709 :     func: NAD(FAD)-utilizing dehydrogenase, sll0175 homolog
1710 :     prod: NAD(FAD)-utilizing dehydrogenase
1711 :     //
1712 :     func: thermostable direct hemolysin S
1713 :     prod: hemolysin S
1714 :     //
1715 :     func: Putative predicted metal-dependent hydrolase
1716 :     prod: hypothetical protein
1717 :     desc: predicted metal-dependent hydrolase
1718 :     //
1719 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase fkpA precursor (EC 5.2.1.8)
1720 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase FkpA precursor
1721 :     ecnu: 5.2.1.8
1722 :     //
1723 :     func: FOG: WD40 repeat
1724 :     prod: hypothetical protein
1725 :     //
1726 :     func: Protein slyX
1727 :     prod: protein SlyX
1728 :     //
1729 :     func: Transporter, putative
1730 :     prod: transporter
1731 :     //
1732 :     func: Type 4 fimbrial assembly protein pilC
1733 :     prod: type 4 fimbrial assembly protein PilC
1734 :     //
1735 :     func: YgfY COG2938
1736 :     prod: hypothetical protein
1737 :     //
1738 :     func: COG0354: Predicted aminomethyltransferase related to GcvT
1739 :     prod: predicted aminomethyltransferase related to GcvT
1740 :     //
1741 :     func: Signal recognition particle receptor protein FtsY (=alpha subunit) (TC 3.A.5.1.1)
1742 :     prod: signal recognition particle receptor protein FtsY
1743 :     //
1744 :     func: Protein of unknown function DUF484
1745 :     prod: hypothetical protein
1746 :     //
1747 :     func: Protein of unknown function DUF414
1748 :     prod: hypothetical protein
1749 :     //
1750 :     func: Periplasmic/membrane protein associated with DUF414
1751 :     prod: hypothetical protein
1752 :     //
1753 :     func: Thiosulfate sulfurtransferase glpE (EC 2.8.1.1)
1754 :     prod: thiosulfate sulfurtransferase GlpE
1755 :     ecnu: 2.8.1.1
1756 :     //
1757 :     func: GlpG protein (membrane protein of glp regulon)
1758 :     prod: protein GlpG
1759 :     note: membrane protein of glp regulon
1760 :     //
1761 :     func: Flagellar biosynthesis protein fliL
1762 :     prod: flagellar biosynthesis protein FliL
1763 :     //
1764 :     func: COG3165: Uncharacterized protein conserved in bacteria
1765 :     prod: hypothetical protein
1766 :     //
1767 :     func: Uncharacterized protein conserved in bacteria
1768 :     prod: hypothetical protein
1769 :     //
1770 :     func: Ferritin-like protein 2
1771 :     prod: ferritin-like protein 2
1772 :     //
1773 :     func: LysR-family transcriptional regulator VC0068
1774 :     prod: LysR-family transcriptional regulator
1775 :     //
1776 :     func: Protein crcB homolog
1777 :     prod: CrbC-like protein
1778 :     //
1779 :     func: DNA-binding protein fis
1780 :     prod: NA-binding protein Fis
1781 :     //
1782 :     func: COG3068: Uncharacterized protein conserved in bacteria
1783 :     prod: hypothetical protein
1784 :     //
1785 :     func: O-antigen export system, ATP-binding protein
1786 :     prod: O-antigen export system ATP-binding protein
1787 :     //
1788 :     func: O-antigen export system, permease protein
1789 :     prod: O-antigen export system permease protein
1790 :     //
1791 :     func: O-antigen export system, polymerase or transferase
1792 :     prod: O-antigen export system polymerase or transferase
1793 :     //
1794 :     func: Protein yicC
1795 :     prod: protein YicC
1796 :     //
1797 :     func: Ferrichrome transport system permease protein fhuB (TC 3.A.1.14.3)
1798 :     prod: ferrichrome transport system permease protein FhuB
1799 :     note: TC 3.A.1.14.3
1800 :     //
1801 :     func: Ferrichrome transport ATP-binding protein fhuC (TC 3.A.1.14.3)
1802 :     prod: ferrichrome transport ATP-binding protein FhuC
1803 :     note: TC 3.A.1.14.3
1804 :     //
1805 :     func: HTH-type transcriptional regulator ilvY
1806 :     prod: HTH-type transcriptional regulator IlvY
1807 :     //
1808 :     func: putative transcriptional regulator
1809 :     prod: transcriptional regulator
1810 :     //
1811 :     func: galactoside O-acetyltransferase (EC 2.3.1.18), probable yiiD
1812 :     prod: galactoside O-acetyltransferase
1813 :     desc: probable YiiD
1814 :     ecnu: 2.3.1.18
1815 :     //
1816 :     func: P pilus assembly/Cpx signaling pathway, periplasmic inhibitor/zinc- resistance associated protein
1817 :     prod: P pilus assembly/Cpx signaling pathway, periplasmic inhibitor/zinc- resistance associated protein
1818 :     //
1819 :     func: ATP-dependent protease hslV (EC 3.4.25.-)
1820 :     prod: ATP-dependent protease HslV
1821 :     //
1822 :     func: ATP-dependent hsl protease ATP-binding subunit hslU
1823 :     prod: ATP-dependent hsl protease ATP-binding subunit HslU
1824 :     //
1825 :     func: Uncharacterized low-complexity protein
1826 :     prod: hypothetical protein
1827 :     //
1828 :     func: Glutathione-regulated potassium-efflux system ancillary protein kefG
1829 :     prod: glutathione-regulated potassium-efflux system ancillary protein KefG
1830 :     //
1831 :     func: Glutathione-regulated potassium-efflux system protein kefB
1832 :     prod: glutathione-regulated potassium-efflux system protein KefB
1833 :     //
1834 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase slyD (EC 5.2.1.8)
1835 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase SlyD
1836 :     ecnu: 5.2.1.8
1837 :     //
1838 :     func: Sodium-type polar flagellar protein motX
1839 :     prod: sodium-type polar flagellar protein MotX
1840 :     //
1841 :     func: 23S rRNA (guanosine-2'-O-) -methyltransferase rlmB (EC 2.1.1.-)
1842 :     prod: 23S rRNA (guanosine-2'-O-) -methyltransferase RlmB
1843 :     //
1844 :     func: Preprotein translocase secY subunit (TC 3.A.5.1.1)
1845 :     prod: preprotein translocase SecY subunit
1846 :     note: TC 3.A.5.1.1
1847 :     //
1848 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase fklB (EC 5.2.1.8)
1849 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase FklB
1850 :     ecnu: 5.2.1.8
1851 :     //
1852 :     func: Protein ytfJ precursor
1853 :     prod: protein YtfJ precursor
1854 :     //
1855 :     func: Peptide methionine sulfoxide reductase msrA (EC 1.8.4.11)
1856 :     prod: peptide methionine sulfoxide reductase MsrA
1857 :     ecnu: 1.8.4.11
1858 :     //
1859 :     func: RNA polymerase sigma-54 factor rpoN
1860 :     prod: RNA polymerase sigma-54 factor RpoN
1861 :     //
1862 :     func: Aspartate carbamoyltransferase regulatory chain (pyrI)
1863 :     prod: aspartate carbamoyltransferase regulatory chain PyrI
1864 :     //
1865 :     func: RNA polymerase associated protein rapA (EC 3.6.1.-)
1866 :     prod: RNA polymerase associated protein RapA
1867 :     //
1868 :     func: DNA primase; involved in replication, phage related
1869 :     prod: DNA primase
1870 :     note: phage related
1871 :     //
1872 :     func: Zn-dependent protease
1873 :     prod: Zn-dependent protease
1874 :     //
1875 :     func: Osmosensitive K+ channel histidine kinase kdpD (EC 2.7.3.-)
1876 :     prod: osmosensitive K+ channel histidine kinase KdpD
1877 :     //
1878 :     func: COG0523: Putative GTPases (G3E family)
1879 :     prod: Putative GTPase (G3E family)
1880 :     //
1881 :     func: H(+)/Cl(-) exchange transporter clcA
1882 :     prod: H(+)/Cl(-) exchange transporter ClcA
1883 :     //
1884 :     func: relB protein
1885 :     prod: RelB protein
1886 :     //
1887 :     func: mazG-related protein
1888 :     prod: MazG-related protein
1889 :     //
1890 :     func: Sulfate and thiosulfate binding protein cysP
1891 :     prod: sulfate and thiosulfate binding protein CysP
1892 :     //
1893 :     func: CcdB
1894 :     prod: CcdB protein
1895 :     //
1896 :     func: Glycine dehydrogenase [decarboxylating] (glycine cleavage system P protein) (EC 1.4.4.2)
1897 :     prod: glycine dehydrogenase [decarboxylating]
1898 :     ecnu: 1.4.4.2
1899 :     //
1900 :     func: C4-dicarboxylate like transporter
1901 :     prod: C4-dicarboxylate like transporter
1902 :     //
1903 :     func: Anaerobic nitric oxide reductase transcription regulator norR
1904 :     prod: anaerobic nitric oxide reductase transcription regulator NorR
1905 :     //
1906 :     func: Nucleoside permease nupC
1907 :     prod: nucleoside permease NupC
1908 :     //
1909 :     func: frnE protein
1910 :     prod: FrnE protein
1911 :     //
1912 :     func: hypothetical protein PA3071
1913 :     prod: hypothetical protein
1914 :     //
1915 :     func: Uncharacterized protein similar to VCA0109
1916 :     prod: hypothetical protein
1917 :     //
1918 :     func: Phosphate transport ATP-binding protein pstB (TC 3.A.1.7.1)
1919 :     prod: phosphate transport ATP-binding protein PstB
1920 :     note: TC 3.A.1.7.1
1921 :     //
1922 :     func: Phosphate transport system permease protein pstA (TC 3.A.1.7.1)
1923 :     prod: phosphate transport system permease protein PstA
1924 :     note: TC 3.A.1.7.1
1925 :     //
1926 :     func: Phosphate transport system permease protein pstC (TC 3.A.1.7.1)
1927 :     prod: phosphate transport system permease protein PstC
1928 :     note: TC 3.A.1.7.1
1929 :     //
1930 :     func: Phosphate ABC transporter, periplasmic phosphate-binding protein pstS (TC 3.A.1.7.1)
1931 :     prod: phosphate ABC transporter, periplasmic phosphate-binding protein pstS
1932 :     note: TC 3.A.1.7.1
1933 :     //
1934 :     func: ATP-dependent RNA helicase VCA0061
1935 :     prod: ATP-dependent RNA helicase
1936 :     //
1937 :     func: ATP-dependent DNA helicase pcrA (EC 3.6.1.-)
1938 :     prod: ATP-dependent DNA helicase PcrA
1939 :     //
1940 :     func: hcp protein
1941 :     prod: Hcp protein
1942 :     //
1943 :     func: Predicted P-loop ATPase fused to an acetyltransferase COG1444
1944 :     prod: hypothetical protein
1945 :     desc: predicted P-loop ATPase fused to an acetyltransferase
1946 :     //
1947 :     func: Na+/H+ antiporter NhaD type
1948 :     prod: Na+/H+ antiporter NhaD type
1949 :     //
1950 :     func: ATP-dependent RNA helicase VCA0990
1951 :     prod: ATP-dependent RNA helicase
1952 :     //
1953 :     func: Na+-driven multidrug efflux pump
1954 :     prod: Na+-driven multidrug efflux pump
1955 :     //
1956 :     func: Peptidyl-prolyl cis-trans isomerase ppiC (EC 5.2.1.8)
1957 :     prod: peptidyl-prolyl cis-trans isomerase PpiC
1958 :     ecnu: 5.2.1.8
1959 :     //
1960 :     func: Osmosensitive K+ channel histidine kinase kdpD (EC 2.7.3.-)
1961 :     prod: osmosensitive K+ channel histidine kinase KdpD
1962 :     //
1963 :     func: COG3385: FOG: Transposase and inactivated derivatives
1964 :     prod: transposase
1965 :     //
1966 :     func: COG0055: F0F1-type ATP synthase, beta subunit
1967 :     prod: F0F1-type ATP synthase beta subunit
1968 :     //
1969 :     func: Streptococcal hemagglutinin protein
1970 :     prod: hemagglutinin protein
1971 :     //
1972 :     func: LysR-family transcriptional regulator VCA0830
1973 :     prod: LysR-family transcriptional regulator
1974 :     //
1975 :     func: COG2827: putative endonuclease containing a URI domain
1976 :     prod: putative endonuclease containing a URI domain
1977 :     //
1978 :     func: Autoinducer 2-binding periplasmic protein luxP precursor
1979 :     prod: autoinducer 2-binding periplasmic protein LuxP precursor
1980 :     //
1981 :     func: Autoinducer 2 sensor kinase/phosphatase luxQ (EC 2.7.3.-) (EC 3.1.3.-)
1982 :     prod: autoinducer 2 sensor kinase/phosphatase LuxQ
1983 :     //
1984 :     func: Molybdenum ABC transporter, periplasmic molybdenum-binding protein modA (TC 3.A.1.8.1)
1985 :     prod: molybdenum ABC transporter, periplasmic molybdenum-binding protein ModA
1986 :     note: TC 3.A.1.8.1
1987 :     //
1988 :     func: Molybdenum transport system permease protein modB (TC 3.A.1.8.1)
1989 :     prod: molybdenum transport system permease protein ModB
1990 :     note: TC 3.A.1.8.1
1991 :     //
1992 :     func: Molybdenum transport ATP-binding protein modC (TC 3.A.1.8.1)
1993 :     prod: molybdenum transport ATP-binding protein ModC
1994 :     note: TC 3.A.1.8.1
1995 :     //
1996 :     func: Periplasmic protein torT precursor
1997 :     prod: periplasmic protein TorT precursor
1998 :     //
1999 :     func: Sensor protein torS (EC 2.7.3.-)
2000 :     prod: sensor protein TorS
2001 :     //
2002 :     func: COG4388: Mu-like prophage I protein
2003 :     prod: phage protein
2004 :     desc: Mu-like prophage I protein
2005 :     //
2006 :     func: prophage MuSo2, virion morphogenesis protein, putative
2007 :     prod: phage protein
2008 :     desc: prophage MuSo2, virion morphogenesis protein, putative
2009 :     //
2010 :     func: phage tail tape measure protein, TP901 family, putative
2011 :     prod: phage tail tape measure protein
2012 :     desc: TP901 family
2013 :     //
2014 :     func: prophage MuSo2, 43 kDa tail protein, putative
2015 :     prod: phage tail protein
2016 :     //
2017 :     func: Putative baseplate assembly protein
2018 :     prod: phage protein
2019 :     desc: putative baseplate assembly protein
2020 :     //
2021 :     func: Protein-export membrane protein secD (TC 3.A.5.1.1)
2022 :     prod: protein-export membrane protein SecD
2023 :     desc: TC 3.A.5.1.1
2024 :     //
2025 :     func: Protein-export membrane protein secF (TC 3.A.5.1.1)
2026 :     prod: protein-export membrane protein SecF
2027 :     desc: TC 3.A.5.1.1
2028 :     //
2029 :     func: Anaerobic C4-dicarboxylate transporter dcuC
2030 :     prod: anaerobic C4-dicarboxylate transporter DcuC
2031 :     //
2032 :     func: RRNA methylase, putative
2033 :     prod: rRNA methylase
2034 :     //
2035 :     func: Oligopeptide transport system permease protein oppB (TC 3.A.1.5.1)
2036 :     prod: oligopeptide transport system permease protein OppB
2037 :     desc: TC 3.A.1.5.1
2038 :     //
2039 :     func: Oligopeptide transport system permease protein oppC
2040 :     prod: oligopeptide transport system permease protein OppC
2041 :     //
2042 :     func: Tyrosine recombinase xerD
2043 :     prod: tyrosine recombinase XerD
2044 :     //
2045 :     func: Cell division protein ftsL
2046 :     prod: cell division protein FtsL
2047 :     //
2048 :     func: Cell division protein ftsI [Peptidoglycan synthetase] (EC 2.4.1.129)
2049 :     prod: cell division protein FtsI [Peptidoglycan synthetase]
2050 :     ecnu: 2.4.1.129
2051 :     //
2052 :     func: Cell division protein ftsW
2053 :     prod: cell division protein FtsW
2054 :     //
2055 :     func: Cell division protein ftsQ
2056 :     prod: cell division protein FtsQ
2057 :     //
2058 :     func: Cell division protein ftsA
2059 :     prod: cell division protein FtsA
2060 :     //
2061 :     func: Cell division protein ftsZ (EC 3.4.24.-)
2062 :     prod: cell division protein FtsZ
2063 :     //
2064 :     func: Mutator mutT protein (7,8-dihydro-8-oxoguanine-triphosphatase) (EC 3.6.1.-)
2065 :     prod: MutT protein [7,8-dihydro-8-oxoguanine-triphosphatase]
2066 :     //
2067 :     func: Aerobic respiration control sensor protein arcB (EC 2.7.3.-)
2068 :     prod: aerobic respiration control sensor protein ArcB
2069 :     //
2070 :     func: Aerobic respiration control protein arcA
2071 :     prod: aerobic respiration control protein ArcA
2072 :     //
2073 :     func: UPF0246 protein YaaA
2074 :     prod: hypothetical protein
2075 :     //
2076 :     func: Chromosome segregation ATPase ## putative; UPF0325 protein yaeH
2077 :     prod: chromosome segregation ATPase
2078 :     //
2079 :     func: Hypothetical protein Q8DBD3_VIBVU
2080 :     prod: hypothetical protein
2081 :     //
2082 :     func: putative exported protein
2083 :     prod: hypothetical protein
2084 :     //
2085 :     func: Flagellar biosynthesis protein flgN
2086 :     prod: flagellar biosynthesis protein FlgN
2087 :     //
2088 :     func: Negative regulator of flagellin synthesis flgM
2089 :     prod: negative regulator of flagellin synthesis FlgM
2090 :     //
2091 :     func: Flagellar basal-body P-ring formation protein flgA
2092 :     prod: flagellar basal-body P-ring formation protein FlgA
2093 :     //
2094 :     func: Flagellar basal-body rod protein flgB
2095 :     prod: flagellar basal-body rod protein FlgB
2096 :     //
2097 :     func: Flagellar basal-body rod protein flgC
2098 :     prod: flagellar basal-body rod protein FlgC
2099 :     //
2100 :     func: Flagellar basal-body rod modification protein flgD
2101 :     prod: flagellar basal-body rod modification protein FlgD
2102 :     //
2103 :     func: Flagellar hook protein flgE
2104 :     prod: flagellar hook protein FlgE
2105 :     //
2106 :     func: Flagellar basal-body rod protein flgF
2107 :     prod: flagellar basal-body rod protein FlgF
2108 :     //
2109 :     func: Flagellar basal-body rod protein flgG
2110 :     prod: flagellar basal-body rod protein FlgG
2111 :     //
2112 :     func: Flagellar L-ring protein flgH
2113 :     prod: flagellar L-ring protein FlgH
2114 :     //
2115 :     func: Flagellar P-ring protein flgI
2116 :     prod: flagellar P-ring protein FlgI
2117 :     //
2118 :     func: Flagellar protein flgJ [peptidoglycan hydrolase] (EC 3.2.1.-)
2119 :     prod: flagellar protein flgJ [peptidoglycan hydrolase]
2120 :     //
2121 :     func: Flagellar hook-associated protein flgK
2122 :     prod: flagellar hook-associated protein FlgK
2123 :     //
2124 :     func: Flagellar hook-associated protein flgL
2125 :     prod: flagellar hook-associated protein FlgL
2126 :     //
2127 :     func: Flagellin protein flaC
2128 :     prod: flagellin protein FlaC
2129 :     //
2130 :     func: Flagellin protein flaD
2131 :     prod: flagellin protein FlaD
2132 :     //
2133 :     func: Outer membrane protein NlpB, lipoprotein component of the protein assembly complex (forms a complex with YaeT, YfiO, and YfgL)
2134 :     prod: NlpB lipoprotein component of the protein assembly complex
2135 :     note: most likely function alternative not yet resolved
2136 :     //
2137 :     func: Lipoprotein-34 precursor
2138 :     prod: lipoprotein
2139 :     //
2140 :     func: Flagellin protein flaF
2141 :     prod: flagellin protein FlaF
2142 :     //
2143 :     func: Flagellin protein flaG
2144 :     prod: flagellin protein FlaG
2145 :     //
2146 :     func: Flagellar hook-associated protein fliD
2147 :     prod: flagellar hook-associated protein FliD
2148 :     //
2149 :     func: Flagellar rod protein flaI
2150 :     prod: flagellar rod protein FlaI
2151 :     //
2152 :     func: Flagellar biosynthesis protein fliS
2153 :     prod: flagellar biosynthesis protein FliS
2154 :     //
2155 :     func: Flagellar regulatory protein fleQ
2156 :     prod: flagellar regulatory protein FleQ
2157 :     //
2158 :     func: Flagellar sensor histidine kinase fleS
2159 :     prod: flagellar sensor histidine kinase FleS
2160 :     //
2161 :     func: Flagellar hook-basal body complex protein fliE
2162 :     prod: flagellar hook-basal body complex protein FliE
2163 :     //
2164 :     func: Flagellar M-ring protein fliF
2165 :     prod: flagellar M-ring protein FliF
2166 :     //
2167 :     func: Flagellar motor switch protein fliG
2168 :     prod: flagellar motor switch protein FliG
2169 :     //
2170 :     func: Flagellar assembly protein fliH
2171 :     prod: flagellar assembly protein FliH
2172 :     //
2173 :     func: Flagellum-specific ATP synthase fliI
2174 :     prod: flagellum-specific ATP synthase FliI
2175 :     //
2176 :     func: Flagellar protein fliJ
2177 :     prod: flagellar protein FliJ
2178 :     //
2179 :     func: Flagellar hook-length control protein fliK
2180 :     prod: flagellar hook-length control protein FliK
2181 :     //
2182 :     func: Flagellar biosynthesis protein fliL
2183 :     prod: flagellar biosynthesis protein FliL
2184 :     //
2185 :     func: Flagellar motor switch protein fliM
2186 :     prod: flagellar motor switch protein FliM
2187 :     //
2188 :     func: Flagellar motor switch protein fliN
2189 :     prod: flagellar motor switch protein FliN
2190 :     //
2191 :     func: Flagellar biosynthesis protein fliO
2192 :     prod: flagellar biosynthesis protein FliO
2193 :     //
2194 :     func: Flagellar biosynthesis protein fliP
2195 :     prod: flagellar biosynthesis protein FliP
2196 :     //
2197 :     func: Flagellar biosynthesis protein fliQ
2198 :     prod: flagellar biosynthesis protein FliQ
2199 :     //
2200 :     func: Flagellar biosynthesis protein fliR
2201 :     prod: flagellar biosynthesis protein FliR
2202 :     //
2203 :     func: Flagellar biosynthesis protein flhB
2204 :     prod: flagellar biosynthesis protein FlhB
2205 :     //
2206 :     func: Flagellar biosynthesis protein flhA
2207 :     prod: flagellar biosynthesis protein FlhA
2208 :     //
2209 :     func: Flagellar biosynthesis protein flhF
2210 :     prod: flagellar biosynthesis protein FlhF
2211 :     //
2212 :     func: Flagellar synthesis regulator fleN
2213 :     prod: flagellar synthesis regulator FleN
2214 :     //
2215 :     func: 5-methylaminomethyl-2-thiouridine-forming enzyme mnmC
2216 :     prod: 5-methylaminomethyl-2-thiouridine-forming enzyme MnmC
2217 :     //
2218 :     func: Holin-like protein cidA
2219 :     prod: Holin-like protein CidA
2220 :     //
2221 :     func: Hypothetical protein ybgI
2222 :     prod: hypothetical protein
2223 :     //
2224 :     func: Cytochrome c-type biogenesis protein CcmC, putative heme lyase for CcmE
2225 :     prod: cytochrome c-type biogenesis protein CcmC
2226 :     desc: desc: putative heme lyase for CcmE
2227 :     //
2228 :     func: UPF0352 protein VC_2040
2229 :     prod: hypothetical protein
2230 :     //
2231 :     func: Nucleoid-associated protein ndpA
2232 :     prod: nucleoid-associated protein NdpA
2233 :     //
2234 :     func: Na+/H+ antiporter NhaC
2235 :     prod: Na+/H+ antiporter NhaC
2236 :     //
2237 :     func: Peptide methionine sulfoxide reductase msrB (EC 1.8.4.6)
2238 :     prod: peptide methionine sulfoxide reductase MsrB
2239 :     ecnu: 1.8.4.11
2240 :     //
2241 :     func: Transcriptional regulator yidN, Cro/CI family
2242 :     prod: transcriptional regulator YidN, Cro/CI family
2243 :     //
2244 :     func: COGs COG3492
2245 :     prod: hypothetical protein
2246 :     //
2247 :     func: Cell division topological specificity factor minE
2248 :     prod: cell division topological specificity factor MinE
2249 :     //
2250 :     func: Septum site-determining protein minD
2251 :     prod: septum site-determining protein MinD
2252 :     //
2253 :     func: Septum site-determining protein minC
2254 :     prod: septum site-determining protein MinC
2255 :     //
2256 :     func: Protein ycgL
2257 :     prod: protein YcgL
2258 :     //
2259 :     func: Cytochrome c-type protein torY
2260 :     prod: cytochrome c-type protein TorY
2261 :     //
2262 :     func: pvcA protein
2263 :     prod: PvcA protein
2264 :     //
2265 :     func: ATP-dependent Clp protease ATP-binding subunit clpX
2266 :     prod: ATP-dependent Clp protease ATP-binding subunit ClpX
2267 :     //
2268 :     func: Peptidyl-prolyl cis-trans isomerase ppiD (EC 5.2.1.8)
2269 :     prod: peptidyl-prolyl cis-trans isomerase PpiD
2270 :     ecnu: 5.2.1.8
2271 :     //
2272 :     func: Cell division protein ftsK
2273 :     prod: cell division protein FtsK
2274 :     //
2275 :     func: Na+/H+-exchanging protein
2276 :     prod: Na+/H+-exchanging protein
2277 :     //
2278 :     func: UPF0227 protein VC_1892
2279 :     prod: hypothetical protein
2280 :     //
2281 :     func: Lipoprotein releasing system ATP-binding protein lolD
2282 :     prod: lipoprotein releasing system ATP-binding protein LolD
2283 :     //
2284 :     func: Lipoprotein releasing system transmembrane protein lolE
2285 :     prod: lipoprotein releasing system transmembrane protein LolE
2286 :     //
2287 :     func: UPF0434 protein VC_1876
2288 :     prod: hypothetical protein
2289 :     //
2290 :     func: UPF0229 protein VC_1873
2291 :     prod: hypothetical protein
2292 :     //
2293 :     func: Peptidyl-prolyl cis-trans isomerase ppiB (EC 5.2.1.8)
2294 :     prod: peptidyl-prolyl cis-trans isomerase PpiB
2295 :     ecnu: 5.2.1.8
2296 :     //
2297 :     func: Crossover junction endodeoxyribonuclease ruvC (EC 3.1.22.4)
2298 :     prod: crossover junction endodeoxyribonuclease RuvC
2299 :     ecnu: 3.1.22.4
2300 :     //
2301 :     func: tolB protein precursor, periplasmic protein involved in the tonb-independent uptake of group A colicins
2302 :     prod: TolB protein precursor
2303 :     desc: periplasmic protein involved in the tonb-independent uptake of group A colicins
2304 :     //
2305 :     func: Surface presentation of antigens protein spaP
2306 :     prod: surface presentation of antigens protein SpaP
2307 :     //
2308 :     func: Protein yciN
2309 :     prod: protein YciN
2310 :     //
2311 :     func: Chaperone protein torD
2312 :     prod: chaperone protein TorD
2313 :     //
2314 :     func: Chromosome partition protein mukF
2315 :     prod: chromosome partition protein MukF
2316 :     //
2317 :     func: Chromosome partition protein mukE
2318 :     prod: chromosome partition protein MukE
2319 :     //
2320 :     func: Chromosome partition protein mukB
2321 :     prod: chromosome partition protein MukB
2322 :     //
2323 :     func: Probable zinc protease pqqL (EC 3.4.99.-)
2324 :     prod: hypothetical protein
2325 :     desc: probable zinc protease PqqL
2326 :     //
2327 :     func: Mu-like prophage protein gp16
2328 :     prod: phage protein
2329 :     desc: Mu-like prophage protein Gp16
2330 :     //
2331 :     func: Peptide transport system ATP-binding protein sapF (TC 3.A.1.5.5)
2332 :     prod: peptide transport system ATP-binding protein SapF
2333 :     note: TC 3.A.1.5.5
2334 :     //
2335 :     func: Peptide transport system ATP-binding protein sapD (TC 3.A.1.5.5)
2336 :     prod: peptide transport system ATP-binding protein SapD
2337 :     note: TC 3.A.1.5.5
2338 :     //
2339 :     func: Peptide transport system permease protein sapC (TC 3.A.1.5.5)
2340 :     prod: peptide transport system permease protein SapC
2341 :     note: TC 3.A.1.5.5
2342 :     //
2343 :     func: Peptide transport system permease protein sapB (TC 3.A.1.5.5)
2344 :     prod: peptide transport system permease protein SapB
2345 :     note: TC 3.A.1.5.5
2346 :     //
2347 :     func: Peptide transport periplasmic protein sapA (TC 3.A.1.5.5)
2348 :     prod: peptide transport periplasmic protein SapA
2349 :     note: TC 3.A.1.5.5
2350 :     //
2351 :     func: FOG: EAL domain protein
2352 :     prod: EAL domain protein
2353 :     //
2354 :     func: Na+ driven multidrug efflux pump
2355 :     prod: Na+ driven multidrug efflux pump
2356 :     //
2357 :     func: Na+/H+ antiporter NhaA type
2358 :     prod: Na+/H+ antiporter NhaA type
2359 :     //
2360 :     func: Diaminobutyrate-pyruvate transaminase & L-2,4-diaminobutyrate decarboxylase
2361 :     prod: diaminobutyrate-pyruvate transaminase/L-2,4-diaminobutyrate decarboxylase
2362 :     //
2363 :     func: COG1451: Predicted metal-dependent hydrolase
2364 :     prod: hypothetical protein
2365 :     desc: predicted metal-dependent hydrolase
2366 :     //
2367 :     func: Sensor kinase citA, dpiB (EC 2.7.3.-)
2368 :     prod: sensor kinase CitA
2369 :     //
2370 :     func: Transcriptional regulatory protein citB, dpiA
2371 :     prod: transcriptional regulatory protein CitB
2372 :     //
2373 :     func: Potential queD like
2374 :     prod: hypothetical protein
2375 :     desc: potential QueD like
2376 :     //
2377 :     func: Transcriptional regulator of alpha-acetolactate operon alsR
2378 :     prod: transcriptional regulator of alpha-acetolactate operon AlsR
2379 :     //
2380 :     func: LysR-family transcriptional regulator VC1561
2381 :     prod: LysR-family transcriptional regulator
2382 :     //
2383 :     func: SN-glycerol-3-phosphate transport ATP-binding protein ugpC (TC 3.A.1.1.3)
2384 :     prod: SN-glycerol-3-phosphate transport ATP-binding protein UgpC
2385 :     note: TC 3.A.1.1.3
2386 :     //
2387 :     func: SN-glycerol-3-phosphate transport system permease protein ugpE (TC 3.A.1.1.3)
2388 :     prod: SN-glycerol-3-phosphate transport system permease protein UgpE
2389 :     note: TC 3.A.1.1.3
2390 :     //
2391 :     func: SN-glycerol-3-phosphate transport system permease protein ugpA (TC 3.A.1.1.3)
2392 :     prod: SN-glycerol-3-phosphate transport system permease protein UgpA
2393 :     note: TC 3.A.1.1.3
2394 :     //
2395 :     func: Putative methyl-accepting chemotaxis protein VC1535
2396 :     prod: hypothetical protein
2397 :     desc: putative methyl-accepting chemotaxis protein
2398 :     //
2399 :     func: UPF0234 protein VC_1508
2400 :     prod: hypothetical protein
2401 :     //
2402 :     func: 23S rRNA (guanine-N-2-) -methyltransferase rlmL EC 2.1.1.-)
2403 :     prod: 23S rRNA (guanine-N-2-) -methyltransferase RlmL
2404 :     //
2405 :     func: Cytolysin-activating lysine-acyltransferase rtxC (EC 2.3.1.-)
2406 :     prod: cytolysin-activating lysine-acyltransferase RtxC
2407 :     //
2408 :     func: Putative analog of CcoH, COG3198
2409 :     prod: hypothetical protein
2410 :     desc: putative analog of CcoH
2411 :     //
2412 :     func: Spermidine Putrescine transport ATP-binding protein potA (TC_3.A.1.11.1)
2413 :     prod: spermidine putrescine transport ATP-binding protein PotA
2414 :     desc: TC_3.A.1.11.1
2415 :     //
2416 :     func: Spermidine Putrescine ABC transporter permease component potB (TC_3.A.1.11.1)
2417 :     prod: spermidine putrescine ABC transporter permease component PotB
2418 :     desc: TC_3.A.1.11.1
2419 :     //
2420 :     func: Spermidine Putrescine ABC transporter permease component potC (TC_3.A.1.11.1)
2421 :     prod: spermidine putrescine ABC transporter permease component PotC
2422 :     desc: TC_3.A.1.11.1
2423 :     //
2424 :     func: ABC transporter, periplasmic spermidine putrescine-binding protein potD (TC_3.A.1.11.1)
2425 :     prod: ABC transporter periplasmic spermidine putrescine-binding protein PotD
2426 :     desc: TC_3.A.1.11.1
2427 :     //
2428 :     func: Putrescine ABC transporter putrescine-binding protein potF (TC 3.A.1.11.2)
2429 :     prod: putrescine ABC transporter putrescine-binding protein PotF
2430 :     desc: TC_3.A.1.11.2
2431 :     //
2432 :     func: hcp protein
2433 :     prod: Hcp protein
2434 :     //
2435 :     func: Methyl-accepting chemotaxis protein II (mcp-II) (aspartate chemoreceptor protein)
2436 :     prod: methyl-accepting chemotaxis protein II
2437 :     //
2438 :     func: ATP-dependent RNA helicase VC1407
2439 :     prod: ATP-dependent RNA helicase
2440 :     //
2441 :     func: FOG: HEAT repeat
2442 :     prod: hypothetical protein
2443 :     //
2444 :     func: COG1092 family predicted tRNA methylase
2445 :     prod: hypothetical protein
2446 :     desc: predicted tRNA methylase
2447 :     //
2448 :     func: FOG: CheY-like receiver
2449 :     prod: hypothetical protein
2450 :     //
2451 :     func: probable lipoprotein YPO2292
2452 :     prod: hypothetical protein
2453 :     //
2454 :     func: putative virK protein
2455 :     prod: hypothetical protein
2456 :     desc: putative VirK protein
2457 :     //
2458 :     func: BarA-associated response regulator UvrY (= GacA = SirA)
2459 :     prod: BarA-associated response regulator UvrY
2460 :     //
2461 :     func: FIG002708: Protein sirB1
2462 :     prod: protein SirB1
2463 :     //
2464 :     func: FIG002082: Protein sirB2
2465 :     prod: protein SirB2
2466 :     //
2467 :     func: BarA sensory histidine kinase (= VarS = GacS)
2468 :     prod: BarA sensory histidine kinase
2469 :     //
2470 :     func: FOG: EAL domain
2471 :     prod: EAL domain protein
2472 :     //
2473 :     func: Transport ATP-binding protein cydD
2474 :     prod: transport ATP-binding protein CydD
2475 :     //
2476 :     func: Transport ATP-binding protein cydC
2477 :     prod: transport ATP-binding protein CydC
2478 :     //
2479 :     func: Ribosomal large subunit pseudouridine synthase B (EC 5.4.99.-) (rRNA-uridine isomerase B) (rRNA pseudouridylate synthase B)
2480 :     prod: LSU pseudouridine synthase B
2481 :     //
2482 :     func: COG0613, Predicted metal-dependent phosphoesterases (PHP family)
2483 :     prod: hypothetical protein
2484 :     desc: predicted metal-dependent phosphoesterases (PHP family)
2485 :     //
2486 :     func: COG1801: Uncharacterized conserved protein
2487 :     prod: hypothetical protein
2488 :     //
2489 :     func: ATP-dependent Clp protease ATP-binding subunit clpA
2490 :     prod: ATP-dependent Clp protease ATP-binding subunit ClpA
2491 :     //
2492 :     func: ATP-dependent Clp protease adaptor protein clpS
2493 :     prod: ATP-dependent Clp protease adaptor protein ClpS
2494 :     //
2495 :     func: UPF0274 protein VC_1127
2496 :     prod: hypothetical protein
2497 :     //
2498 :     func: Probable protease htpX homolog (EC 3.4.24.-)
2499 :     prod: hypothetical protein
2500 :     desc: probable protease HtpX homolog
2501 :     //
2502 :     func: Oligopeptide transport ATP-binding protein oppF (TC 3.A.1.5.1)
2503 :     prod: oligopeptide transport ATP-binding protein OppF
2504 :     note: TC 3.A.1.5.1
2505 :     //
2506 :     func: Oligopeptide transport ATP-binding protein oppD (TC 3.A.1.5.1)
2507 :     prod: oligopeptide transport ATP-binding protein OppD
2508 :     note: TC 3.A.1.5.1
2509 :     //
2510 :     func: Oligopeptide transport system permease protein oppC (TC 3.A.1.5.1)
2511 :     prod: oligopeptide transport system permease protein OppC
2512 :     note: TC 3.A.1.5.1
2513 :     //
2514 :     func: Oligopeptide transport system permease protein oppB (TC 3.A.1.5.1)
2515 :     prod: oligopeptide transport system permease protein OppB
2516 :     note: TC 3.A.1.5.1
2517 :     //
2518 :     func: Oligopeptide ABC transporter, periplasmic oligopeptide-binding protein oppA (TC 3.A.1.5.1)
2519 :     prod: oligopeptide ABC transporter periplasmic oligopeptide-binding protein OppA
2520 :     note: TC 3.A.1.5.1
2521 :     //
2522 :     func: Phosphonate ABC transporter phosphate-binding periplasmic component (TC 3.A.1.9.1)
2523 :     prod: phosphonate ABC transporter phosphate-binding periplasmic component
2524 :     note: TC 3.A.1.9.1
2525 :     //
2526 :     func: FOG: GGDEF domain
2527 :     prod: GGDEF domain protein
2528 :     //
2529 :     func: UPF0052 protein VC_1023
2530 :     prod: hypothetical protein
2531 :     //
2532 :     func: Phosphorelay protein luxU
2533 :     prod: phosphorelay protein LuxU
2534 :     //
2535 :     func: Regulatory protein luxO
2536 :     prod: regulatory protein LuxO
2537 :     //
2538 :     func: Electron transport complex protein rnfA
2539 :     prod: electron transport complex protein RnfA
2540 :     //
2541 :     func: Electron transport complex protein rnfB
2542 :     prod: electron transport complex protein RnfB
2543 :     //
2544 :     func: Electron transport complex protein rnfC
2545 :     prod: electron transport complex protein RnfC
2546 :     //
2547 :     func: Electron transport complex protein rnfD
2548 :     prod: electron transport complex protein RnfD
2549 :     //
2550 :     func: Electron transport complex protein rnfG
2551 :     prod: electron transport complex protein RnfG
2552 :     //
2553 :     func: Electron transport complex protein rnfE
2554 :     prod: electron transport complex protein RnfE
2555 :     //
2556 :     func: Sodium-type flagellar protein motY precursor
2557 :     prod: sodium-type flagellar protein MotY precursor
2558 :     //
2559 :     func: Phosphodiesterase yfcE (EC 3.1.4.-)
2560 :     prod: phosphodiesterase YfcE
2561 :     //
2562 :     func: COG3118: Thioredoxin domain-containing protein
2563 :     prod: thioredoxin domain-containing protein
2564 :     //
2565 :     func: HTH-type transcriptional regulator cueR
2566 :     prod: HTH-type transcriptional regulator CueR
2567 :     //
2568 :     func: Cell division protein zipA
2569 :     prod: cell division protein ZipA
2570 :     //
2571 :     func: Magnesium and cobalt efflux protein corC
2572 :     prod: magnesium and cobalt efflux protein CorC
2573 :     //
2574 :     func: LPS-assembly lipoprotein rlpB precursor (Rare lipoprotein B)
2575 :     prod: LPS-assembly lipoprotein RlpB precursor
2576 :     //
2577 :     func: COG0799: Uncharacterized homolog of plant Iojap protein
2578 :     prod: hypothetical protein
2579 :     desc: uncharacterized homolog of plant Iojap protein
2580 :     //
2581 :     func: COG1576: Uncharacterized conserved protein ## ybeA
2582 :     prod: hypothetical protein
2583 :     //
2584 :     func: Rod shape-determining protein rodA
2585 :     prod: rod shape-determining protein RodA
2586 :     //
2587 :     func: UPF0250 protein VC_0945
2588 :     prod: hypothetical protein
2589 :     //
2590 :     func: Capsular polysaccharide synthesis enzyme cpsD, exopolysaccharide synthesis
2591 :     prod: Capsular polysaccharide synthesis enzyme CpsD exopolysaccharide synthesis
2592 :     //
2593 :     func: Capsular polysaccharide synthesis enzyme cpsC, polysaccharide export
2594 :     prod: Capsular polysaccharide synthesis enzyme CpsC polysaccharide export
2595 :     //
2596 :     func: Capsular polysaccharide synthesis enzyme cpsB
2597 :     prod: Capsular polysaccharide synthesis enzyme CpsB
2598 :     //
2599 :     func: Capsular polysaccharide synthesis enzyme cpsA, sugar transferase
2600 :     prod: Capsular polysaccharide synthesis enzyme CpsA sugar transferase
2601 :     //
2602 :     func: Zn-ribbon-containing, possibly nucleic-acid-binding protein
2603 :     prod: Zn-ribbon-containing, possibly nucleic-acid-binding protein
2604 :     //
2605 :     func: COG2363
2606 :     prod: hypothetical protein
2607 :     //
2608 :     func: Thiamine biosynthesis protein thiI
2609 :     prod: thiamine biosynthesis protein ThiI
2610 :     //
2611 :     func: Flagellar motor rotation protein motB
2612 :     prod: Flagellar motor rotation protein MotB
2613 :     //
2614 :     func: Flagellar motor rotation protein motA
2615 :     prod: Flagellar motor rotation protein MotA
2616 :     //
2617 :     func: UPF0178 protein VC_0881
2618 :     prod: hypothetical protein
2619 :     //
2620 :     func: 50S ribosomal protein L36 2
2621 :     prod: LSU ribosomal protein L36p
2622 :     //
2623 :     func: COG1720: Uncharacterized conserved protein
2624 :     prod: hypothetical protein
2625 :     //
2626 :     func: UPF0253 protein VC_0872
2627 :     prod: hypothetical protein
2628 :     //
2629 :     func: relE protein
2630 :     prod: RelE protein
2631 :     //
2632 :     func: Na(+)Citrate OH(-) antiporter
2633 :     prod: Na(+)Citrate OH(-) antiporter
2634 :     //
2635 :     func: Cytoplasmic copper homeostasis protein cutC
2636 :     prod: cytoplasmic copper homeostasis protein CutC
2637 :     //
2638 :     func: Phosphate ABC transporter, periplasmic phosphate-binding protein pstS (TC 3.A.1.7.1)
2639 :     prod: phosphate ABC transporter, periplasmic phosphate-binding protein PstS
2640 :     desc: TC 3.A.1.7.1
2641 :     //
2642 :     func: Phosphate regulon sensor protein phoR (EC 2.7.3.-)
2643 :     prod: phosphate regulon sensor protein phoR
2644 :     //
2645 :     func: Phosphate regulon transcriptional regulatory protein phoB
2646 :     prod: phosphate regulon transcriptional regulatory protein PhoB
2647 :     //
2648 :     func: Uncharacterized protein with LysM domain, COG1652
2649 :     prod: LysM domain-containing protein
2650 :     //
2651 :     func: Trk system potassium uptake protein trkA
2652 :     prod: Trk system potassium uptake protein TrkA
2653 :     //
2654 :     func: COG1272: Predicted membrane protein hemolysin III homolog
2655 :     prod: hypothetical protein
2656 :     desc: predicted membrane protein hemolysin III homolog
2657 :     //
2658 :     func: Protein yihD
2659 :     prod: protein YihD
2660 :     //
2661 :     func: 16 kDa heat shock protein A
2662 :     prod: heat shock protein A
2663 :     //
2664 :     func: tRNA uridine 5-carboxymethylaminomethyl modification enzyme gidA
2665 :     prod: tRNA uridine 5-carboxymethylaminomethyl modification enzyme GidA
2666 :     //
2667 :     func: hypothetical conserved protein COG1739
2668 :     prod: hypothetical protein
2669 :     //
2670 :     func: Na+/H+ antiporter, putative
2671 :     prod: hypothetical protein
2672 :     desc: Na+/H+ antiporter, putative
2673 :     //
2674 :     func: Rod shape-determining protein mreB
2675 :     prod: rod shape-determining protein MreB
2676 :     //
2677 :     func: Rod shape-determining protein mreC
2678 :     prod: rod shape-determining protein MreC
2679 :     //
2680 :     func: Rod shape-determining protein mreD
2681 :     prod: rod shape-determining protein MreD
2682 :     //
2683 :     func: NADH oxidoreductase hcr (EC 1.-.-.-)
2684 :     prod: NADH oxidoreductase Hcr
2685 :     //
2686 :     func: COG0536: GTP-binding protein Obg
2687 :     prod: GTP-binding protein Obg
2688 :     //
2689 :     func: Survival protein surA precursor (Peptidyl-prolyl cis-trans isomerase surA) (EC 5.2.1.8)
2690 :     prod: peptidyl-prolyl cis-trans isomerase SurA
2691 :     ecnu: 5.2.1.8
2692 :     //
2693 :     func: Outer membrane protein Imp, required for envelope biogenesis
2694 :     prod: Imp required for envelope biogenesis
2695 :     //
2696 :     func: Organic solvent tolerance protein precursor
2697 :     prod: organic solvent tolerance protein precursor
2698 :     //
2699 :     func: UPF0269 protein yggX
2700 :     prod: hypothetical protein
2701 :     //
2702 :     func: UPF0235 protein VC0458
2703 :     prod: hypothetical protein
2704 :     //
2705 :     func: UPF0301 protein yqgE
2706 :     prod: hypothetical protein
2707 :     //
2708 :     func: Protein sprT
2709 :     prod: protein SprT
2710 :     //
2711 :     func: Iron-regulated virulence regulatory protein irgB
2712 :     prod: iron-regulated virulence regulatory protein IrgB
2713 :     //
2714 :     func: Endopeptidase essential in most Bacteria (E. coli YgjD/B. subtilis YdiE)
2715 :     prod: endopeptidase
2716 :     //
2717 :     func: Cell division protein ftsB
2718 :     prod: cell division protein FtsB
2719 :     //
2720 :     func: 5'-nucleotidase surE (EC 3.1.3.5)
2721 :     prod: 5'-nucleotidase SurE
2722 :     ecnu: 3.1.3.5
2723 :     //
2724 :     func: Sulfate and thiosulfate binding protein cysP
2725 :     prod: sulfate and thiosulfate binding protein CysP
2726 :     //
2727 :     func: Sulfate transport system permease protein cysT
2728 :     prod: sulfate transport system permease protein CysT
2729 :     //
2730 :     func: Sulfate transport system permease protein cysW
2731 :     prod: sulfate transport system permease protein CysW
2732 :     //
2733 :     func: Sulfate and thiosulfate import ATP-binding protein cysA (EC 3.6.3.25)
2734 :     prod: sulfate and thiosulfate import ATP-binding protein CysA
2735 :     ecnu: 3.6.3.25
2736 :     //
2737 :     func: Regulatory protein recX
2738 :     prod: regulatory protein RecX
2739 :     //
2740 :     func: COG3105: Uncharacterized protein conserved in bacteria
2741 :     prod: hypothetical protein
2742 :     //
2743 :     func: C4-type zinc finger protein, DksA/TraR family
2744 :     prod: C4-type zinc finger protein, DksA/TraR family
2745 :     //
2746 :     func: Cell division protein ftsJ
2747 :     prod: cell division protein FtsJ
2748 :     //
2749 :     func: Ribosomal RNA large subunit methyltransferase J (EC 2.1.1.-)
2750 :     prod: ribosomal RNA large subunit methyltransferase J
2751 :     //
2752 :     func: Cell division protein ftsH (EC 3.4.24.-)
2753 :     prod: cell division protein FtsH
2754 :     //
2755 :     func: COG0779: clustered with transcription termination protein NusA
2756 :     prod: clustered with transcription termination protein NusA
2757 :     //
2758 :     func: COG4123: Predicted O-methyltransferase
2759 :     prod: predicted O-methyltransferase
2760 :     //
2761 :     func: Protein of unknown function DUF81
2762 :     prod: hypothetical protein
2763 :     //
2764 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase slpA (EC 5.2.1.8)
2765 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase SlpA
2766 :     ecnu: 5.2.1.8
2767 :     //
2768 :     func: Beta N-acetyl-glucosaminidase( EC 3.2.1.52 )
2769 :     prod: beta N-acetyl-glucosaminidase
2770 :     ecnu: 3.2.1.52
2771 :     //
2772 :     func: C-di-GMP phosphodiesterase MbaA, repressor of biofilm formation
2773 :     prod: C-di-GMP phosphodiesterase MbaA repressor of biofilm formation
2774 :     //
2775 :     func: COG1496: Uncharacterized conserved protein
2776 :     prod: hypothetical protein
2777 :     //
2778 :     func: Virulence factor mviN homolog
2779 :     prod: hypothetical protein
2780 :     desc: virulence factor MviN homolog
2781 :     //
2782 :     func: Uncharacterized conserved protein
2783 :     prod: hypothetical protein
2784 :     //
2785 :     func: UPF0260 protein BMEI0534
2786 :     prod: hypothetical protein
2787 :     //
2788 :     func: UPF0181 protein VC_A0569
2789 :     prod: hypothetical protein
2790 :     //
2791 :     func: UPF0067 protein yebR
2792 :     prod: hypothetical protein
2793 :     //
2794 :     func: UPF0131 protein VC_2546
2795 :     prod: hypothetical protein
2796 :     //
2797 :     func: UPF0114 protein VC_0208
2798 :     prod: hypothetical protein
2799 :     //
2800 :     func: UPF0125 protein yfjF
2801 :     prod: hypothetical protein
2802 :     //
2803 :     func: UPF0274 protein ycfC
2804 :     prod: hypothetical protein
2805 :     //
2806 :     func: UPF0263 protein VC1208
2807 :     prod: hypothetical protein
2808 :     //
2809 :     func: ISSod13, transposase
2810 :     prod: ISSod13 transposase
2811 :     //
2812 :     func: iSSod13, transposase
2813 :     prod: ISSod13 transposase
2814 :     //
2815 :     func: Zn-dependent protease with chaperone function
2816 :     prod: Zn-dependent protease with chaperone function
2817 :     //
2818 :     func: Oligopeptide transport system permease protein oppC (TC 3.A.1.5.1)
2819 :     prod: oligopeptide transport system permease protein OppC
2820 :     note: TC 3.A.1.5.1
2821 :     //
2822 :     func: Oligopeptide transport system permease protein oppB (TC 3.A.1.5.1)
2823 :     prod: oligopeptide transport system permease protein OppB
2824 :     note: TC 3.A.1.5.1
2825 :     //
2826 :     func: ISSod2, transposase OrfB
2827 :     prod: ISSod2 transposase OrfB
2828 :     //
2829 :     func: ISSod2, transposase OrfA
2830 :     prod: ISSod2 transposase OrfA
2831 :     //
2832 :     func: Putative uncharacterized protein VC_A0360
2833 :     prod: hypothetical protein
2834 :     //
2835 :     func: Mll3428 protein
2836 :     prod: hypothetical protein
2837 :     //
2838 :     func: Cytochrome B561
2839 :     prod: cytochrome b561
2840 :     //
2841 :     func: Iron(III) dicitrate transport system permease protein fecD (TC 3.A.1.14.1)
2842 :     prod: iron(III) dicitrate transport system permease protein FecD
2843 :     note: TC 3.A.1.14.1
2844 :     //
2845 :     func: Na+/H+ antiporter
2846 :     prod: Na+/H+ antiporter
2847 :     //
2848 :     func: Na(+) H(+) antiporter subunit A; Na(+) H(+) antiporter subunit B
2849 :     prod: Na(+) H(+) antiporter subunit A/Na(+) H(+) antiporter subunit B
2850 :     //
2851 :     func: Na(+) H(+) antiporter subunit A
2852 :     prod: Na(+) H(+) antiporter subunit A
2853 :     //
2854 :     func: Na(+) H(+) antiporter subunit B
2855 :     prod: Na(+) H(+) antiporter subunit B
2856 :     //
2857 :     func: Na(+) H(+) antiporter subunit C
2858 :     prod: Na(+) H(+) antiporter subunit C
2859 :     //
2860 :     func: Na(+) H(+) antiporter subunit D
2861 :     prod: Na(+) H(+) antiporter subunit D
2862 :     //
2863 :     func: Na(+) H(+) antiporter subunit E
2864 :     prod: Na(+) H(+) antiporter subunit E
2865 :     //
2866 :     func: Na(+) H(+) antiporter subunit F
2867 :     prod: Na(+) H(+) antiporter subunit F
2868 :     //
2869 :     func: Na(+) H(+) antiporter subunit G
2870 :     prod: Na(+) H(+) antiporter subunit G
2871 :     //
2872 :     func: Ribosyl nicotinamide transporter, pnuC-like
2873 :     prod: ribosyl nicotinamide transporter PnuC-like protein
2874 :     //
2875 :     func: COG1683: Uncharacterized conserved protein / Hypothetical protein ybgA
2876 :     prod: hypothetical protein
2877 :     //
2878 :     func: Dipeptide transport system permease protein dppC (TC 3.A.1.5.2)
2879 :     prod: dipeptide transport system permease protein DppC
2880 :     note: TC 3.A.1.5.2
2881 :     //
2882 :     func: Oligopeptide ABC transporter, periplasmic oligopeptide-binding protein oppA (TC 3.A.1.5.1)
2883 :     prod: oligopeptide ABC transporter periplasmic oligopeptide-binding protein OppA
2884 :     note: TC 3.A.1.5.1
2885 :     //
2886 :     func: Metallo-beta-lactamase superfamily protein PA0057
2887 :     prod: metallo-beta-lactamase superfamily protein
2888 :     //
2889 :     func: N-Acetyl-D-glucosamine ABC transport system, sugar-binding protein
2890 :     prod: N-Acetyl-D-glucosamine ABC transport system sugar-binding protein
2891 :     //
2892 :     func: Thioredoxin-like protein clustered with PA0057
2893 :     prod: hypothetical protein
2894 :     desc: thioredoxin-like protein
2895 :     //
2896 :     func: Metallo-beta-lactamase superfamily protein PA0057
2897 :     prod: metallo-beta-lactamase superfamily protein
2898 :     //
2899 :     func: COG1559 protein yceG like
2900 :     prod: hypothetical protein
2901 :     desc: protein yceG like
2902 :     //
2903 :     func: Na(+)-translocating NADH-quinone reductase subunit F (EC 1.6.5.-)
2904 :     prod: Na(+)-translocating NADH-quinone reductase subunit F
2905 :     //
2906 :     func: Na(+)-translocating NADH-quinone reductase subunit E (EC 1.6.5.-)
2907 :     prod: Na(+)-translocating NADH-quinone reductase subunit E
2908 :     //
2909 :     func: Na(+)-translocating NADH-quinone reductase subunit D (EC 1.6.5.-)
2910 :     prod: Na(+)-translocating NADH-quinone reductase subunit D
2911 :     //
2912 :     func: Na(+)-translocating NADH-quinone reductase subunit C (EC 1.6.5.-)
2913 :     prod: Na(+)-translocating NADH-quinone reductase subunit C
2914 :     //
2915 :     func: Na(+)-translocating NADH-quinone reductase subunit B (EC 1.6.5.-)
2916 :     prod: Na(+)-translocating NADH-quinone reductase subunit B
2917 :     //
2918 :     func: Na(+)-translocating NADH-quinone reductase subunit A (EC 1.6.5.-)
2919 :     prod: Na(+)-translocating NADH-quinone reductase subunit A
2920 :     //
2921 :     func: Peptidyl-prolyl cis-trans isomerase ppiA precursor (EC 5.2.1.8)
2922 :     prod: peptidyl-prolyl cis-trans isomerase PpiA precursor
2923 :     ecnu: 5.2.1.8
2924 :     //
2925 :     func: NADPH-dependent glutamate synthase, large subunit
2926 :     prod: NADPH-dependent glutamate synthase large subunit
2927 :     //
2928 :     func: S-adenosyl-methyltransferase mraW (EC 2.1.1.-)
2929 :     prod: S-adenosyl-methyltransferase MraW
2930 :     //
2931 :     func: Single-stranded-DNA-specific exonuclease recJ (EC 3.1.-.-)
2932 :     prod: single-stranded-DNA-specific exonuclease RecJ
2933 :     //
2934 :     func: Hypothetical UPF0243 zinc-binding protein VP2529
2935 :     prod: hypothetical protein
2936 :     desc: hypothetical zinc-binding protein
2937 :     //
2938 :     func: Hypothetical ATP-binding protein UPF0042, contains P-loop # frameshift
2939 :     prod: hypothetical protein
2940 :     note: hypothetical ATP-binding protein, contains P-loop
2941 :     //
2942 :     func: MiaB-like tRNA modifying enzyme YliG, TIGR01125
2943 :     prod: MiaB-like tRNA modifying enzyme YliG
2944 :     //
2945 :     func: LysR-family transcriptional regulator clustered with PA0057
2946 :     prod: LysR-family transcriptional regulator
2947 :     //
2948 :     func: P pilus assembly/Cpx signaling pathway, periplasmic inhibitor/zinc-resistance associated protein
2949 :     prod: P pilus assembly/Cpx signaling pathway inhibitor/zinc-resistance associated protein
2950 :     //
2951 :     func: Hypothetical lysR-family transcriptional regulator YdhB
2952 :     prod: hypothetical protein
2953 :     //
2954 :     func: MG(2+) CHELATASE FAMILY PROTEIN
2955 :     prod: Mg(2+) chelatase family protein
2956 :     //
2957 :     func: Tyrosine recombinase xerC
2958 :     prod: tyrosine recombinase XerC
2959 :     //
2960 :     func: Cell division transporter, ATP-binding protein ftsE (TC 3.A.5.1.1)
2961 :     prod: cell division transporter ATP-binding protein FtsE
2962 :     note: TC 3.A.5.1.1
2963 :     //
2964 :     func: Cell division protein ftsX
2965 :     prod: cell division protein FtsX
2966 :     //
2967 :     func: Protein of unknown function DUF541
2968 :     prod: hypothetical protein
2969 :     //
2970 :     func: Tetrapyrrole (Corrin-Porphyrin) methylase family protein UPF0011
2971 :     prod: tetrapyrrole (Corrin-Porphyrin) methylase family protein
2972 :     //
2973 :     func: COG1132
2974 :     prod: hypothetical protein
2975 :     //
2976 :     func: RloF
2977 :     prod: RloF protein
2978 :     //
2979 :     func: COG1576: Uncharacterized conserved protein ## ybeA
2980 :     prod: hypothetical protein
2981 :     //
2982 :     func: Na+/H+ antiporter family protein
2983 :     prod: Na+/H+ antiporter family protein
2984 :     //
2985 :     func: Hypothetical protein DUF454
2986 :     prod: hypothetical protein
2987 :     //
2988 :     func: YciO family
2989 :     prod: YciO family protein
2990 :     //
2991 :     func: VirK
2992 :     prod: VirK protein
2993 :     //
2994 :     func: orf 104
2995 :     prod: hypothetical protein
2996 :     //
2997 :     func: ABC-type amino acid transport, signal transduction systems, periplasmic component/domain
2998 :     prod: ABC-type amino acid transport system periplasmatic component
2999 :     //
3000 :     func: Outer membrane protein ImpK/VasF, OmpA/MotB domain
3001 :     prod: ImpK/VasF outer membrane protein
3002 :     //
3003 :     func: Phosphotransferase system mannitol/fructose-specific IIA domain
3004 :     prod: phosphotransferase system mannitol/fructose-specific IIA domain protein
3005 :     //
3006 :     func: Fructosamine kinase family protein, At3g61080 homolog
3007 :     prod: fructosamine kinase family protein
3008 :     //
3009 :     func: Starvation lipoprotein Slp paralog
3010 :     prod: starvation lipoprotein Slp like protein
3011 :     //
3012 :     func: Transcriptional regulator, VCA0231 ortholog
3013 :     prod: AraC-type DNA-binding domain-containing protein
3014 :     //
3015 :     func: Translation elongation factor G paralog
3016 :     prod: translation elongation factor G-like protein
3017 :     //
3018 :     func: Dihydrolipoamide acetyltransferase component of pyruvate dehydrogenase complex (EC 2.3.1.12)
3019 :     prod: dihydrolipoamide acetyltransferase component of pyruvate dehydrogenase complex
3020 :     ecnu: 2.3.1.12
3021 :     //
3022 :     func: Dihydrolipoamide succinyltransferase component (E2) of 2-oxoglutarate dehydrogenase complex (EC 2.3.1.61)
3023 :     prod: dihydrolipoamide succinyltransferase component (E2) of 2-oxoglutarate dehydrogenase complex
3024 :     ecnu: 2.3.1.61
3025 :     //
3026 :     func: Acylphosphate phosphohydrolase (EC 3.6.1.7), putative
3027 :     prod: acylphosphate phosphohydrolase
3028 :     ecnu: 3.6.1.7
3029 :     //
3030 :     func: Iron-containing alcohol dehydrogenase (EC 1.1.1.1)
3031 :     prod: iron-containing alcohol dehydrogenase
3032 :     ecnu: 1.1.1.1
3033 :     //
3034 :     func: ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
3035 :     prod: ABC-type transport system periplasmic component
3036 :     //
3037 :     func: cAMP-binding proteins - catabolite gene activator and regulatory subunit of cAMP-dependent protein kinases
3038 :     prod: cAMP-binding protein
3039 :     note: catabolite gene activator and regulatory subunit of cAMP-dependent protein kinases
3040 :     //
3041 :     func: GGDEF and EAL domain proteins
3042 :     prod: GGDEF and EAL domain-containing protein
3043 :     //
3044 :     func: NAD(FAD)-utilizing dehydrogenases
3045 :     prod: NAD(FAD)-utilizing dehydrogenase
3046 :     //
3047 :     func: RTX toxins and related Ca2+-binding proteins
3048 :     prod: Ca2+-binding protein
3049 :     note: putative RTX toxin
3050 :     //
3051 :     func: SAM-dependent methyltransferases
3052 :     prod: SAM-dependent methyltransferase
3053 :     //
3054 :     func: ATP-dependent RNA helicase VCA0768
3055 :     prod: ATP-dependent RNA helicase
3056 :     //
3057 :     func: Fe-S protein, homolog of lactate dehydrogenase SO1521
3058 :     prod: Fe-S oxidoreductase
3059 :     note: similar to lactate dehydrogenase SO1521
3060 :     //
3061 :     func: Metallo-beta-lactamase superfamily protein PA0057
3062 :     prod: metallo-beta-lactamase family protein
3063 :     note: similar to PA00057
3064 :     //
3065 :     func: Ycg4D
3066 :     prod: hypothetical protein
3067 :     //
3068 :     func: 4-Hydroxy-2-oxoglutarate aldolase (EC 4.1.3.16)
3069 :     prod: 4-hydroxy-2-oxoglutarate aldolase
3070 :     ecnu: 4.1.3.16
3071 :     //
3072 :     func: 2-dehydro-3-deoxyphosphogluconate aldolase (EC 4.1.2.14)
3073 :     prod: 2-dehydro-3-deoxyphosphogluconate aldolase
3074 :     ecnu: 4.1.2.14
3075 :     //
3076 :     func: Biotin synthesis protein bioH
3077 :     prod: biotin synthesis protein BioH
3078 :     //
3079 :     func: Biotin synthesis protein bioC
3080 :     prod: biotin synthesis protein BioC
3081 :     //
3082 :     func: Cob(I)alamin adenosyltransferase (EC 2.5.1.17)
3083 :     prod: cob(I)alamin adenosyltransferase
3084 :     ecnu: 2.5.1.17
3085 :     //
3086 :     func: L-rhamnose operon transcriptional activator rhaR
3087 :     prod: L-rhamnose operon transcriptional activator RhaR
3088 :     //
3089 :     func: Amide synthase component of siderophore synthetase # Vibriobactin-specific, VibH
3090 :     prod: amide synthase component of siderophore synthetase
3091 :     desc: vibriobactin-specific, VibH
3092 :     //
3093 :     func: Phosphopantetheinyl transferase component of siderophore synthetase (EC 2.7.8.-) # Vibriobactin-specific, VibD
3094 :     prod: phosphopantetheinyl transferase component of siderophore synthetase
3095 :     desc: vibriobactin-specific, VibD
3096 :     //
3097 :     func: Toxin co-regulated pilus biosynthesis protein T, putative ATP-binding translocase of TcpA
3098 :     prod: toxin co-regulated pilus biosynthesis protein T
3099 :     desc: putative ATP-binding translocase of TcpA
3100 :     //
3101 :     func: Toxin co-regulated pilus biosynthesis protein F, putative outer membrane channel for TcpA extrusion
3102 :     prod: toxin co-regulated pilus biosynthesis protein F
3103 :     desc: putative outer membrane channel for TcpA extrusion
3104 :     //
3105 :     func: TCP pilus virulence regulatory protein toxT, transcription activator, AraC family
3106 :     prod: TCP pilus virulence regulatory protein ToxT transcription activator AraC family
3107 :     //
3108 :     func: TCP pilin signal peptidase, TcpA processing
3109 :     prod: TCP pilin signal peptidase TcpA processing
3110 :     //
3111 :     func: Rare lipoprotein A precursor
3112 :     prod: rare lipoprotein A precursor
3113 :     //
3114 :     func: N-acetylglucosamine-6P-responsive transcriptional repressor NagC, ROK family
3115 :     prod: N-acetylglucosamine-6P-responsive transcriptional repressor NagC ROK family
3116 :     //
3117 :     func: RstA
3118 :     prod: RstA phage-related replication protein
3119 :     //
3120 :     func: transcriptional repressor RstR
3121 :     prod: RstR phage-related transcriptional repressor
3122 :     //
3123 :     func: S-adenosylmethionine-dependent methyltransferase Functionally Coupled to the MukBEF Chromosome Partitioning Mechanism
3124 :     prod: S-adenosylmethionine-dependent methyltransferase functionally coupled to the MukBEF chromosome partitioning mechanism
3125 :     //
3126 :     func: Membrane Protein Functionally coupled to the MukBEF Chromosome Partitioning Mechanism
3127 :     prod: membrane protein functionally coupled to the MukBEF chromosome partitioning mechanism
3128 :     //
3129 :     func: PvcA protein, related to known isonitrile synthases
3130 :     prod: PvcA protein
3131 :     //
3132 :     func: PvcB protein, related to amino acid oxidizing enzymes
3133 :     prod: PvcB protein
3134 :     //
3135 :     func: Cholera enterotoxin subunit B precursor (Cholera enterotoxin B chain) (Cholera enterotoxin gamma chain) (Choleragenoid)
3136 :     prod: Enterotoxin subunit B
3137 :     //
3138 :     func: protein of unknown function
3139 :     prod: hypothetical protein
3140 :     //
3141 :     func: Protein of unknown function Smg
3142 :     prod: hypothetical protein
3143 :     //
3144 :     func: orf30
3145 :     prod: hypothetical protein
3146 :     //
3147 :     func: orf29
3148 :     prod: hypothetical protein
3149 :     //
3150 :     func: orf4
3151 :     prod: hypothetical protein
3152 :     //
3153 :     func: FIG018583: protein of unknown function
3154 :     prod: hypothetical protein
3155 :     //
3156 :     func: Cryptic phage CTXphi transcriptional repressor rstR
3157 :     prod: cryptic phage CTXphi transcriptional repressor RstR
3158 :     //
3159 :     func: Outer membrane chaperone Skp (OmpH) precursor @ Outer membrane protein H precursor
3160 :     prod: outer membrane chaperone Skp (OmpH) precursor
3161 :     //
3162 :     func: AAA ATPase, central region
3163 :     prod: AAA ATPase central region
3164 :     //
3165 :     func: Wzy
3166 :     prod: Wzy protein
3167 :     //
3168 :     func: 50S ribosomal protein L33
3169 :     prod: LSU ribosomal protein L33p
3170 :     //
3171 :     func: Ribosomal protein S12p Asp88 (E. coli) methylthiotransferase
3172 :     prod: ribosomal protein S12p Asp88 methylthiotransferase
3173 :     //
3174 :     func: WavQ
3175 :     prod: WavQ protein
3176 :     //
3177 :     func: NT01VC2352
3178 :     prod: hypothetical protein
3179 :     //
3180 :     func: COG1301: Na+/H+-dicarboxylate symporters
3181 :     prod: Na+/H+-dicarboxylate symporter
3182 :     //
3183 :     func: TorCAD operon transcriptional regulatory protein torR
3184 :     prod: TorCAD operon transcriptional regulatory protein TorR
3185 :     //
3186 :     func: protein of unknown function DUF847
3187 :     prod: hypothetical protein
3188 :     //
3189 :     func: Membrane protein, distant similarity to thiosulphate:quinone oxidoreductase DoxD
3190 :     prod: membrane protein, similar to thiosulphate:quinone oxidoreductase DoxD
3191 :     //
3192 :     func: Similarities with Photorhabdus cytotoxin
3193 :     prod: cytotoxin-like protein
3194 :     //
3195 :     func: Proline/sodium symporter PutP (TC 2.A.21.2.1) @ Propionate/sodium symporter
3196 :     prod: proline/sodium symporter PutP
3197 :     note: TC 2.A.21.2.1
3198 :     //
3199 :     func: Chain A, Crystal Structure Of Protein Vc1899 From Vibrio Cholerae
3200 :     prod: hypothetical protein
3201 :     //
3202 :     func: haemagglutinin associated protein
3203 :     prod: hemagglutinin associated protein
3204 :     //
3205 :     func: TPR repeat
3206 :     prod: TPR repeat-containing protein
3207 :     //
3208 :     func: COG0610: Type I site-specific restriction-modification system, R (restriction) subunit and related helicases
3209 :     prod: type I site-specific restriction-modification system R (restriction) subunit
3210 :     //
3211 :     func: COG2369: Uncharacterized protein, homolog of phage Mu protein gp30
3212 :     prod: phage protein
3213 :     //
3214 :     func: Ribonuclease HI, Vibrio paralog
3215 :     prod: ribonuclease HI
3216 :     //
3217 :     func: COG1961: Site-specific recombinases, DNA invertase Pin homologs
3218 :     prod: site-specific recombinase
3219 :     //
3220 :     func: COG1434: Uncharacterized conserved protein
3221 :     prod: hypothetical protein
3222 :     //
3223 :     func: Trp operon repressor homolog
3224 :     prod: Trp operon repressor-like protein
3225 :     //
3226 :     func: Hypothetical protein YqcC (clustered with tRNA pseudouridine synthase C)
3227 :     prod: hypothetical protein
3228 :     //
3229 :     func: Sua5 YciO YrdC YwlC family protein
3230 :     prod: YrdC family protein
3231 :     //
3232 :     func: FIG000859 (not subsystem-based): hypothetical protein
3233 :     prod: hypothetical protein
3234 :     //
3235 :     func: Hypothetical protein colocalized with Enterobactin receptor VctA
3236 :     prod: hypothetical protein
3237 :     //
3238 :     func: COG1004: Predicted UDP-glucose 6-dehydrogenase( EC:1.1.1.22 )
3239 :     prod: UDP-glucose 6-dehydrogenase
3240 :     ecnu: EC:1.1.1.22
3241 :     //
3242 :     func:
3243 :     prod:

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3