[Bio] / FigKernelScripts / seed2tbl.pl Repository:
ViewVC logotype

Annotation of /FigKernelScripts/seed2tbl.pl

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.1 - (view) (download) (as text)

1 : bartels 1.1 #!/usr/bin/env perl
2 :    
3 :     use Getopt::Std;
4 :     use strict;
5 :     use warnings;
6 :     use Data::Dumper;
7 :     use FIGV;
8 :     use Carp;
9 :    
10 :     our ( $opt_o, $opt_s, $opt_l, $opt_p, $opt_i, $opt_r, $opt_e, $opt_x );
11 :     getopts( 'o:s:l:p:i:r:e:x:' );
12 :    
13 :    
14 :     #my %preimages_of;
15 :     my %images_of;
16 :    
17 :     ###################
18 :     # view the inputs #
19 :     ###################
20 :    
21 :     #* org_dir *#
22 :     my $org_dir = $opt_o;
23 :     if ( !( -d $org_dir) ) {
24 :     &usage;
25 :     die "No orgdir $org_dir\n";
26 :     }
27 :     my $fig = FIGV->new($org_dir);
28 :    
29 :     #* submitter id *#
30 :     my $submitter_ID = $opt_s;
31 :     if ( !defined( $submitter_ID ) ) {
32 :     &usage;
33 :     die "No submitter ID given\n";
34 :     }
35 :    
36 :     #* pseudo genes *#
37 :     my $pseudo_list;
38 :     if ( defined( $opt_p ) ) {
39 :     $pseudo_list = load_pseudo_list( $opt_p );
40 :     }
41 :    
42 :     #* locus tag prefix *#
43 :     my $locus_tag_prefix = $opt_l;
44 :     if ( !defined( $locus_tag_prefix ) ) {
45 :     &usage;
46 :     die "No locus tag prefix given\n";
47 :     }
48 :    
49 :     #* prot ID prefix *#
50 :     my $prot_ID_prefix = $opt_i;
51 :     if ( !defined( $prot_ID_prefix ) ) {
52 :     $prot_ID_prefix = $locus_tag_prefix;
53 :     }
54 :    
55 :     #* bad ECs file *#
56 :     my $bad_ECs_file = $opt_e;
57 :     if ( !defined( $bad_ECs_file ) ) {
58 :     $bad_ECs_file = 'ECs_deleted_and_transferred.txt';
59 :     }
60 :    
61 :     #* results file *#
62 :     my $res_file = $opt_r;
63 :     if ( !defined( $res_file ) ) {
64 :     &usage;
65 :     die "No output file given\n";
66 :     }
67 :     #* xls file *#
68 :     my $xls_log_file = $opt_x;
69 :     if ( !defined( $xls_log_file ) ) {
70 :     $xls_log_file = $res_file;
71 :     $xls_log_file =~ s/\.tbl/\.xls/;
72 :     }
73 :    
74 :     open ( RES, ">$res_file" ) or die "can't open $res_file!\n";
75 :     open ( XLS_LOG, qq(>$xls_log_file)) || die qq(Could not write-open $xls_log_file);
76 :    
77 :     ###############################################
78 :     # load hashes for keep caps and special cases #
79 :     ###############################################
80 :     my $keep_caps = &load_keep_caps;
81 :     my $special_cases = &load_special_cases();
82 :     my $map_EC_to = &load_bad_EC_numbers( $bad_ECs_file );
83 :    
84 :     ##################
85 :     # Some Constants #
86 :     ##################
87 :    
88 :     use constant ENTRY => 0;
89 :     use constant FILE => 1;
90 :     use constant FID => 2;
91 :     use constant LOCUS => 3;
92 :     use constant CONTIG => 4;
93 :     use constant START => 5;
94 :     use constant STOP => 6;
95 :     use constant LEN => 7;
96 :     use constant STRAND => 8;
97 :     use constant FUNC => 9;
98 :    
99 :     #################################
100 :     # load sequences for the genome #
101 :     #################################
102 :     my $contigs_file = "$org_dir/contigs";
103 :     my ($seq_of, $len_of) = &load_contigs($contigs_file);
104 :    
105 :     ##################
106 :     # load tbl files #
107 :     ##################
108 :     my @tbl_files;
109 :     my $tmp = "$org_dir/Features/rna/tbl";
110 :     if (-s $tmp) { push @tbl_files, $tmp; } else { push @tbl_files, "/dev/null"; }
111 :    
112 :     $tmp = "$org_dir/Features/peg/tbl";
113 :     if (-s $tmp) { push @tbl_files, $tmp; } else { die "PEG tbl file $tmp does not exist"; }
114 :    
115 :     my $tbl = &load_tbls(@tbl_files);
116 :    
117 :     ##################
118 :     # load functions #
119 :     ##################
120 :     my %func_of = map { chomp; m/^(\S+)\t(.*)$/o ? ($1 => $2) : () } `cat $org_dir/assigned_functions`;
121 :    
122 :    
123 :     ##############################################
124 :     # Now start the process - go through contigs #
125 :     ##############################################
126 :    
127 :     my $done_fids;
128 :     foreach my $contig_id (sort keys %$seq_of) {
129 :     print RES ">Feature\t$contig_id\n";
130 :    
131 :     my $contig_features = $tbl->{ $contig_id };
132 :     foreach my $entry ( @$contig_features ) {
133 :     # this was put in for pseudogenes, where the second/following
134 :     # part is already part of the pseudogene
135 :     next if $done_fids->{ $entry->[FID] };
136 :    
137 :     # get entry type
138 :     my $type = &type_of( $entry );
139 :     if ( !defined( $type ) ) {
140 :     die ( qq(aborting with entry = ), $fig->flatten_dumper($entry), qq(\n), Dumper( $contig_features ) );
141 :     }
142 :    
143 :     # get entry function
144 :     $entry->[FUNC] = $func_of{ $entry->[FID] };
145 :    
146 :     # get the feature number
147 :     my $feature_number;
148 :     if ( $entry->[FID] =~ m/\.(\d+)$/ ) {
149 :     $feature_number = $1;
150 :     }
151 :     else {
152 :     die "Could not parse FID $entry->[FID]";
153 :     }
154 :    
155 :     if ( defined( $pseudo_list->{ $entry->[FID] } ) ) {
156 :     &output_PSEUDO( $entry, $feature_number, $locus_tag_prefix, *RES, $pseudo_list->{ $entry->[FID] }, $done_fids, $contig_features );
157 :     next;
158 :     }
159 :     if ( $type eq qq(CDS) ) {
160 :     &output_CDS( $entry, $feature_number, $locus_tag_prefix, *RES, *XLS_LOG );
161 :     }
162 :     elsif ( $type =~ m/RNA/o ) {
163 :     &output_RNA( $entry, $feature_number, $locus_tag_prefix, *RES );
164 :     }
165 :     else {
166 :     die "Unsupported feature type:\n", Dumper($entry);
167 :     }
168 :     }
169 :     }
170 :    
171 :    
172 :    
173 :     ##################
174 :     # close up stuff #
175 :     ##################
176 :    
177 :     close RES;
178 :     close XLS_LOG;
179 :    
180 :    
181 :    
182 :    
183 :    
184 :     #-----------#
185 :     #############
186 :     ## METHODS ##
187 :     #############
188 :     #-----------#
189 :    
190 :    
191 :     #################
192 :     # Write PSEUDOS #
193 :     #################
194 :     sub output_PSEUDO {
195 :     my ( $entry, $feature_number, $locus_tag_prefix, $RES, $otherones, $donehash, $contig_features ) = @_;
196 :    
197 :     $feature_number = &zero_pad( 6, $feature_number );
198 :     my $locus_tag = $locus_tag_prefix . $feature_number;
199 :    
200 :     my $strand = 'fw';
201 :     my ( $nonsense, $beg, $end ) = $fig->boundaries_of( $entry->[LOCUS] );
202 :     if ( $beg > $end ) {
203 :     $strand = 'rv';
204 :     }
205 :    
206 :     $donehash->{ $entry->[FID] } = 1;
207 :     foreach my $oo ( @$otherones ) {
208 :    
209 :     my $thisentry;
210 :     foreach my $te ( @$contig_features ) {
211 :     if ( $te->[FID] eq $oo ) {
212 :     my ($beg1, $end1);
213 :     (undef, $beg1, $end1) = $fig->boundaries_of( $te->[LOCUS] );
214 :     if ( $strand eq 'fw' ) {
215 :     $end = $end1;
216 :     }
217 :     else {
218 :     $beg = $beg1;
219 :     }
220 :     }
221 :     }
222 :    
223 :     $donehash->{ $oo } = 1;
224 :     }
225 :    
226 :     my $func = $entry->[FUNC];
227 :    
228 :     $func =~ s/\s+/ /go;
229 :     my ($product, $prot_desc, $notesP, $ec_numsP, $tc_numsP, $famsP) = &normalize_function( $entry->[FID], $func, 0);
230 :     if ( !defined( $product ) || $product eq '' ) {
231 :     $product = $prot_desc;
232 :     }
233 :     if ( $product =~ /(.*)\s\# frameshift$/ ) {
234 :     $product = $1;
235 :     }
236 :    
237 :     print $RES (join(qq(\t), ($beg, $end, 'gene')), qq(\n));
238 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(gene_desc), $product)), qq(\n);
239 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(locus_tag), $locus_tag)), qq(\n));
240 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(pseudo)), qq(\n)));
241 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(note), qq(frameshift)), qq(\n)));
242 :     }
243 :    
244 :     ##############
245 :     # Write RNAs #
246 :     ##############
247 :     sub output_RNA {
248 :     my ( $entry, $feature_number, $locus_tag_prefix, $RES ) = @_;
249 :    
250 :     $feature_number = &zero_pad( 6, $feature_number, qq(rna) );
251 :     my $locus_tag = $locus_tag_prefix . $feature_number;
252 :    
253 :     my ( $nonsense, $beg, $end ) = $fig->boundaries_of($entry->[LOCUS]);
254 :    
255 :     print $RES ( join( qq(\t), ($beg, $end, qq(gene))), qq(\n),
256 :     join( qq(\t), (qq(), qq(), qq(), qq(locus_tag), $locus_tag)), qq(\n),
257 :     );
258 :    
259 :     my $trunc = $fig->possibly_truncated( $entry->[FID] );
260 :     if ($beg < $end) {
261 :     if ( $trunc eq qq(start) ) {
262 :     $beg = qq(<$beg);
263 :     }
264 :     elsif ( $trunc eq qq(stop) ) {
265 :     $end = qq(>$end);
266 :     }
267 :     }
268 :     else {
269 :     if ( $trunc eq qq(start) ) {
270 :     $beg = qq(>$beg);
271 :     }
272 :     elsif ( $trunc eq qq(stop) ) {
273 :     $end = qq(<$end);
274 :     }
275 :     }
276 :    
277 :     my $type = &type_of($entry);
278 :    
279 :     my $func = $entry->[FUNC];
280 :     if ($func =~ m/5S\s*RNA/o) {
281 :     #...No change
282 :     $func = qq(5S rRNA);
283 :     }
284 :     elsif ($func =~ m/SSU\s*rRNA/o) {
285 :     $func = qq(16S rRNA);
286 :     }
287 :     elsif ($func =~ m/LSU\s*rRNA/o) {
288 :     $func = qq(23S rRNA);
289 :     }
290 :     elsif ($func =~ m/^tRNA/o) {
291 :     # try to cut off the codon (anticodon?) information
292 :     if ( $func =~ /^(tRNA-\w{3}).*/ ) {
293 :     $func = $1;
294 :     }
295 :     }
296 :     else {
297 :     $func = qq(misc_RNA);
298 :     }
299 :    
300 :     print $RES (join(qq(\t), ($beg, $end, $type)), qq(\n));
301 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(product), $func)), qq(\n));
302 :    
303 :     return 1;
304 :     }
305 :    
306 :     ##############
307 :     # Write CDSs #
308 :     ##############
309 :     sub output_CDS {
310 :     my ( $entry, $feature_number, $locus_tag_prefix, $RES, $XLS_LOG ) = @_;
311 :    
312 :     $feature_number = &zero_pad( 6, $feature_number );
313 :     my $locus_tag = $locus_tag_prefix . $feature_number;
314 :    
315 :     # get entry location on the contig
316 :     my ( $nonsense, $region_beg, $region_end ) = $fig->boundaries_of( $entry->[LOCUS] );
317 :    
318 :     print $RES ( join( qq(\t), ($region_beg, $region_end, qq(gene))), qq(\n),
319 :     join( qq(\t), (qq(), qq(), qq(), qq(locus_tag), $locus_tag)), qq(\n),
320 :     );
321 :    
322 :     my @products = ();
323 :     my @prot_descs = ();
324 :     my @notes = ();
325 :     my @ec_nums = ();
326 :     my @tc_nums = ();
327 :     my @fams = ();
328 :    
329 :     ###########################
330 :     # Write locus information #
331 :     ###########################
332 :     my @chunks = split( m/,/, $entry->[LOCUS] );
333 :    
334 :     my $first_chunk = shift @chunks;
335 :     my ( $nonsense2, $beg, $end ) = $fig->boundaries_of( $first_chunk );
336 :    
337 :     print $RES ( join( qq(\t), ( $beg, $end, qq(CDS) ) ), qq(\n) );
338 :     foreach my $chunk (@chunks) {
339 :     ( undef, $beg, $end ) = $fig->boundaries_of( $chunk );
340 :     print $RES ( join( qq(\t), ($beg, $end) ), qq(\n) );
341 :     }
342 :    
343 :     ##############################
344 :     # Now about the CDS function #
345 :     ##############################
346 :     my $fid = $entry->[FID];
347 :     my $func = $entry->[FUNC];
348 :     $func =~ s/\s+/ /go;
349 :     my $original_func = $func;
350 :    
351 :     # Trim off "comment" field; save it as a "note" if it "propagates"
352 :     if ( $func =~ m/(\#{1,2})\s+(.*)$/ ) {
353 :     if ( $1 eq qq(\#\#) ) {
354 :     push @notes, $2;
355 :     }
356 :     $func =~ s/\#.*$//o;
357 :     }
358 :    
359 :     # Check type of assignment
360 :     my $assignment_type = q();
361 :     if ($func =~ m{ \/ }) {
362 :     $assignment_type = qq(multifunctional enzyme);
363 :     }
364 :     elsif ($func =~ m{\@ }) {
365 :     $assignment_type = qq(enzyme with broad specificity);
366 :     }
367 :     elsif ($func =~ m{\; }) {
368 :     $assignment_type = qq(most likely function alternative not yet resolved);
369 :     }
370 :    
371 :     #...Split on " / ", '; ', or " @ "
372 :     my @funcs = split m{ \/ |\; | \@ }, $func;
373 :     my @tmp = @funcs;
374 :     @tmp = grep { &weasel_words($_) } map { s{ [\(\[] [ET] C [^\)\]]+ [\)\]] }{}gox; $_ } @tmp;
375 :    
376 :     ############################
377 :     # Now go through functions #
378 :     ############################
379 :     foreach $func ( @funcs ) {
380 :     my $prenormalized_func = $func;
381 :    
382 :     my $x;
383 :     if ( defined( $x = $special_cases->{$original_func} ) ) {
384 :    
385 :     if ( defined( $x->{ prod } ) ) {
386 :     push ( @products, @{ $x->{ prod } } );
387 :     }
388 :    
389 :     if ( defined( $x->{ desc } ) ) {
390 :     push ( @prot_descs, @{ $x->{ desc } } );
391 :     }
392 :    
393 :     if ( defined( $x->{ note } ) ) {
394 :     push ( @notes, @{ $x->{ note } } );
395 :     }
396 :    
397 :     if ( defined( $x->{ ecnu } ) ) {
398 :     push ( @ec_nums, @{ $x->{ ecnu } } );
399 :     }
400 :     last;
401 :     }
402 :     elsif ( defined( $x = $special_cases->{$func} ) ) {
403 :    
404 :     if ( defined( $x->{ prod } ) ) {
405 :     push ( @products, @{ $x->{ prod } } );
406 :     }
407 :    
408 :     if ( defined( $x->{ desc } ) ) {
409 :     push ( @prot_descs, @{ $x->{ desc } } );
410 :     }
411 :    
412 :     if ( defined( $x->{ note } ) ) {
413 :     push ( @notes, @{ $x->{ note } } );
414 :     }
415 :    
416 :     if ( defined( $x->{ ecnu } ) ) {
417 :     push ( @ec_nums, @{ $x->{ ecnu } } );
418 :     }
419 :     }
420 :     else {
421 :     my ( $product, $prot_desc, $notesP, $ec_numsP, $tc_numsP, $famsP ) = &normalize_function( $fid, $func );
422 :    
423 :     push (@products, $product) if $product;
424 :     push (@prot_descs, $prot_desc) if $prot_desc;
425 :     push (@notes, @$notesP);
426 :     push (@ec_nums, @$ec_numsP);
427 :     push (@tc_nums, @$tc_numsP);
428 :     push (@fams, @$famsP);
429 :    
430 :     #...Add note for PEGs marked "(fragment)," and set "pseudogene" flag as required by NCBI
431 :     if ($func =~ /fragment/io) {
432 :     unshift @notes, qq(Fragment);
433 :     $func =~ s/\s*\(?fragment\)?//i;
434 :     }
435 :     }
436 :    
437 :     # if ( !defined( $notesP ) ) {
438 :     # $notesP = [];
439 :     # }
440 :    
441 :     # if ($product) {
442 :     # if (not defined($preimages_of{$product})) { $preimages_of{$product} = {}; }
443 :     # $preimages_of{$product}->{$func} = [ qq(prod), @$notesP ];
444 :     # }
445 :    
446 :     # if ($prot_desc) {
447 :     # if (not defined($preimages_of{$prot_desc})) { $preimages_of{$prot_desc} = {}; }
448 :     # $preimages_of{$prot_desc}->{$func} = [ qq(desc), @$notesP ];
449 :     # }
450 :     }
451 :    
452 :     if ( $assignment_type ) {
453 :     if ( $assignment_type eq qq(multifunctional enzyme) ) {
454 :     if ( @products ) {
455 :     my $product = join( qq(/), @products );
456 :     @products = ( $product );
457 :     }
458 :     else {
459 :     unshift @notes, $assignment_type;
460 :     }
461 :     }
462 :     else {
463 :     unshift @notes, $assignment_type;
464 :     }
465 :     }
466 :    
467 :     if ( @products == 0 ) {
468 :     push @products, qq(hypothetical protein);
469 :     }
470 :    
471 :     @products = @{ uniquify( \@products ) };
472 :     foreach my $product (@products) {
473 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(product), $product)), qq(\n);
474 :     }
475 :    
476 :     @prot_descs = @{ uniquify( \@prot_descs ) };
477 :     foreach my $prot_desc ( @prot_descs ) {
478 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(prot_desc), $prot_desc)), qq(\n);
479 :     }
480 :    
481 :     @ec_nums = @{ uniquify( \@ec_nums ) };
482 :     foreach my $ec_num ( @ec_nums ) {
483 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(EC_number), $ec_num)), qq(\n);
484 :     }
485 :    
486 :     my @notestmp = @tc_nums;
487 :     push @notestmp, @fams;
488 :     push @notestmp, @notes;
489 :     @notes = @{ uniquify( \@notestmp ) };
490 :     foreach my $note ( @notes ) {
491 :     print $RES join(qq(\t), (qq(), qq(), qq(), qq(note), $note)), qq(\n);
492 :     }
493 :    
494 :     @tmp = ();
495 :     push @tmp, map { qq(prod: $_) } @products;
496 :     push @tmp, map { qq(desc: $_) } @prot_descs;
497 :     push @tmp, map { qq(note: $_) } @notes;
498 :     my $first_annot = shift(@tmp) || qq();
499 :     print $XLS_LOG (join(qq(\t), ($fid, $original_func, $first_annot, join(qq( ), @ec_nums))), qq(\n));
500 :     foreach my $tmp (@tmp) {
501 :     print $XLS_LOG (join(qq(\t), (q(), q(), qq(), $tmp, qq())), qq(\n));
502 :     }
503 :    
504 :     my $fid_num = 0;
505 :     if ( $fid =~ m/\.(\d+)$/ ) {
506 :     $fid_num = $1;
507 :     $fid_num = ( "0" x ( 6 - length( $fid_num ) ) ) . $fid_num;
508 :     }
509 :     else {
510 :     die "Could not parse FID $entry->[FID]";
511 :     }
512 :    
513 :     # print the protein id #
514 :     print $RES (join(qq(\t), (qq(), qq(), qq(), qq(protein_id), qq(gnl\|$submitter_ID\|$prot_ID_prefix).$fid_num)), qq(\n));
515 :    
516 :     return 1;
517 :     }
518 :    
519 :     #############################
520 :     # constructs the protein id #
521 :     #############################
522 :     sub zero_pad {
523 :     my ($num_digits, $number, $prefix) = @_;
524 :     $prefix = defined($prefix) ? $prefix : qq();
525 :    
526 :     my $prefix_length = length($prefix);
527 :     my $number_length = length($number);
528 :    
529 :     if ($num_digits < $prefix_length + $number_length) {
530 :     die "!!! Too many digits: digits=$num_digits, number=$number, prefix=$prefix";
531 :     }
532 :    
533 :     return ($prefix . ("0" x ($num_digits - $prefix_length - $number_length)) . $number);
534 :     }
535 :    
536 :     ###############################
537 :     # through double entries away #
538 :     ###############################
539 :     sub uniquify {
540 :     my ( $array ) = @_;
541 :    
542 :     my @retarray;
543 :     my %used;
544 :     foreach ( @$array ) {
545 :     next if ( defined( $used{ $_ } ) );
546 :     $used{ $_ } = 1;
547 :     push @retarray, $_;
548 :     }
549 :     return \@retarray;
550 :     }
551 :    
552 :     sub type_of {
553 :     my ($entry) = @_;
554 :    
555 :     my $fid = $entry->[FID];
556 :     my $func = $entry->[FUNC] || qq();
557 :    
558 :     if ($fid =~ m/\.peg\./o) {
559 :     return qq(CDS);
560 :     }
561 :     elsif ($fid =~ m/\.rna\./o) {
562 :     if (($func =~ m/rRNA/o) || ($func =~ m/5S RNA/o)) {
563 :     return qq(rRNA);
564 :     }
565 :     elsif ($func =~ m/tRNA/o) {
566 :     return qq(tRNA);
567 :     }
568 :     else {
569 :     return qq(misc_RNA);
570 :     }
571 :     }
572 :     else {
573 :     die "This Can't Happen !!!";
574 :     }
575 :    
576 :     die "This Can't Happen !!!";
577 :     }
578 :    
579 :     sub weasel_words {
580 :     #...Attempt to catch things NCBI bitches about in protein names
581 :     my ($x) = @_;
582 :    
583 :     #...protein names should not contain molecular weights
584 :     # if ($x =~ /\bkDa\b/io) { return 1 }
585 :    
586 :     #...fragments are not "real" genes, but are demoted to "pseudogenes"
587 :     # if ($x =~ /fragment/io) { return 2 }
588 :    
589 :     #...protein names should not mention cellular location
590 :     # if ($x =~ /inner[- ]membrane/io) { return 3 }
591 :     # if ($x =~ /periplasmic/io) { return 4 }
592 :    
593 :     #...protein names should not contain any hint of ambiguity
594 :     # if ($x =~ /predicted/io) { return 5 }
595 :     # if ($x =~ /probable/io) { return 6 }
596 :     # if ($x =~ /putative/io) { return 7 }
597 :     # if ($x =~ /hypothetical/io) { return 8 }
598 :    
599 :     #...protein names should not be descriptive phrases
600 :     if ($x =~ /,\s/io) { return 9 }
601 :     # if ($x =~ /\sand\s/io) { return 10 }
602 :     # if ($x =~ /of\s+the\b.*\b(super)?family/io) { return 100 }
603 :     # if ($x =~ /fused\s+to/io) { return 11 }
604 :     # if ($x =~ /involved\s+in/io) { return 12 }
605 :     # if ($x =~ /component.*\bof\b/io) { return 13 }
606 :     # if ($x =~ /exported\s+protein/io) { return 14 }
607 :    
608 :     #...protein names should not contain references to homology
609 :     # if ($x =~ /motif/io) { return 15 }
610 :     # if ($x =~ /containing/io) { return 16 }
611 :     # if ($x =~ /analog\s+of/io) { return 17 }
612 :     # if ($x =~ /[- ]like/io) { return 18 }
613 :     # if ($x =~ /similar\s+to/io) { return 19 }
614 :     # if ($x =~ /similarity/io) { return 20 }
615 :     # if ($x =~ /homolog(ous)?/io) { return 21 }
616 :     # if ($x =~ /ortholog(ous)?/io) { return 22 }
617 :     # if ($x =~ /structural\s+feature/io) { return 23 }
618 :     # if ($x =~ /conserved.*\bdomain\b/io) { return 24 }
619 :     # if ($x =~ /conserved\s+in/io) { return 25 }
620 :     # if ($x =~ /binding[- ]site/io) { return 26 }
621 :    
622 :     return 0;
623 :     }
624 :    
625 :    
626 :     sub normalize_function {
627 :    
628 :     my ($fid, $func) = @_;
629 :    
630 :     my $product = qq();
631 :     my $prot_desc = qq();
632 :     my $notesP = [];
633 :     my $ec_numsP = [];
634 :     my $tc_numsP = [];
635 :     my $famsP = [];
636 :    
637 :     #...Trim leading and trailing spaces, and collapse multiple spaces
638 :     $func =~s/^\s+//o;
639 :     $func =~s/\s+$//o;
640 :     $func =~s/\s+/ /go;
641 :    
642 :     #...Remove whitespace before commas
643 :     $func =~ s/\s+,/,/go;
644 :    
645 :     #...Remove space between ")" and "-"
646 :     $func =~ s/\)\s+\-/\)\-/go;
647 :    
648 :     #...Remove references to FIGfam membership
649 :     if ($func =~ m/^(FIG\d{6})/) {
650 :     #...We are currently suppressing FIGfam-IDs
651 :     $func =~ s/^FIG\d{6}[:_ ]\s*//o;
652 :     $func =~ s/^FIG\d{6}\s+\(not\s+subsystem\s+based\):\s+//o;
653 :     }
654 :    
655 :     #...Move references to EC-numbers into @$ec_numsP
656 :     # print STDERR qq($fid\t$func\n);
657 :     while ($func =~ m/[\(\]]\s*EC[_:]?\s*([^\)\]]+)[\)\]]/o) {
658 :     my $contents = $1;
659 :     # print STDERR qq(\t$contents:);
660 :     foreach my $token (split(m/[, ]\s*/, $contents)) {
661 :     if ($token =~ m/(\d+\.([0-9]+|-)\.([0-9]+|-)\.([0-9]+|-))/o) {
662 :     my $ec_num = $1;
663 :     # print STDERR qq(\t$ec_num);
664 :    
665 :     if ($ec_num =~ m/\.\-$/o) {
666 :     #...Skip partials
667 :     next;
668 :     }
669 :     elsif (defined($map_EC_to->{$ec_num})) {
670 :     #...Skip any changed EC
671 :     next;
672 :    
673 :     # if ($map_EC_to->{$ec_num} eq qq(-1)) {
674 :     # #...Skip --- EC is either split or deleted
675 :     # next;
676 :     # }
677 :     # else{
678 :     # #...Replace EC if uniquely mappable
679 :     # $ec_num = $map_EC_to->{$ec_num};
680 :     # }
681 :     }
682 :    
683 :     push @$ec_numsP, $ec_num;
684 :     }
685 :     else {
686 :     push @$notesP, $token;
687 :     }
688 :     }
689 :    
690 :     $func =~ s/[\(\]]\s*EC[_:]?\s*([^\)\]]+)[\)\]]//o;
691 :     }
692 :    
693 :     #...Move references to TC-numbers into @$tc_numsP
694 :     if ($func =~ m/\(\s*TC[_:]?\s*([^\)]+)\)/o) {
695 :     push @$tc_numsP, qq(TC $1);
696 :     $func =~ s/\(\s*TC[^\)]+\)//;
697 :     }
698 :    
699 :     #...Move references to COGs into @fams (will become "note")
700 :     $func =~ s/^COGs\s*//o;
701 :     if ($func =~ m/COG/) {
702 :     if ($func =~ s/^((COG\d{4})[,:_]?\*(family)?)\s*/$2 $3/o) {
703 :     push @$notesP, $func;
704 :     $func = qq();
705 :     }
706 :     else {
707 :     while ($func =~ s/,?\s*(COG\d{4}):?\s*//o) {
708 :     push @$famsP, $1;
709 :     }
710 :     }
711 :     }
712 :    
713 :     #...Again trim leading and trailing spaces, collapse multiple spaces, and snug up commas
714 :     $func =~s/^\s*,?\s+//o;
715 :     $func =~s/\s+$//o;
716 :     $func =~s/\s+/ /go;
717 :     $func =~ s/\s+,/,/go;
718 :    
719 :     #...Attempt to downcase "ALL CAPS"
720 :     if ($func !~ m/[a-z]/) {
721 :     $func = lc($func);
722 :     }
723 :    
724 :     #...If first word is capitalized, and not on list of known gene-names,
725 :     # downcase initial cap
726 :     if ($func =~ m/^(\w+)/) {
727 :     my $first_token = $1;
728 :     if (($first_token =~ m/^[A-Z][a-z]+$/o) && (not $keep_caps->{$first_token})) {
729 :     substr($func, 0, 1) = lc( substr($func, 0, 1) );
730 :     }
731 :     }
732 :    
733 :     if ( my $code = weasel_words( $func ) ) {
734 :     if ( $code == 9 ) {
735 :     my $newfunc = transform($func, $special_cases, $keep_caps);
736 :     $func = join( "/", @{ $newfunc->{prod} });
737 :     $product = $func;
738 :    
739 :     if (my $code = weasel_words($func)) {
740 :     # print STDERR "AGAIN: $code $func\n";
741 :     }
742 :     }
743 :     else {
744 :     $prot_desc = $func;
745 :     }
746 :     }
747 :     else {
748 :     $product = $func;
749 :     }
750 :     # }
751 :    
752 :     return ($product, $prot_desc, $notesP, $ec_numsP, $tc_numsP, $famsP);
753 :     }
754 :    
755 :    
756 :    
757 :     ################
758 :     # load contigs #
759 :     ################
760 :     sub load_contigs
761 :     {
762 :     my ($contigs_file) = @_;
763 :    
764 :     my $seq_of = {};
765 :     my $len_of = {};
766 :    
767 :     open (CONTIGS, "<$contigs_file") or die "could not open $contigs_file to read";
768 :     while ( (! eof(CONTIGS)) && ( my ($id, $seqP) = &FIG::read_fasta_record(\*CONTIGS) ) )
769 :     {
770 :     $$seqP =~ tr/a-z/A-Z/;
771 :     $seq_of->{$id} = $$seqP;
772 :     $len_of->{$id} = length($$seqP);
773 :     }
774 :     close(CONTIGS) or die "could not close $contigs_file";
775 :    
776 :     return ($seq_of, $len_of);
777 :     }
778 :    
779 :     ##################
780 :     # load tbl files #
781 :     ##################
782 :     sub load_tbls
783 :     {
784 :     my (@tbl_files) = @_;
785 :     my ($entry, $fid, $org, $locus, $contig, $beg, $end, $strand, $len);
786 :    
787 :     my $tbl = {};
788 :     my $file = 0;
789 :     foreach my $tbl_file (@tbl_files)
790 :     {
791 :     my $num_fids = 0;
792 :     open(TBL,"<$tbl_file") || die "could not open $tbl_file";
793 :     print STDERR "Loading $tbl_file ...\n" if $ENV{VERBOSE};
794 :    
795 :     while (defined($entry = <TBL>))
796 :     {
797 :     ++$num_fids;
798 :     chomp $entry;
799 :     if ($entry =~ /^(\S+)\s+(\S+)/)
800 :     {
801 :     ($fid, $locus) = ($1, $2);
802 :     if ($fid =~ m/^fig\|(\d+\.\d+)/) { $org = $1; } else { die "Invalid FID $fid"; }
803 :    
804 :     ($contig, $beg, $end) = $fig->boundaries_of($locus);
805 :    
806 :     if ($beg < $end) { $strand = '+'; } else { $strand = '-'; }
807 :    
808 :     $len = 1 + abs($end-$beg);
809 :    
810 :     unless (defined($tbl->{$contig})) { $tbl->{$contig} = []; }
811 :     push(@ { $tbl->{$contig} }
812 :     , [$entry, $file, $fid, $locus, $contig, $beg, $end, $len, $strand]
813 :     );
814 :     }
815 :     else
816 :     {
817 :     print STDERR "Skipping invalid entry $entry\n";
818 :     }
819 :     }
820 :     print STDERR "Loaded $num_fids features from $tbl_file\n\n" if $ENV{VERBOSE};
821 :     close(TBL);
822 :     ++$file;
823 :     }
824 :    
825 :     foreach my $contig (keys(%$tbl))
826 :     {
827 :     my $x = $tbl->{$contig};
828 :     $tbl->{$contig} = [sort { &FIG::min($a->[START],$a->[STOP]) <=> &FIG::min($b->[START],$b->[STOP]) } @$x];
829 :     }
830 :    
831 :     return $tbl;
832 :     }
833 :    
834 :    
835 :     ###############################
836 :     # Names that should stay caps #
837 :     ###############################
838 :     sub load_keep_caps {
839 :     my $keep_caps = {};
840 :    
841 :     my $entry;
842 :     while ( defined( $entry = <DATA> ) ) {
843 :     last if ( $entry eq qq(///\n) );
844 :     chomp $entry;
845 :     $keep_caps->{ $entry } = 1;
846 :     }
847 :    
848 :     return $keep_caps;
849 :     }
850 :    
851 :     #######################
852 :     # list of pseudogenes #
853 :     #######################
854 :     sub load_pseudo_list {
855 :     my ( $pseudo_file ) = @_;
856 :    
857 :     my $pseudo_list;
858 :     open ( PL, $pseudo_file ) or die "cannot open $pseudo_file";
859 :    
860 :     while ( <PL> ) {
861 :     chomp;
862 :     next if ( !defined( $_ ) );
863 :     my @frags = split( "\t", $_ );
864 :     my $first = shift @frags;
865 :     $pseudo_list->{ $first } = \@frags;
866 :     }
867 :    
868 :     close PL;
869 :     return $pseudo_list;
870 :     }
871 :    
872 :    
873 :     #########
874 :     # usage #
875 :     #########
876 :     sub usage {
877 :     print STDERR "seed2tbl -o ORGDIR
878 :     -s SUBMITTER_ID
879 :     -l LOCUS_TAG_PREFIX
880 :     -p PSEUDO_FILE
881 :     -i PROT_ID_PREFIX
882 :     -r RESULT_TBL_FILE
883 :     ";
884 :     }
885 :    
886 :     ##################
887 :     # bad EC numbers #
888 :     ##################
889 :     sub load_bad_EC_numbers {
890 :     my ($bad_EC_file) = @_;
891 :    
892 :     open(BAD_ECs, qq(<$bad_EC_file))
893 :     || die qq(Could not read-open \`$bad_EC_file\');
894 :    
895 :     my $record;
896 :     my $map_EC_to = {};
897 :     while (defined($record = <BAD_ECs>)) {
898 :     if ($record =~ m/^(\S+)/o) {
899 :     my $old_ec = $1;
900 :     if ($record =~ m/^\S+\t(\S+)/o) {
901 :     my $new_ec = $1;
902 :     if (not defined($map_EC_to->{$old_ec})) {
903 :     $map_EC_to->{$old_ec} = $new_ec;
904 :     }
905 :     else {
906 :     #...Split EC
907 :     $map_EC_to->{$old_ec} = -1;
908 :     }
909 :     }
910 :     else {
911 :     #...Deleted EC
912 :     $map_EC_to->{$old_ec} = -1;
913 :     }
914 :     }
915 :     else {
916 :     die "Could not parse $bad_EC_file record $.: $record";
917 :     }
918 :     }
919 :     close(BAD_ECs);
920 :    
921 :     return $map_EC_to;
922 :     }
923 :    
924 :    
925 :     #################
926 :     # special cases #
927 :     #################
928 :     sub load_special_cases {
929 :     my $old_eol;
930 :     my $special_cases = {};
931 :    
932 :     my $record;
933 :     ($old_eol, $/) = ($/, qq(\n//\n));
934 :     while ( defined( $record = <DATA> ) ) {
935 :     chomp $record;
936 :     my @entries = split( /\n/, $record );
937 :    
938 :     my $func = shift @entries;
939 :     $func =~ s/^func:\t//o;
940 :    
941 :     my $x = $special_cases->{$func} = {};
942 :    
943 :     foreach my $entry ( @entries ) {
944 :     my ( $type, $val ) = split( /\:\t/, $entry );
945 :     push @ { $x->{$type} }, $val;
946 :     }
947 :     }
948 :     $/ = $old_eol;
949 :    
950 :     return $special_cases;
951 :     }
952 :    
953 :    
954 :     sub transform {
955 :     my ($func, $special, $keep_caps) = @_;
956 :    
957 :     $func =~ s/\s{2,10}/ /g;
958 :     # $func =~ s/\) -methyl/)-methyl/g;
959 :     if ((! $func) || ($func =~ m/^hypothetical\s*$/o)) {
960 :     $func = "hypothetical protein";
961 :     }
962 :     my $pieces = {};
963 :    
964 :     if ( $special->{ $func } ) {
965 :     $func = $special->{ $func }
966 :     }
967 :     if ( $func =~ /HASH/ ) {
968 :     $func = join( '/', @{ $func->{ prod } } );
969 :     }
970 :    
971 :     my $func0 = &clean_comments($func);
972 :     $func = $func0;
973 :    
974 :     my @funcs = split(/ \/ | \@ |\; /,$func);
975 :     foreach my $x (@funcs)
976 :     {
977 :     &transform1($x,$pieces,$special,$keep_caps);
978 :     }
979 :     my %prods = map { $_ => 1 } @{$pieces->{prod}};
980 :     $pieces->{prod} = [sort keys(%prods)];
981 :     if (@funcs > 1) {
982 :     $pieces->{prod} = [ join( "/", @{$pieces->{prod} } ) ];
983 :     }
984 :     return $pieces;
985 :     }
986 :    
987 :     sub transform1 {
988 :     my($func, $pieces, $special, $keep_caps) = @_;
989 :     my $note;
990 :    
991 :     if ($special->{$func}) { $func = $special->{$func} }
992 :    
993 :     my($func1,$ecs) = &clean_ecs($func);
994 :     if (@$ecs > 0) { push(@{$pieces->{ecs}},@$ecs) }
995 :     $func = $func1;
996 :    
997 :     my($func2,$tcs) = &clean_tcs($func);
998 :     if (@$tcs > 0) { push(@{$pieces->{tcs}},@$tcs) }
999 :     $func = $func2;
1000 :    
1001 :     #...NOTE: &clean_clustered_with() must be called before &clean_commas()
1002 :     my $func9;
1003 :     ($func9, $note) = &clean_clustered_with($func);
1004 :     if ($note) { push(@{$pieces->{notes}}, $note); }
1005 :     $func = $func9;
1006 :    
1007 :     my $func3 = &clean_commas($func);
1008 :     $func = $func3;
1009 :    
1010 :     my ($func8, $pseudo) = &clean_fragment($func);
1011 :     if ($pseudo) {
1012 :     #...This is klutzy, but I see no other work-around... :-(
1013 :     push @ { $pieces->{pseudo} }, qq(fragment);
1014 :     }
1015 :     $func = $func8;
1016 :    
1017 :     my $func5 = &clean_cogs($func);
1018 :     $func = $func5;
1019 :    
1020 :     my($func6,$wts) = &clean_weights($func);
1021 :     $func = $func6;
1022 :     if (@$wts > 0) { push(@{$pieces->{notes}},@$wts) }
1023 :    
1024 :     my $func7 = &clean_rrna($func);
1025 :     $func = $func7;
1026 :    
1027 :     my($func4,$notes) = &clean_locations($func);
1028 :     $func = $func4;
1029 :     if (@$notes > 0) { push(@{$pieces->{notes}},@$notes) }
1030 :    
1031 :     my $func_final = &fix_caps($func, $keep_caps);
1032 :     $func = $func_final;
1033 :    
1034 :     if (not $func) { $func = qq(hypothetical protein); }
1035 :    
1036 :     push(@{$pieces->{prod}}, $func);
1037 :     return $pieces;
1038 :     }
1039 :    
1040 :    
1041 :     sub clean_clustered_with {
1042 :     #...NOTE: Must be called before &clean_commas()
1043 :     my ($func) = @_;
1044 :     my $note;
1045 :    
1046 :     if ($func =~ s/\s*\((clustered\s+with\s+[^\)]+)\)//o) {
1047 :     $note = $1;
1048 :     }
1049 :     elsif ($func =~ s/,?(\s+in)?\s+cluster(ed)?\s+(with.*)$//o) {
1050 :     $note = qq(clustered with $3);
1051 :     }
1052 :    
1053 :     return ($func, $note);
1054 :     }
1055 :    
1056 :     sub fix_caps {
1057 :     my ($func, $keep_caps) = @_;
1058 :    
1059 :     if (($func =~ m/^(\w+)/o) && (defined($keep_caps->{$1}))) {
1060 :     #...First token of $func is on the keep list; return unchanged
1061 :     return $func;
1062 :     }
1063 :     elsif ($func !~ m/[a-z]/o) {
1064 :     #...Convert to lower-case, since NCBI hates "ALL CAPS"
1065 :     $func = lc( $func );
1066 :     }
1067 :     else {
1068 :     #...Convert first letter to lower-case
1069 :     $func =~ s/^\s*//o; #...Make sure first char is not "whitespace"
1070 :     substr($func, 0, 1) = lc( substr($func, 0, 1) );
1071 :     }
1072 :    
1073 :     return $func;
1074 :     }
1075 :    
1076 :     sub clean_fragment {
1077 :     my ($func) = @_;
1078 :    
1079 :     my $pseudo = qq();
1080 :     if ($func =~ s/\s*[\(]?fragment[\)]?//io) {
1081 :     $pseudo = 1;
1082 :     }
1083 :     return ($func, $pseudo);
1084 :     }
1085 :    
1086 :     sub clean_rrna {
1087 :     my($func) = @_;
1088 :    
1089 :     $func =~ s/23s r?rna/LSU rRNA/i;
1090 :     $func =~ s/16s r?rna/SSU rRNA/i;
1091 :     return $func;
1092 :     }
1093 :    
1094 :     sub clean_weights {
1095 :     my($func) = @_;
1096 :    
1097 :     my $wts = [];
1098 :     if ($func =~ s/\b(\d+ kda)\s*//i)
1099 :     {
1100 :     push(@$wts,$1);
1101 :     }
1102 :     return ($func,$wts);
1103 :     }
1104 :    
1105 :     sub clean_cogs {
1106 :     my($func) = @_;
1107 :    
1108 :     $func =~ s/^COGs\s+//;
1109 :     $func =~ s/COG\d{4}[:,_]?\s*//;
1110 :     return $func;
1111 :     }
1112 :    
1113 :     sub clean_locations {
1114 :     my($func) = @_;
1115 :    
1116 :     my $notes = [];
1117 :     while ($func =~ s/\s*(outer membrane|inner membrane|cytoplasmic|periplasmic)( protein)?//i)
1118 :     {
1119 :     push(@$notes, lc(qq($1 protein)));
1120 :     }
1121 :     $func =~ s/^\s+//;
1122 :     return ($func,$notes);
1123 :     }
1124 :    
1125 :     sub clean_comments {
1126 :     my($func) = @_;
1127 :    
1128 :     $func =~ s/\s*\#.*$//;
1129 :     return $func;
1130 :     }
1131 :    
1132 :     ##################################
1133 :     # clean commas from the function #
1134 :     ##################################
1135 :     sub clean_commas {
1136 :     my( $func ) = @_;
1137 :    
1138 :     # only if followed by space
1139 :     $func =~ s/, / /g;
1140 :     return $func;
1141 :     }
1142 :    
1143 :     #################################
1144 :     # get EC nums from the function #
1145 :     #################################
1146 :     sub clean_ecs {
1147 :     my( $func ) = @_;
1148 :    
1149 :     my $ecs = [];
1150 :     while ( $func =~ s/\s*[\(\[]EC\s+([0-9\-\.]+)[\)\]],?//g ) {
1151 :     my $ec = $1;
1152 :     # only take them if no '-' is in there
1153 :     if ($ec !~ /\-/) {
1154 :     push( @$ecs, $1 );
1155 :     }
1156 :     }
1157 :     return ( $func, $ecs );
1158 :     }
1159 :    
1160 :     #################################
1161 :     # get TC nums from the function #
1162 :     #################################
1163 :     sub clean_tcs {
1164 :     my($func) = @_;
1165 :    
1166 :     my $tcs = [];
1167 :     while ( $func =~ s/\s*[\(\[]TC\s+([a-zA-Z0-9\-\.]+)[\)\]],?//g ) {
1168 :     push(@$tcs,$1);
1169 :     }
1170 :     return ( $func, $tcs );
1171 :     }
1172 :    
1173 :     __DATA__
1174 :     ABC
1175 :     TRAP
1176 :     ATPase
1177 :     ComM
1178 :     CRISPR
1179 :     C4
1180 :     P6
1181 :     OmpA
1182 :     MotB
1183 :     ATPase
1184 :     YjeE
1185 :     FKBP
1186 :     SSU
1187 :     LSU
1188 :     NADH
1189 :     DNA
1190 :     RNA
1191 :     rRNA
1192 :     tRNA
1193 :     mRNA
1194 :     TRP
1195 :     AmpG
1196 :     AnkB
1197 :     ApaG
1198 :     Apo
1199 :     AraC
1200 :     ArdK
1201 :     AsmA
1202 :     AzlC
1203 :     BarA
1204 :     BatA
1205 :     BatD
1206 :     BolA
1207 :     BsuBI
1208 :     CapK
1209 :     CbbY
1210 :     CcdB
1211 :     Ccm2
1212 :     Che
1213 :     CheW
1214 :     ClpB
1215 :     Cob
1216 :     CopG
1217 :     CreA
1218 :     Cro
1219 :     CtxA
1220 :     CymA
1221 :     CymJ
1222 :     DamX
1223 :     DedA
1224 :     DedD
1225 :     DinG
1226 :     DnaJ
1227 :     DnaK
1228 :     ElaA
1229 :     FlaF
1230 :     FAD
1231 :     FxsA
1232 :     FyuA
1233 :     GatB
1234 :     GlcNAc
1235 :     GlpG
1236 :     GlpM
1237 :     GTP
1238 :     HflC
1239 :     HflK
1240 :     HigB
1241 :     High
1242 :     HipA
1243 :     HlyD
1244 :     IcmF
1245 :     IncF
1246 :     IncW
1247 :     IstB
1248 :     Kef
1249 :     Kup
1250 :     LppC
1251 :     LptA
1252 :     LuxA
1253 :     LuxB
1254 :     LuxC
1255 :     LuxD
1256 :     LuxE
1257 :     LuxG
1258 :     LysR
1259 :     MadN
1260 :     Maf
1261 :     MiaB
1262 :     Mlc
1263 :     Mll3428
1264 :     MotA
1265 :     MoxR
1266 :     Mrp
1267 :     Mrr
1268 :     MshO
1269 :     MutT
1270 :     Na+
1271 :     NAD
1272 :     NfuA
1273 :     NhaP
1274 :     NnrS
1275 :     NupC
1276 :     OpgC
1277 :     OsmC
1278 :     OxaI
1279 :     ParA
1280 :     ParE
1281 :     PmbA
1282 :     ProQ
1283 :     PrpF
1284 :     Psp
1285 :     PutR
1286 :     PvcB
1287 :     PTS
1288 :     RarD
1289 :     Rare
1290 :     RbmA
1291 :     RbmD
1292 :     RecA
1293 :     RelB
1294 :     RelE
1295 :     RfbT
1296 :     Rhs
1297 :     RhsD
1298 :     RloF
1299 :     Rod
1300 :     RstA
1301 :     RstB
1302 :     Rtn
1303 :     O-antigen
1304 :     SanA
1305 :     SeqA
1306 :     SgrR
1307 :     Sll1503
1308 :     Smp
1309 :     SohB
1310 :     SsrA
1311 :     StrA
1312 :     Sua5
1313 :     Syd
1314 :     TagA
1315 :     TagE
1316 :     TetA
1317 :     TetD
1318 :     Tfp
1319 :     TldD
1320 :     TnpA
1321 :     Tol
1322 :     TolA
1323 :     TonB
1324 :     TonB2
1325 :     TorCAD
1326 :     ToxR
1327 :     TraA
1328 :     TraD
1329 :     TraE
1330 :     TraF
1331 :     TraG
1332 :     TraH
1333 :     TraI
1334 :     TraO
1335 :     Trk
1336 :     TrkA
1337 :     Trp
1338 :     TyrA
1339 :     VgrG
1340 :     VirK
1341 :     VvgS
1342 :     WavQ
1343 :     WblB
1344 :     Wzy
1345 :     Xaa
1346 :     Ycg4D
1347 :     YciO
1348 :     YgfY
1349 :     YihE
1350 :     YjeF
1351 :     Ync
1352 :     Ynd
1353 :     ///
1354 :     func: BarA-associated response regulator UvrY (= GacA = SirA)))
1355 :     prod: BarA-associated response regulator UvrY
1356 :     note: Similar to UvrY, GacA, and SirA
1357 :     //
1358 :     func: Putative cytoplasmic protein ,probably associated with Glutathione-regulated potassium-efflux
1359 :     prod: hypothetical protein
1360 :     note: Putative cytoplasmic protein, probably associated with Glutathione-regulated potassium-efflux
1361 :     //
1362 :     func: Aminomethyltransferase (glycine cleavage system T protein)
1363 :     prod: aminomethyltransferase
1364 :     note: glycine cleavage system T protein
1365 :     //
1366 :     func: Outer membrane protein YfgL, lipoprotein component of the protein assembly complex (forms a complex with YaeT, YfiO, and NlpB)
1367 :     prod: YfgL protein
1368 :     note: outer membrane protein
1369 :     note: lipoprotein component of the protein assembly complex; forms a complex with YaeT, YfiO, and NlpB
1370 :     //
1371 :     func: 50S ribosomal subunit maturation GTPase RbgA (B. subtilis YlqF)
1372 :     prod: 50S ribosomal subunit maturation GTPase RbgA
1373 :     //
1374 :     func: Survival protein surA precursor (Peptidyl-prolyl cis-trans isomerase surA)
1375 :     prod: peptidyl-prolyl cis-trans isomerase SurA
1376 :     note: survival protein surA precursor
1377 :     //
1378 :     func: Glycine dehydrogenase [decarboxylating] (glycine cleavage system P protein)
1379 :     prod: glycine dehydrogenase [decarboxylating]
1380 :     note: glycine cleavage system P protein
1381 :     //
1382 :     func: Flavohemoprotein (Hemoglobin-like protein) (Flavohemoglobin) (Nitric oxide dioxygenase)
1383 :     prod: flavohemoprotein
1384 :     //
1385 :     func: Flavohemoprotein (Hemoglobin-like protein) (Flavohemoglobin) (Nitric oxide dioxygenase) (EC 1.14.12.17)
1386 :     prod: flavohemoprotein
1387 :     ecnu: 1.14.12.17
1388 :     //
1389 :     func: Protein export cytoplasm chaperone protein (SecB, maintains protein to be exported in unfolded state)
1390 :     prod: chaperone protein SecB
1391 :     note: cytoplasmic protein
1392 :     note: maintains exported protein in unfolded state
1393 :     //
1394 :     func: GlpG protein (membrane protein of glp regulon)
1395 :     desc: protein GlpG
1396 :     note: membrane protein of glp regulon
1397 :     //
1398 :     func: BatA (Bacteroides aerotolerance operon)
1399 :     prod: protein BatA
1400 :     note: Bacteroides aerotolerance operon
1401 :     //
1402 :     func: Putative inner membrane protein YjeT (clustered with HflC)
1403 :     prod: protein YjeT
1404 :     note: inner membrane protein
1405 :     note: clustered with HflC
1406 :     //
1407 :     func: Putative inner membrane protein (Fragment)
1408 :     prod: hypothetical protein
1409 :     //
1410 :     func: Proline dehydrogenase (Proline oxidase)
1411 :     prod: proline dehydrogenase
1412 :     prod: proline oxidase
1413 :     //
1414 :     func: Signal recognition particle receptor protein FtsY (=alpha subunit) (TC 3.A.5.1.1)
1415 :     desc: signal recognition particle receptor protein FtsY
1416 :     note: alpha subunit
1417 :     note: TC 3.A.5.1.1
1418 :     //
1419 :     func: Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
1420 :     prod: ferredoxin-NADPH reductase
1421 :     note: flavodoxin reductases, family 1
1422 :     //
1423 :     func: Ferredoxin-type protein NapF (periplasmic nitrate reductase)
1424 :     prod: nitrate reductase
1425 :     desc: ferredoxin-type protein NapF
1426 :     note: periplasmic
1427 :     //
1428 :     func: Aminoacyl-histidine dipeptidase (Peptidase D)
1429 :     prod: aminoacyl-histidine dipeptidase
1430 :     desc: Peptidase D
1431 :     //
1432 :     func: Signal recognition particle receptor protein FtsY (=alpha subunit)
1433 :     prod: signal recognition particle receptor protein FtsY
1434 :     note: alpha subunit
1435 :     //
1436 :     func: 23S rRNA (guanine-N-2-) -methyltransferase rlmL EC 2.1.1.-)
1437 :     prod: 23S rRNA (guanine-N-2-)-methyltransferase rlmL
1438 :     //
1439 :     func: Beta N-acetyl-glucosaminidase( EC 3.2.1.52 )
1440 :     prod: beta N-acetyl-glucosaminidase
1441 :     ecnu: 3.2.1.52
1442 :     //
1443 :     func: (U59485) AttH
1444 :     prod: hypothetical protein
1445 :     //
1446 :     func: 18K peptidoglycan-associated outer membrane lipoprotein
1447 :     prod: peptidoglycan-associated outer membrane lipoprotein
1448 :     //
1449 :     func: OmpA/MotB precursor
1450 :     prod: OmpA precursor
1451 :     //
1452 :     func: (GlcNAc)2 ABC transporter, periplasmic substrate-binding protein
1453 :     prod: (GlcNAc)2 ABC transporter: substrate-binding protein
1454 :     //
1455 :     func: Peptidoglycan-associated lipoprotein precursor
1456 :     prod: Peptidoglycan-associated lipoprotein
1457 :     //
1458 :     func: CRISPR-associated helicase Cas3, protein
1459 :     prod: CRISPR-associated helicase Cas3
1460 :     //
1461 :     func: Homolog of E. coli HemX protein
1462 :     prod: HemX-like protein
1463 :     //
1464 :     func: Homolog of E. coli HemY protein
1465 :     prod: HemY-like protein
1466 :     //
1467 :     func: Hypothetical protein
1468 :     prod: hypothetical protein
1469 :     //
1470 :     func: hypothetical protein
1471 :     prod: hypothetical protein
1472 :     //
1473 :     func: conserved domain protein
1474 :     prod: hypothetical protein
1475 :     //
1476 :     func: Conserved domain protein
1477 :     prod: hypothetical protein
1478 :     //
1479 :     func: unknown
1480 :     prod: hypothetical protein
1481 :     //
1482 :     func: predicted by FrameD
1483 :     prod: hypothetical protein
1484 :     //
1485 :     func: Frataxin homolog CyaY, facilitates iron supply for heme A synthesis or Fe-S cluster assembly
1486 :     prod: frataxin CyaY
1487 :     note: facilitates iron supply for heme A synthesis or Fe-S cluster assembly
1488 :     //
1489 :     func: ATPase YjeE, predicted to have essential role in cell wall biosynthesis
1490 :     prod: ATPase YjeE
1491 :     note: predicted to have essential role in cell wall biosynthesis
1492 :     //
1493 :     func: Permease of the drug/metabolite transporter (DMT) superfamily
1494 :     prod: permease
1495 :     desc: permease of the drug/metabolite transporter (DMT) superfamily
1496 :     //
1497 :     func: Permeases of the drug/metabolite transporter (DMT) superfamily
1498 :     prod: permease
1499 :     desc: permease of the drug/metabolite transporter (DMT) superfamily
1500 :     //
1501 :     func: Phosphate transport regulator (distant homolog of PhoU)
1502 :     prod: phosphate transport regulator
1503 :     note: distant homolog of PhoU
1504 :     //
1505 :     func: Unsaturated fatty acid biosythesis repressor FabR, TetR family
1506 :     prod: unsaturated fatty acid biosythesis repressor FabR
1507 :     note: TetR family regulator
1508 :     //
1509 :     func: 33 kDa chaperonin
1510 :     prod: heat-shock chaperonin
1511 :     //
1512 :     func: Ribosome-associated heat shock protein implicated in the recycling of the 50S subunit (S4 paralog)
1513 :     prod: ribosome-associated heat shock protein
1514 :     note: implicated in the recycling of the LSU (S4 paralog)
1515 :     //
1516 :     func: TRANSCRIPTION ACCESSORY PROTEIN (S1 RNA binding domain)
1517 :     prod: transcription accessory protein
1518 :     note: S1 RNA binding domain
1519 :     //
1520 :     func: MiaB-like tRNA modifying enzyme YliG, TIGR01125
1521 :     prod: MiaB-like tRNA modifying enzyme YliG
1522 :     note: TIGR01125
1523 :     //
1524 :     func: Phosphoribulokinase (EC 2.7.1.19) homolog, function unknown
1525 :     prod: hypothetical protein
1526 :     note: phosphoribulokinase homolog of unknown function
1527 :     //
1528 :     func: Hydrolase, alpha/beta fold family functionally coupled to Phosphoribulokinase
1529 :     prod: alpha/beta fold family hydrolase
1530 :     note: functionally coupled to phosphoribulokinase
1531 :     //
1532 :     func: LptA, protein essential for LPS transport across the periplasm
1533 :     prod: LptA protein
1534 :     note: essential for LPS transport across the periplasm
1535 :     //
1536 :     func: Uncharacterized protein YrbK clustered with lipopolysaccharide transporters
1537 :     prod: YrbK protein
1538 :     note: clustered with lipopolysaccharide transporters
1539 :     //
1540 :     func: Inner membrane protein YrbG, predicted calcium/sodium:proton antiporter
1541 :     prod: YrbG protein
1542 :     note: inner membrane protein, predicted calcium/sodium:proton antiporter
1543 :     //
1544 :     func: Uncharacterized ABC transporter, periplasmic component YrbD
1545 :     prod: uncharacterized ABC transporter, periplasmic component YrbD
1546 :     //
1547 :     func: Phosphate starvation-inducible protein PhoH, predicted ATPase
1548 :     prod: phosphate starvation-inducible protein PhoH
1549 :     note: predicted ATPase
1550 :     //
1551 :     func: HD-GYP domain
1552 :     prod: HD-GYP domain-containing protein
1553 :     //
1554 :     func: Predicted ATP-dependent endonuclease of the OLD family
1555 :     prod: ATP-dependent endonuclease
1556 :     note: predicted ATP-dependent endonuclease of the OLD family
1557 :     //
1558 :     func: No significant database matches
1559 :     prod: hypothetical protein
1560 :     //
1561 :     func: COG0110: Acetyltransferase (isoleucine patch superfamily)
1562 :     prod: acetyltransferase
1563 :     note: isoleucine patch superfamily
1564 :     //
1565 :     func: Metalloprotease, putative zinc-binding domain
1566 :     prod: metalloprotease
1567 :     note: putative zinc-binding domain
1568 :     //
1569 :     func: YjeF protein, function unknown
1570 :     prod: YjeF protein
1571 :     //
1572 :     func: Phosphate ABC transporter, periplasmic phosphate-binding protein pstS (TC 3.A.1.7.1)
1573 :     prod: phosphate ABC transporter, periplasmic phosphate-binding protein pstS
1574 :     note: TC 3.A.1.7.1
1575 :     //
1576 :     func: Methyl-accepting chemotaxis protein III (mcp-III) (ribose and galactose chemoreceptor protein)
1577 :     prod: methyl-accepting chemotaxis protein III
1578 :     note: ribose and galactose chemoreceptor protein
1579 :     //
1580 :     func: ABC transporter, transmembrane region:ABC transporter:Peptidase C39, bacteriocin processing
1581 :     prod: ABC transporter transmembrane region
1582 :     //
1583 :     func: fig|345076.3.peg.2944 homologs, predicted periplasmic protein
1584 :     prod: hypothetical protein
1585 :     note: predicted periplasmic protein
1586 :     //
1587 :     func: Phosphosugar mutase of unknown sugar (see annotation)
1588 :     prod: phosphosugar mutase
1589 :     note: phosphosugar mutase of unknown sugar
1590 :     //
1591 :     func: Maltoporin (maltose/maltodextrin high-affinity receptor, phage lambda receptor protein)
1592 :     prod: maltoporin
1593 :     note: maltose/maltodextrin high-affinity receptor, phage lambda receptor protein
1594 :     //
1595 :     func: Predicted Lactate-responsive regulator, LysR family
1596 :     prod: transcriptional regulator LysR family
1597 :     note: predicted Lactate-responsive regulator
1598 :     //
1599 :     func: Permease of the major facilitator superfamily
1600 :     prod: permease
1601 :     note: permease of the major facilitator superfamily
1602 :     //
1603 :     func: Maltose/maltodextrin ABC transporter, substrate binding periplasmic protein MalE
1604 :     prod: maltose/maltodextrin ABC transporter substrate binding periplasmic protein MalE
1605 :     //
1606 :     func: AraC-type DNA-binding domain-containing protein
1607 :     prod: AraC-type DNA-binding domain-containing protein
1608 :     //
1609 :     func: Transposase and inactivated derivatives
1610 :     prod: transposase
1611 :     //
1612 :     func: ABC-type phosphate transport system, periplasmic component
1613 :     prod: ABC-type phosphate transport system periplasmic component
1614 :     //
1615 :     func: Arginine ABC transporter, periplasmic arginine-binding protein ArtI
1616 :     prod: arginine ABC transporter periplasmic arginine-binding protein ArtI
1617 :     //
1618 :     func: Unknown, probable transcription regulator
1619 :     prod: hypothetical protein
1620 :     desc: probable transcription regulator
1621 :     //
1622 :     func: orf, conserved hypothetical protein
1623 :     prod: hypothetical protein
1624 :     //
1625 :     func: Iron-containing alcohol dehydrogenase
1626 :     prod: iron-containing alcohol dehydrogenase
1627 :     //
1628 :     func: NnrS protein involved in response to NO
1629 :     prod: NnrS protein
1630 :     desc: involved in response to NO
1631 :     //
1632 :     func: Uncharacterized protein, similar to the N-terminal domain of Lon protease
1633 :     prod: hypothetical protein
1634 :     note: similar to the N-terminal domain of Lon protease
1635 :     //
1636 :     func: Holin-like protein cidA
1637 :     prod: holin-like protein cidA
1638 :     //
1639 :     func: TRAP-type transport system, periplasmic component, predicted N-acetylneuraminate-binding protein
1640 :     prod: TRAP-type transport system periplasmic component
1641 :     note: predicted N-acetylneuraminate-binding protein
1642 :     //
1643 :     func: TRAP-type transport system, small permease component, predicted N-acetylneuraminate transporter
1644 :     prod: TRAP-type transport system small permease component
1645 :     note: predicted N-acetylneuraminate transporter
1646 :     //
1647 :     func: TRAP-type transport system, large permease component, predicted N-acetylneuraminate transporter
1648 :     prod: TRAP-type transport system large permease component
1649 :     note: predicted N-acetylneuraminate transporter
1650 :     //
1651 :     func: Type III secretion inner membrane channel protein (LcrD,HrcV,EscV,SsaV)
1652 :     prod: Type III secretion inner membrane channel protein
1653 :     note: LcrD, HrcV, EscV, SsaV
1654 :     //
1655 :     func: Type III secretion inner membrane protein (YscU,SpaS,EscU,HrcU,SsaU, homologous to flagellar export components)
1656 :     prod: Type III secretion inner membrane protein
1657 :     desc: homologous to flagellar export components
1658 :     note: YscU, SpaS, EscU, HrcU, SsaU
1659 :     //
1660 :     func: Type III secretion cytoplasmic ATP synthase (EC 3.6.3.14, YscN,SpaL,MxiB,HrcN,EscN)
1661 :     prod: Type III secretion cytoplasmic ATP synthase
1662 :     ecnu: 3.6.3.14
1663 :     //
1664 :     func: NAD(FAD)-utilizing dehydrogenase, sll0175 homolog
1665 :     prod: NAD(FAD)-utilizing dehydrogenase
1666 :     //
1667 :     func: thermostable direct hemolysin S
1668 :     prod: hemolysin S
1669 :     //
1670 :     func: Putative predicted metal-dependent hydrolase
1671 :     prod: hypothetical protein
1672 :     desc: predicted metal-dependent hydrolase
1673 :     //
1674 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase fkpA precursor (EC 5.2.1.8)
1675 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase FkpA precursor
1676 :     ecnu: 5.2.1.8
1677 :     //
1678 :     func: FOG: WD40 repeat
1679 :     prod: hypothetical protein
1680 :     //
1681 :     func: Protein slyX
1682 :     prod: protein SlyX
1683 :     //
1684 :     func: Transporter, putative
1685 :     prod: transporter
1686 :     //
1687 :     func: Type 4 fimbrial assembly protein pilC
1688 :     prod: type 4 fimbrial assembly protein PilC
1689 :     //
1690 :     func: YgfY COG2938
1691 :     prod: hypothetical protein
1692 :     //
1693 :     func: COG0354: Predicted aminomethyltransferase related to GcvT
1694 :     prod: predicted aminomethyltransferase related to GcvT
1695 :     //
1696 :     func: Signal recognition particle receptor protein FtsY (=alpha subunit) (TC 3.A.5.1.1)
1697 :     prod: signal recognition particle receptor protein FtsY
1698 :     //
1699 :     func: Protein of unknown function DUF484
1700 :     prod: hypothetical protein
1701 :     //
1702 :     func: Protein of unknown function DUF414
1703 :     prod: hypothetical protein
1704 :     //
1705 :     func: Periplasmic/membrane protein associated with DUF414
1706 :     prod: hypothetical protein
1707 :     //
1708 :     func: Thiosulfate sulfurtransferase glpE (EC 2.8.1.1)
1709 :     prod: thiosulfate sulfurtransferase GlpE
1710 :     ecnu: 2.8.1.1
1711 :     //
1712 :     func: GlpG protein (membrane protein of glp regulon)
1713 :     prod: protein GlpG
1714 :     note: membrane protein of glp regulon
1715 :     //
1716 :     func: Flagellar biosynthesis protein fliL
1717 :     prod: flagellar biosynthesis protein FliL
1718 :     //
1719 :     func: COG3165: Uncharacterized protein conserved in bacteria
1720 :     prod: hypothetical protein
1721 :     //
1722 :     func: Uncharacterized protein conserved in bacteria
1723 :     prod: hypothetical protein
1724 :     //
1725 :     func: Ferritin-like protein 2
1726 :     prod: ferritin-like protein 2
1727 :     //
1728 :     func: LysR-family transcriptional regulator VC0068
1729 :     prod: LysR-family transcriptional regulator
1730 :     //
1731 :     func: Protein crcB homolog
1732 :     prod: CrbC-like protein
1733 :     //
1734 :     func: DNA-binding protein fis
1735 :     prod: NA-binding protein Fis
1736 :     //
1737 :     func: COG3068: Uncharacterized protein conserved in bacteria
1738 :     prod: hypothetical protein
1739 :     //
1740 :     func: O-antigen export system, ATP-binding protein
1741 :     prod: O-antigen export system ATP-binding protein
1742 :     //
1743 :     func: O-antigen export system, permease protein
1744 :     prod: O-antigen export system permease protein
1745 :     //
1746 :     func: O-antigen export system, polymerase or transferase
1747 :     prod: O-antigen export system polymerase or transferase
1748 :     //
1749 :     func: Protein yicC
1750 :     prod: protein YicC
1751 :     //
1752 :     func: Ferrichrome transport system permease protein fhuB (TC 3.A.1.14.3)
1753 :     prod: ferrichrome transport system permease protein FhuB
1754 :     note: TC 3.A.1.14.3
1755 :     //
1756 :     func: Ferrichrome transport ATP-binding protein fhuC (TC 3.A.1.14.3)
1757 :     prod: ferrichrome transport ATP-binding protein FhuC
1758 :     note: TC 3.A.1.14.3
1759 :     //
1760 :     func: HTH-type transcriptional regulator ilvY
1761 :     prod: HTH-type transcriptional regulator IlvY
1762 :     //
1763 :     func: putative transcriptional regulator
1764 :     prod: transcriptional regulator
1765 :     //
1766 :     func: galactoside O-acetyltransferase (EC 2.3.1.18), probable yiiD
1767 :     prod: galactoside O-acetyltransferase
1768 :     desc: probable YiiD
1769 :     ecnu: 2.3.1.18
1770 :     //
1771 :     func: P pilus assembly/Cpx signaling pathway, periplasmic inhibitor/zinc- resistance associated protein
1772 :     prod: P pilus assembly/Cpx signaling pathway, periplasmic inhibitor/zinc- resistance associated protein
1773 :     //
1774 :     func: ATP-dependent protease hslV (EC 3.4.25.-)
1775 :     prod: ATP-dependent protease HslV
1776 :     //
1777 :     func: ATP-dependent hsl protease ATP-binding subunit hslU
1778 :     prod: ATP-dependent hsl protease ATP-binding subunit HslU
1779 :     //
1780 :     func: Uncharacterized low-complexity protein
1781 :     prod: hypothetical protein
1782 :     //
1783 :     func: Glutathione-regulated potassium-efflux system ancillary protein kefG
1784 :     prod: glutathione-regulated potassium-efflux system ancillary protein KefG
1785 :     //
1786 :     func: Glutathione-regulated potassium-efflux system protein kefB
1787 :     prod: glutathione-regulated potassium-efflux system protein KefB
1788 :     //
1789 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase slyD (EC 5.2.1.8)
1790 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase SlyD
1791 :     ecnu: 5.2.1.8
1792 :     //
1793 :     func: Sodium-type polar flagellar protein motX
1794 :     prod: sodium-type polar flagellar protein MotX
1795 :     //
1796 :     func: 23S rRNA (guanosine-2'-O-) -methyltransferase rlmB (EC 2.1.1.-)
1797 :     prod: 23S rRNA (guanosine-2'-O-) -methyltransferase RlmB
1798 :     //
1799 :     func: Preprotein translocase secY subunit (TC 3.A.5.1.1)
1800 :     prod: preprotein translocase SecY subunit
1801 :     note: TC 3.A.5.1.1
1802 :     //
1803 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase fklB (EC 5.2.1.8)
1804 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase FklB
1805 :     ecnu: 5.2.1.8
1806 :     //
1807 :     func: Protein ytfJ precursor
1808 :     prod: protein YtfJ precursor
1809 :     //
1810 :     func: Peptide methionine sulfoxide reductase msrA (EC 1.8.4.11)
1811 :     prod: peptide methionine sulfoxide reductase MsrA
1812 :     ecnu: 1.8.4.11
1813 :     //
1814 :     func: RNA polymerase sigma-54 factor rpoN
1815 :     prod: RNA polymerase sigma-54 factor RpoN
1816 :     //
1817 :     func: Aspartate carbamoyltransferase regulatory chain (pyrI)
1818 :     prod: aspartate carbamoyltransferase regulatory chain PyrI
1819 :     //
1820 :     func: RNA polymerase associated protein rapA (EC 3.6.1.-)
1821 :     prod: RNA polymerase associated protein RapA
1822 :     //
1823 :     func: DNA primase; involved in replication, phage related
1824 :     prod: DNA primase
1825 :     note: phage related
1826 :     //
1827 :     func: Zn-dependent protease
1828 :     prod: Zn-dependent protease
1829 :     //
1830 :     func: Osmosensitive K+ channel histidine kinase kdpD (EC 2.7.3.-)
1831 :     prod: osmosensitive K+ channel histidine kinase KdpD
1832 :     //
1833 :     func: COG0523: Putative GTPases (G3E family)
1834 :     prod: Putative GTPase (G3E family)
1835 :     //
1836 :     func: H(+)/Cl(-) exchange transporter clcA
1837 :     prod: H(+)/Cl(-) exchange transporter ClcA
1838 :     //
1839 :     func: relB protein
1840 :     prod: RelB protein
1841 :     //
1842 :     func: mazG-related protein
1843 :     prod: MazG-related protein
1844 :     //
1845 :     func: Sulfate and thiosulfate binding protein cysP
1846 :     prod: sulfate and thiosulfate binding protein CysP
1847 :     //
1848 :     func: CcdB
1849 :     prod: CcdB protein
1850 :     //
1851 :     func: Glycine dehydrogenase [decarboxylating] (glycine cleavage system P protein) (EC 1.4.4.2)
1852 :     prod: glycine dehydrogenase [decarboxylating]
1853 :     ecnu: 1.4.4.2
1854 :     //
1855 :     func: C4-dicarboxylate like transporter
1856 :     prod: C4-dicarboxylate like transporter
1857 :     //
1858 :     func: Anaerobic nitric oxide reductase transcription regulator norR
1859 :     prod: anaerobic nitric oxide reductase transcription regulator NorR
1860 :     //
1861 :     func: Nucleoside permease nupC
1862 :     prod: nucleoside permease NupC
1863 :     //
1864 :     func: frnE protein
1865 :     prod: FrnE protein
1866 :     //
1867 :     func: hypothetical protein PA3071
1868 :     prod: hypothetical protein
1869 :     //
1870 :     func: Uncharacterized protein similar to VCA0109
1871 :     prod: hypothetical protein
1872 :     //
1873 :     func: Phosphate transport ATP-binding protein pstB (TC 3.A.1.7.1)
1874 :     prod: phosphate transport ATP-binding protein PstB
1875 :     note: TC 3.A.1.7.1
1876 :     //
1877 :     func: Phosphate transport system permease protein pstA (TC 3.A.1.7.1)
1878 :     prod: phosphate transport system permease protein PstA
1879 :     note: TC 3.A.1.7.1
1880 :     //
1881 :     func: Phosphate transport system permease protein pstC (TC 3.A.1.7.1)
1882 :     prod: phosphate transport system permease protein PstC
1883 :     note: TC 3.A.1.7.1
1884 :     //
1885 :     func: Phosphate ABC transporter, periplasmic phosphate-binding protein pstS (TC 3.A.1.7.1)
1886 :     prod: phosphate ABC transporter, periplasmic phosphate-binding protein pstS
1887 :     note: TC 3.A.1.7.1
1888 :     //
1889 :     func: ATP-dependent RNA helicase VCA0061
1890 :     prod: ATP-dependent RNA helicase
1891 :     //
1892 :     func: ATP-dependent DNA helicase pcrA (EC 3.6.1.-)
1893 :     prod: ATP-dependent DNA helicase PcrA
1894 :     //
1895 :     func: hcp protein
1896 :     prod: Hcp protein
1897 :     //
1898 :     func: Predicted P-loop ATPase fused to an acetyltransferase COG1444
1899 :     prod: hypothetical protein
1900 :     desc: predicted P-loop ATPase fused to an acetyltransferase
1901 :     //
1902 :     func: Na+/H+ antiporter NhaD type
1903 :     prod: Na+/H+ antiporter NhaD type
1904 :     //
1905 :     func: ATP-dependent RNA helicase VCA0990
1906 :     prod: ATP-dependent RNA helicase
1907 :     //
1908 :     func: Na+-driven multidrug efflux pump
1909 :     prod: Na+-driven multidrug efflux pump
1910 :     //
1911 :     func: Peptidyl-prolyl cis-trans isomerase ppiC (EC 5.2.1.8)
1912 :     prod: peptidyl-prolyl cis-trans isomerase PpiC
1913 :     ecnu: 5.2.1.8
1914 :     //
1915 :     func: Osmosensitive K+ channel histidine kinase kdpD (EC 2.7.3.-)
1916 :     prod: osmosensitive K+ channel histidine kinase KdpD
1917 :     //
1918 :     func: COG3385: FOG: Transposase and inactivated derivatives
1919 :     prod: transposase
1920 :     //
1921 :     func: COG0055: F0F1-type ATP synthase, beta subunit
1922 :     prod: F0F1-type ATP synthase beta subunit
1923 :     //
1924 :     func: Streptococcal hemagglutinin protein
1925 :     prod: hemagglutinin protein
1926 :     //
1927 :     func: LysR-family transcriptional regulator VCA0830
1928 :     prod: LysR-family transcriptional regulator
1929 :     //
1930 :     func: COG2827: putative endonuclease containing a URI domain
1931 :     prod: putative endonuclease containing a URI domain
1932 :     //
1933 :     func: Autoinducer 2-binding periplasmic protein luxP precursor
1934 :     prod: autoinducer 2-binding periplasmic protein LuxP precursor
1935 :     //
1936 :     func: Autoinducer 2 sensor kinase/phosphatase luxQ (EC 2.7.3.-) (EC 3.1.3.-)
1937 :     prod: autoinducer 2 sensor kinase/phosphatase LuxQ
1938 :     //
1939 :     func: Molybdenum ABC transporter, periplasmic molybdenum-binding protein modA (TC 3.A.1.8.1)
1940 :     prod: molybdenum ABC transporter, periplasmic molybdenum-binding protein ModA
1941 :     note: TC 3.A.1.8.1
1942 :     //
1943 :     func: Molybdenum transport system permease protein modB (TC 3.A.1.8.1)
1944 :     prod: molybdenum transport system permease protein ModB
1945 :     note: TC 3.A.1.8.1
1946 :     //
1947 :     func: Molybdenum transport ATP-binding protein modC (TC 3.A.1.8.1)
1948 :     prod: molybdenum transport ATP-binding protein ModC
1949 :     note: TC 3.A.1.8.1
1950 :     //
1951 :     func: Periplasmic protein torT precursor
1952 :     prod: periplasmic protein TorT precursor
1953 :     //
1954 :     func: Sensor protein torS (EC 2.7.3.-)
1955 :     prod: sensor protein TorS
1956 :     //
1957 :     func: COG4388: Mu-like prophage I protein
1958 :     prod: phage protein
1959 :     desc: Mu-like prophage I protein
1960 :     //
1961 :     func: prophage MuSo2, virion morphogenesis protein, putative
1962 :     prod: phage protein
1963 :     desc: prophage MuSo2, virion morphogenesis protein, putative
1964 :     //
1965 :     func: phage tail tape measure protein, TP901 family, putative
1966 :     prod: phage tail tape measure protein
1967 :     desc: TP901 family
1968 :     //
1969 :     func: prophage MuSo2, 43 kDa tail protein, putative
1970 :     prod: phage tail protein
1971 :     //
1972 :     func: Putative baseplate assembly protein
1973 :     prod: phage protein
1974 :     desc: putative baseplate assembly protein
1975 :     //
1976 :     func: Protein-export membrane protein secD (TC 3.A.5.1.1)
1977 :     prod: protein-export membrane protein SecD
1978 :     desc: TC 3.A.5.1.1
1979 :     //
1980 :     func: Protein-export membrane protein secF (TC 3.A.5.1.1)
1981 :     prod: protein-export membrane protein SecF
1982 :     desc: TC 3.A.5.1.1
1983 :     //
1984 :     func: Anaerobic C4-dicarboxylate transporter dcuC
1985 :     prod: anaerobic C4-dicarboxylate transporter DcuC
1986 :     //
1987 :     func: RRNA methylase, putative
1988 :     prod: rRNA methylase
1989 :     //
1990 :     func: Oligopeptide transport system permease protein oppB (TC 3.A.1.5.1)
1991 :     prod: oligopeptide transport system permease protein OppB
1992 :     desc: TC 3.A.1.5.1
1993 :     //
1994 :     func: Oligopeptide transport system permease protein oppC
1995 :     prod: oligopeptide transport system permease protein OppC
1996 :     //
1997 :     func: Tyrosine recombinase xerD
1998 :     prod: tyrosine recombinase XerD
1999 :     //
2000 :     func: Cell division protein ftsL
2001 :     prod: cell division protein FtsL
2002 :     //
2003 :     func: Cell division protein ftsI [Peptidoglycan synthetase] (EC 2.4.1.129)
2004 :     prod: cell division protein FtsI [Peptidoglycan synthetase]
2005 :     ecnu: 2.4.1.129
2006 :     //
2007 :     func: Cell division protein ftsW
2008 :     prod: cell division protein FtsW
2009 :     //
2010 :     func: Cell division protein ftsQ
2011 :     prod: cell division protein FtsQ
2012 :     //
2013 :     func: Cell division protein ftsA
2014 :     prod: cell division protein FtsA
2015 :     //
2016 :     func: Cell division protein ftsZ (EC 3.4.24.-)
2017 :     prod: cell division protein FtsZ
2018 :     //
2019 :     func: Mutator mutT protein (7,8-dihydro-8-oxoguanine-triphosphatase) (EC 3.6.1.-)
2020 :     prod: MutT protein [7,8-dihydro-8-oxoguanine-triphosphatase]
2021 :     //
2022 :     func: Aerobic respiration control sensor protein arcB (EC 2.7.3.-)
2023 :     prod: aerobic respiration control sensor protein ArcB
2024 :     //
2025 :     func: Aerobic respiration control protein arcA
2026 :     prod: aerobic respiration control protein ArcA
2027 :     //
2028 :     func: UPF0246 protein YaaA
2029 :     prod: hypothetical protein
2030 :     //
2031 :     func: Chromosome segregation ATPase ## putative; UPF0325 protein yaeH
2032 :     prod: chromosome segregation ATPase
2033 :     //
2034 :     func: Hypothetical protein Q8DBD3_VIBVU
2035 :     prod: hypothetical protein
2036 :     //
2037 :     func: putative exported protein
2038 :     prod: hypothetical protein
2039 :     //
2040 :     func: Flagellar biosynthesis protein flgN
2041 :     prod: flagellar biosynthesis protein FlgN
2042 :     //
2043 :     func: Negative regulator of flagellin synthesis flgM
2044 :     prod: negative regulator of flagellin synthesis FlgM
2045 :     //
2046 :     func: Flagellar basal-body P-ring formation protein flgA
2047 :     prod: flagellar basal-body P-ring formation protein FlgA
2048 :     //
2049 :     func: Flagellar basal-body rod protein flgB
2050 :     prod: flagellar basal-body rod protein FlgB
2051 :     //
2052 :     func: Flagellar basal-body rod protein flgC
2053 :     prod: flagellar basal-body rod protein FlgC
2054 :     //
2055 :     func: Flagellar basal-body rod modification protein flgD
2056 :     prod: flagellar basal-body rod modification protein FlgD
2057 :     //
2058 :     func: Flagellar hook protein flgE
2059 :     prod: flagellar hook protein FlgE
2060 :     //
2061 :     func: Flagellar basal-body rod protein flgF
2062 :     prod: flagellar basal-body rod protein FlgF
2063 :     //
2064 :     func: Flagellar basal-body rod protein flgG
2065 :     prod: flagellar basal-body rod protein FlgG
2066 :     //
2067 :     func: Flagellar L-ring protein flgH
2068 :     prod: flagellar L-ring protein FlgH
2069 :     //
2070 :     func: Flagellar P-ring protein flgI
2071 :     prod: flagellar P-ring protein FlgI
2072 :     //
2073 :     func: Flagellar protein flgJ [peptidoglycan hydrolase] (EC 3.2.1.-)
2074 :     prod: flagellar protein flgJ [peptidoglycan hydrolase]
2075 :     //
2076 :     func: Flagellar hook-associated protein flgK
2077 :     prod: flagellar hook-associated protein FlgK
2078 :     //
2079 :     func: Flagellar hook-associated protein flgL
2080 :     prod: flagellar hook-associated protein FlgL
2081 :     //
2082 :     func: Flagellin protein flaC
2083 :     prod: flagellin protein FlaC
2084 :     //
2085 :     func: Flagellin protein flaD
2086 :     prod: flagellin protein FlaD
2087 :     //
2088 :     func: Outer membrane protein NlpB, lipoprotein component of the protein assembly complex (forms a complex with YaeT, YfiO, and YfgL)
2089 :     prod: NlpB lipoprotein component of the protein assembly complex
2090 :     note: most likely function alternative not yet resolved
2091 :     //
2092 :     func: Lipoprotein-34 precursor
2093 :     prod: lipoprotein
2094 :     //
2095 :     func: Flagellin protein flaF
2096 :     prod: flagellin protein FlaF
2097 :     //
2098 :     func: Flagellin protein flaG
2099 :     prod: flagellin protein FlaG
2100 :     //
2101 :     func: Flagellar hook-associated protein fliD
2102 :     prod: flagellar hook-associated protein FliD
2103 :     //
2104 :     func: Flagellar rod protein flaI
2105 :     prod: flagellar rod protein FlaI
2106 :     //
2107 :     func: Flagellar biosynthesis protein fliS
2108 :     prod: flagellar biosynthesis protein FliS
2109 :     //
2110 :     func: Flagellar regulatory protein fleQ
2111 :     prod: flagellar regulatory protein FleQ
2112 :     //
2113 :     func: Flagellar sensor histidine kinase fleS
2114 :     prod: flagellar sensor histidine kinase FleS
2115 :     //
2116 :     func: Flagellar hook-basal body complex protein fliE
2117 :     prod: flagellar hook-basal body complex protein FliE
2118 :     //
2119 :     func: Flagellar M-ring protein fliF
2120 :     prod: flagellar M-ring protein FliF
2121 :     //
2122 :     func: Flagellar motor switch protein fliG
2123 :     prod: flagellar motor switch protein FliG
2124 :     //
2125 :     func: Flagellar assembly protein fliH
2126 :     prod: flagellar assembly protein FliH
2127 :     //
2128 :     func: Flagellum-specific ATP synthase fliI
2129 :     prod: flagellum-specific ATP synthase FliI
2130 :     //
2131 :     func: Flagellar protein fliJ
2132 :     prod: flagellar protein FliJ
2133 :     //
2134 :     func: Flagellar hook-length control protein fliK
2135 :     prod: flagellar hook-length control protein FliK
2136 :     //
2137 :     func: Flagellar biosynthesis protein fliL
2138 :     prod: flagellar biosynthesis protein FliL
2139 :     //
2140 :     func: Flagellar motor switch protein fliM
2141 :     prod: flagellar motor switch protein FliM
2142 :     //
2143 :     func: Flagellar motor switch protein fliN
2144 :     prod: flagellar motor switch protein FliN
2145 :     //
2146 :     func: Flagellar biosynthesis protein fliO
2147 :     prod: flagellar biosynthesis protein FliO
2148 :     //
2149 :     func: Flagellar biosynthesis protein fliP
2150 :     prod: flagellar biosynthesis protein FliP
2151 :     //
2152 :     func: Flagellar biosynthesis protein fliQ
2153 :     prod: flagellar biosynthesis protein FliQ
2154 :     //
2155 :     func: Flagellar biosynthesis protein fliR
2156 :     prod: flagellar biosynthesis protein FliR
2157 :     //
2158 :     func: Flagellar biosynthesis protein flhB
2159 :     prod: flagellar biosynthesis protein FlhB
2160 :     //
2161 :     func: Flagellar biosynthesis protein flhA
2162 :     prod: flagellar biosynthesis protein FlhA
2163 :     //
2164 :     func: Flagellar biosynthesis protein flhF
2165 :     prod: flagellar biosynthesis protein FlhF
2166 :     //
2167 :     func: Flagellar synthesis regulator fleN
2168 :     prod: flagellar synthesis regulator FleN
2169 :     //
2170 :     func: 5-methylaminomethyl-2-thiouridine-forming enzyme mnmC
2171 :     prod: 5-methylaminomethyl-2-thiouridine-forming enzyme MnmC
2172 :     //
2173 :     func: Holin-like protein cidA
2174 :     prod: Holin-like protein CidA
2175 :     //
2176 :     func: Hypothetical protein ybgI
2177 :     prod: hypothetical protein
2178 :     //
2179 :     func: Cytochrome c-type biogenesis protein CcmC, putative heme lyase for CcmE
2180 :     prod: cytochrome c-type biogenesis protein CcmC
2181 :     desc: desc: putative heme lyase for CcmE
2182 :     //
2183 :     func: UPF0352 protein VC_2040
2184 :     prod: hypothetical protein
2185 :     //
2186 :     func: Nucleoid-associated protein ndpA
2187 :     prod: nucleoid-associated protein NdpA
2188 :     //
2189 :     func: Na+/H+ antiporter NhaC
2190 :     prod: Na+/H+ antiporter NhaC
2191 :     //
2192 :     func: Peptide methionine sulfoxide reductase msrB (EC 1.8.4.6)
2193 :     prod: peptide methionine sulfoxide reductase MsrB
2194 :     ecnu: 1.8.4.11
2195 :     //
2196 :     func: Transcriptional regulator yidN, Cro/CI family
2197 :     prod: transcriptional regulator YidN, Cro/CI family
2198 :     //
2199 :     func: COGs COG3492
2200 :     prod: hypothetical protein
2201 :     //
2202 :     func: Cell division topological specificity factor minE
2203 :     prod: cell division topological specificity factor MinE
2204 :     //
2205 :     func: Septum site-determining protein minD
2206 :     prod: septum site-determining protein MinD
2207 :     //
2208 :     func: Septum site-determining protein minC
2209 :     prod: septum site-determining protein MinC
2210 :     //
2211 :     func: Protein ycgL
2212 :     prod: protein YcgL
2213 :     //
2214 :     func: Cytochrome c-type protein torY
2215 :     prod: cytochrome c-type protein TorY
2216 :     //
2217 :     func: pvcA protein
2218 :     prod: PvcA protein
2219 :     //
2220 :     func: ATP-dependent Clp protease ATP-binding subunit clpX
2221 :     prod: ATP-dependent Clp protease ATP-binding subunit ClpX
2222 :     //
2223 :     func: Peptidyl-prolyl cis-trans isomerase ppiD (EC 5.2.1.8)
2224 :     prod: peptidyl-prolyl cis-trans isomerase PpiD
2225 :     ecnu: 5.2.1.8
2226 :     //
2227 :     func: Cell division protein ftsK
2228 :     prod: cell division protein FtsK
2229 :     //
2230 :     func: Na+/H+-exchanging protein
2231 :     prod: Na+/H+-exchanging protein
2232 :     //
2233 :     func: UPF0227 protein VC_1892
2234 :     prod: hypothetical protein
2235 :     //
2236 :     func: Lipoprotein releasing system ATP-binding protein lolD
2237 :     prod: lipoprotein releasing system ATP-binding protein LolD
2238 :     //
2239 :     func: Lipoprotein releasing system transmembrane protein lolE
2240 :     prod: lipoprotein releasing system transmembrane protein LolE
2241 :     //
2242 :     func: UPF0434 protein VC_1876
2243 :     prod: hypothetical protein
2244 :     //
2245 :     func: UPF0229 protein VC_1873
2246 :     prod: hypothetical protein
2247 :     //
2248 :     func: Peptidyl-prolyl cis-trans isomerase ppiB (EC 5.2.1.8)
2249 :     prod: peptidyl-prolyl cis-trans isomerase PpiB
2250 :     ecnu: 5.2.1.8
2251 :     //
2252 :     func: Crossover junction endodeoxyribonuclease ruvC (EC 3.1.22.4)
2253 :     prod: crossover junction endodeoxyribonuclease RuvC
2254 :     ecnu: 3.1.22.4
2255 :     //
2256 :     func: tolB protein precursor, periplasmic protein involved in the tonb-independent uptake of group A colicins
2257 :     prod: TolB protein precursor
2258 :     desc: periplasmic protein involved in the tonb-independent uptake of group A colicins
2259 :     //
2260 :     func: Surface presentation of antigens protein spaP
2261 :     prod: surface presentation of antigens protein SpaP
2262 :     //
2263 :     func: Protein yciN
2264 :     prod: protein YciN
2265 :     //
2266 :     func: Chaperone protein torD
2267 :     prod: chaperone protein TorD
2268 :     //
2269 :     func: Chromosome partition protein mukF
2270 :     prod: chromosome partition protein MukF
2271 :     //
2272 :     func: Chromosome partition protein mukE
2273 :     prod: chromosome partition protein MukE
2274 :     //
2275 :     func: Chromosome partition protein mukB
2276 :     prod: chromosome partition protein MukB
2277 :     //
2278 :     func: Probable zinc protease pqqL (EC 3.4.99.-)
2279 :     prod: hypothetical protein
2280 :     desc: probable zinc protease PqqL
2281 :     //
2282 :     func: Mu-like prophage protein gp16
2283 :     prod: phage protein
2284 :     desc: Mu-like prophage protein Gp16
2285 :     //
2286 :     func: Peptide transport system ATP-binding protein sapF (TC 3.A.1.5.5)
2287 :     prod: peptide transport system ATP-binding protein SapF
2288 :     note: TC 3.A.1.5.5
2289 :     //
2290 :     func: Peptide transport system ATP-binding protein sapD (TC 3.A.1.5.5)
2291 :     prod: peptide transport system ATP-binding protein SapD
2292 :     note: TC 3.A.1.5.5
2293 :     //
2294 :     func: Peptide transport system permease protein sapC (TC 3.A.1.5.5)
2295 :     prod: peptide transport system permease protein SapC
2296 :     note: TC 3.A.1.5.5
2297 :     //
2298 :     func: Peptide transport system permease protein sapB (TC 3.A.1.5.5)
2299 :     prod: peptide transport system permease protein SapB
2300 :     note: TC 3.A.1.5.5
2301 :     //
2302 :     func: Peptide transport periplasmic protein sapA (TC 3.A.1.5.5)
2303 :     prod: peptide transport periplasmic protein SapA
2304 :     note: TC 3.A.1.5.5
2305 :     //
2306 :     func: FOG: EAL domain protein
2307 :     prod: EAL domain protein
2308 :     //
2309 :     func: Na+ driven multidrug efflux pump
2310 :     prod: Na+ driven multidrug efflux pump
2311 :     //
2312 :     func: Na+/H+ antiporter NhaA type
2313 :     prod: Na+/H+ antiporter NhaA type
2314 :     //
2315 :     func: Diaminobutyrate-pyruvate transaminase & L-2,4-diaminobutyrate decarboxylase
2316 :     prod: diaminobutyrate-pyruvate transaminase/L-2,4-diaminobutyrate decarboxylase
2317 :     //
2318 :     func: COG1451: Predicted metal-dependent hydrolase
2319 :     prod: hypothetical protein
2320 :     desc: predicted metal-dependent hydrolase
2321 :     //
2322 :     func: Sensor kinase citA, dpiB (EC 2.7.3.-)
2323 :     prod: sensor kinase CitA
2324 :     //
2325 :     func: Transcriptional regulatory protein citB, dpiA
2326 :     prod: transcriptional regulatory protein CitB
2327 :     //
2328 :     func: Potential queD like
2329 :     prod: hypothetical protein
2330 :     desc: potential QueD like
2331 :     //
2332 :     func: Transcriptional regulator of alpha-acetolactate operon alsR
2333 :     prod: transcriptional regulator of alpha-acetolactate operon AlsR
2334 :     //
2335 :     func: LysR-family transcriptional regulator VC1561
2336 :     prod: LysR-family transcriptional regulator
2337 :     //
2338 :     func: SN-glycerol-3-phosphate transport ATP-binding protein ugpC (TC 3.A.1.1.3)
2339 :     prod: SN-glycerol-3-phosphate transport ATP-binding protein UgpC
2340 :     note: TC 3.A.1.1.3
2341 :     //
2342 :     func: SN-glycerol-3-phosphate transport system permease protein ugpE (TC 3.A.1.1.3)
2343 :     prod: SN-glycerol-3-phosphate transport system permease protein UgpE
2344 :     note: TC 3.A.1.1.3
2345 :     //
2346 :     func: SN-glycerol-3-phosphate transport system permease protein ugpA (TC 3.A.1.1.3)
2347 :     prod: SN-glycerol-3-phosphate transport system permease protein UgpA
2348 :     note: TC 3.A.1.1.3
2349 :     //
2350 :     func: Putative methyl-accepting chemotaxis protein VC1535
2351 :     prod: hypothetical protein
2352 :     desc: putative methyl-accepting chemotaxis protein
2353 :     //
2354 :     func: UPF0234 protein VC_1508
2355 :     prod: hypothetical protein
2356 :     //
2357 :     func: 23S rRNA (guanine-N-2-) -methyltransferase rlmL EC 2.1.1.-)
2358 :     prod: 23S rRNA (guanine-N-2-) -methyltransferase RlmL
2359 :     //
2360 :     func: Cytolysin-activating lysine-acyltransferase rtxC (EC 2.3.1.-)
2361 :     prod: cytolysin-activating lysine-acyltransferase RtxC
2362 :     //
2363 :     func: Putative analog of CcoH, COG3198
2364 :     prod: hypothetical protein
2365 :     desc: putative analog of CcoH
2366 :     //
2367 :     func: Spermidine Putrescine transport ATP-binding protein potA (TC_3.A.1.11.1)
2368 :     prod: spermidine putrescine transport ATP-binding protein PotA
2369 :     desc: TC_3.A.1.11.1
2370 :     //
2371 :     func: Spermidine Putrescine ABC transporter permease component potB (TC_3.A.1.11.1)
2372 :     prod: spermidine putrescine ABC transporter permease component PotB
2373 :     desc: TC_3.A.1.11.1
2374 :     //
2375 :     func: Spermidine Putrescine ABC transporter permease component potC (TC_3.A.1.11.1)
2376 :     prod: spermidine putrescine ABC transporter permease component PotC
2377 :     desc: TC_3.A.1.11.1
2378 :     //
2379 :     func: ABC transporter, periplasmic spermidine putrescine-binding protein potD (TC_3.A.1.11.1)
2380 :     prod: ABC transporter periplasmic spermidine putrescine-binding protein PotD
2381 :     desc: TC_3.A.1.11.1
2382 :     //
2383 :     func: Putrescine ABC transporter putrescine-binding protein potF (TC 3.A.1.11.2)
2384 :     prod: putrescine ABC transporter putrescine-binding protein PotF
2385 :     desc: TC_3.A.1.11.2
2386 :     //
2387 :     func: hcp protein
2388 :     prod: Hcp protein
2389 :     //
2390 :     func: Methyl-accepting chemotaxis protein II (mcp-II) (aspartate chemoreceptor protein)
2391 :     prod: methyl-accepting chemotaxis protein II
2392 :     //
2393 :     func: ATP-dependent RNA helicase VC1407
2394 :     prod: ATP-dependent RNA helicase
2395 :     //
2396 :     func: FOG: HEAT repeat
2397 :     prod: hypothetical protein
2398 :     //
2399 :     func: COG1092 family predicted tRNA methylase
2400 :     prod: hypothetical protein
2401 :     desc: predicted tRNA methylase
2402 :     //
2403 :     func: FOG: CheY-like receiver
2404 :     prod: hypothetical protein
2405 :     //
2406 :     func: probable lipoprotein YPO2292
2407 :     prod: hypothetical protein
2408 :     //
2409 :     func: putative virK protein
2410 :     prod: hypothetical protein
2411 :     desc: putative VirK protein
2412 :     //
2413 :     func: BarA-associated response regulator UvrY (= GacA = SirA)
2414 :     prod: BarA-associated response regulator UvrY
2415 :     //
2416 :     func: FIG002708: Protein sirB1
2417 :     prod: protein SirB1
2418 :     //
2419 :     func: FIG002082: Protein sirB2
2420 :     prod: protein SirB2
2421 :     //
2422 :     func: BarA sensory histidine kinase (= VarS = GacS)
2423 :     prod: BarA sensory histidine kinase
2424 :     //
2425 :     func: FOG: EAL domain
2426 :     prod: EAL domain protein
2427 :     //
2428 :     func: Transport ATP-binding protein cydD
2429 :     prod: transport ATP-binding protein CydD
2430 :     //
2431 :     func: Transport ATP-binding protein cydC
2432 :     prod: transport ATP-binding protein CydC
2433 :     //
2434 :     func: Ribosomal large subunit pseudouridine synthase B (EC 5.4.99.-) (rRNA-uridine isomerase B) (rRNA pseudouridylate synthase B)
2435 :     prod: LSU pseudouridine synthase B
2436 :     //
2437 :     func: COG0613, Predicted metal-dependent phosphoesterases (PHP family)
2438 :     prod: hypothetical protein
2439 :     desc: predicted metal-dependent phosphoesterases (PHP family)
2440 :     //
2441 :     func: COG1801: Uncharacterized conserved protein
2442 :     prod: hypothetical protein
2443 :     //
2444 :     func: ATP-dependent Clp protease ATP-binding subunit clpA
2445 :     prod: ATP-dependent Clp protease ATP-binding subunit ClpA
2446 :     //
2447 :     func: ATP-dependent Clp protease adaptor protein clpS
2448 :     prod: ATP-dependent Clp protease adaptor protein ClpS
2449 :     //
2450 :     func: UPF0274 protein VC_1127
2451 :     prod: hypothetical protein
2452 :     //
2453 :     func: Probable protease htpX homolog (EC 3.4.24.-)
2454 :     prod: hypothetical protein
2455 :     desc: probable protease HtpX homolog
2456 :     //
2457 :     func: Oligopeptide transport ATP-binding protein oppF (TC 3.A.1.5.1)
2458 :     prod: oligopeptide transport ATP-binding protein OppF
2459 :     note: TC 3.A.1.5.1
2460 :     //
2461 :     func: Oligopeptide transport ATP-binding protein oppD (TC 3.A.1.5.1)
2462 :     prod: oligopeptide transport ATP-binding protein OppD
2463 :     note: TC 3.A.1.5.1
2464 :     //
2465 :     func: Oligopeptide transport system permease protein oppC (TC 3.A.1.5.1)
2466 :     prod: oligopeptide transport system permease protein OppC
2467 :     note: TC 3.A.1.5.1
2468 :     //
2469 :     func: Oligopeptide transport system permease protein oppB (TC 3.A.1.5.1)
2470 :     prod: oligopeptide transport system permease protein OppB
2471 :     note: TC 3.A.1.5.1
2472 :     //
2473 :     func: Oligopeptide ABC transporter, periplasmic oligopeptide-binding protein oppA (TC 3.A.1.5.1)
2474 :     prod: oligopeptide ABC transporter periplasmic oligopeptide-binding protein OppA
2475 :     note: TC 3.A.1.5.1
2476 :     //
2477 :     func: Phosphonate ABC transporter phosphate-binding periplasmic component (TC 3.A.1.9.1)
2478 :     prod: phosphonate ABC transporter phosphate-binding periplasmic component
2479 :     note: TC 3.A.1.9.1
2480 :     //
2481 :     func: FOG: GGDEF domain
2482 :     prod: GGDEF domain protein
2483 :     //
2484 :     func: UPF0052 protein VC_1023
2485 :     prod: hypothetical protein
2486 :     //
2487 :     func: Phosphorelay protein luxU
2488 :     prod: phosphorelay protein LuxU
2489 :     //
2490 :     func: Regulatory protein luxO
2491 :     prod: regulatory protein LuxO
2492 :     //
2493 :     func: Electron transport complex protein rnfA
2494 :     prod: electron transport complex protein RnfA
2495 :     //
2496 :     func: Electron transport complex protein rnfB
2497 :     prod: electron transport complex protein RnfB
2498 :     //
2499 :     func: Electron transport complex protein rnfC
2500 :     prod: electron transport complex protein RnfC
2501 :     //
2502 :     func: Electron transport complex protein rnfD
2503 :     prod: electron transport complex protein RnfD
2504 :     //
2505 :     func: Electron transport complex protein rnfG
2506 :     prod: electron transport complex protein RnfG
2507 :     //
2508 :     func: Electron transport complex protein rnfE
2509 :     prod: electron transport complex protein RnfE
2510 :     //
2511 :     func: Sodium-type flagellar protein motY precursor
2512 :     prod: sodium-type flagellar protein MotY precursor
2513 :     //
2514 :     func: Phosphodiesterase yfcE (EC 3.1.4.-)
2515 :     prod: phosphodiesterase YfcE
2516 :     //
2517 :     func: COG3118: Thioredoxin domain-containing protein
2518 :     prod: thioredoxin domain-containing protein
2519 :     //
2520 :     func: HTH-type transcriptional regulator cueR
2521 :     prod: HTH-type transcriptional regulator CueR
2522 :     //
2523 :     func: Cell division protein zipA
2524 :     prod: cell division protein ZipA
2525 :     //
2526 :     func: Magnesium and cobalt efflux protein corC
2527 :     prod: magnesium and cobalt efflux protein CorC
2528 :     //
2529 :     func: LPS-assembly lipoprotein rlpB precursor (Rare lipoprotein B)
2530 :     prod: LPS-assembly lipoprotein RlpB precursor
2531 :     //
2532 :     func: COG0799: Uncharacterized homolog of plant Iojap protein
2533 :     prod: hypothetical protein
2534 :     desc: uncharacterized homolog of plant Iojap protein
2535 :     //
2536 :     func: COG1576: Uncharacterized conserved protein ## ybeA
2537 :     prod: hypothetical protein
2538 :     //
2539 :     func: Rod shape-determining protein rodA
2540 :     prod: rod shape-determining protein RodA
2541 :     //
2542 :     func: UPF0250 protein VC_0945
2543 :     prod: hypothetical protein
2544 :     //
2545 :     func: Capsular polysaccharide synthesis enzyme cpsD, exopolysaccharide synthesis
2546 :     prod: Capsular polysaccharide synthesis enzyme CpsD exopolysaccharide synthesis
2547 :     //
2548 :     func: Capsular polysaccharide synthesis enzyme cpsC, polysaccharide export
2549 :     prod: Capsular polysaccharide synthesis enzyme CpsC polysaccharide export
2550 :     //
2551 :     func: Capsular polysaccharide synthesis enzyme cpsB
2552 :     prod: Capsular polysaccharide synthesis enzyme CpsB
2553 :     //
2554 :     func: Capsular polysaccharide synthesis enzyme cpsA, sugar transferase
2555 :     prod: Capsular polysaccharide synthesis enzyme CpsA sugar transferase
2556 :     //
2557 :     func: Zn-ribbon-containing, possibly nucleic-acid-binding protein
2558 :     prod: Zn-ribbon-containing, possibly nucleic-acid-binding protein
2559 :     //
2560 :     func: COG2363
2561 :     prod: hypothetical protein
2562 :     //
2563 :     func: Thiamine biosynthesis protein thiI
2564 :     prod: thiamine biosynthesis protein ThiI
2565 :     //
2566 :     func: Flagellar motor rotation protein motB
2567 :     prod: Flagellar motor rotation protein MotB
2568 :     //
2569 :     func: Flagellar motor rotation protein motA
2570 :     prod: Flagellar motor rotation protein MotA
2571 :     //
2572 :     func: UPF0178 protein VC_0881
2573 :     prod: hypothetical protein
2574 :     //
2575 :     func: 50S ribosomal protein L36 2
2576 :     prod: LSU ribosomal protein L36p
2577 :     //
2578 :     func: COG1720: Uncharacterized conserved protein
2579 :     prod: hypothetical protein
2580 :     //
2581 :     func: UPF0253 protein VC_0872
2582 :     prod: hypothetical protein
2583 :     //
2584 :     func: relE protein
2585 :     prod: RelE protein
2586 :     //
2587 :     func: Na(+)Citrate OH(-) antiporter
2588 :     prod: Na(+)Citrate OH(-) antiporter
2589 :     //
2590 :     func: Cytoplasmic copper homeostasis protein cutC
2591 :     prod: cytoplasmic copper homeostasis protein CutC
2592 :     //
2593 :     func: Phosphate ABC transporter, periplasmic phosphate-binding protein pstS (TC 3.A.1.7.1)
2594 :     prod: phosphate ABC transporter, periplasmic phosphate-binding protein PstS
2595 :     desc: TC 3.A.1.7.1
2596 :     //
2597 :     func: Phosphate regulon sensor protein phoR (EC 2.7.3.-)
2598 :     prod: phosphate regulon sensor protein phoR
2599 :     //
2600 :     func: Phosphate regulon transcriptional regulatory protein phoB
2601 :     prod: phosphate regulon transcriptional regulatory protein PhoB
2602 :     //
2603 :     func: Uncharacterized protein with LysM domain, COG1652
2604 :     prod: LysM domain-containing protein
2605 :     //
2606 :     func: Trk system potassium uptake protein trkA
2607 :     prod: Trk system potassium uptake protein TrkA
2608 :     //
2609 :     func: COG1272: Predicted membrane protein hemolysin III homolog
2610 :     prod: hypothetical protein
2611 :     desc: predicted membrane protein hemolysin III homolog
2612 :     //
2613 :     func: Protein yihD
2614 :     prod: protein YihD
2615 :     //
2616 :     func: 16 kDa heat shock protein A
2617 :     prod: heat shock protein A
2618 :     //
2619 :     func: tRNA uridine 5-carboxymethylaminomethyl modification enzyme gidA
2620 :     prod: tRNA uridine 5-carboxymethylaminomethyl modification enzyme GidA
2621 :     //
2622 :     func: hypothetical conserved protein COG1739
2623 :     prod: hypothetical protein
2624 :     //
2625 :     func: Na+/H+ antiporter, putative
2626 :     prod: hypothetical protein
2627 :     desc: Na+/H+ antiporter, putative
2628 :     //
2629 :     func: Rod shape-determining protein mreB
2630 :     prod: rod shape-determining protein MreB
2631 :     //
2632 :     func: Rod shape-determining protein mreC
2633 :     prod: rod shape-determining protein MreC
2634 :     //
2635 :     func: Rod shape-determining protein mreD
2636 :     prod: rod shape-determining protein MreD
2637 :     //
2638 :     func: NADH oxidoreductase hcr (EC 1.-.-.-)
2639 :     prod: NADH oxidoreductase Hcr
2640 :     //
2641 :     func: COG0536: GTP-binding protein Obg
2642 :     prod: GTP-binding protein Obg
2643 :     //
2644 :     func: Survival protein surA precursor (Peptidyl-prolyl cis-trans isomerase surA) (EC 5.2.1.8)
2645 :     prod: peptidyl-prolyl cis-trans isomerase SurA
2646 :     ecnu: 5.2.1.8
2647 :     //
2648 :     func: Outer membrane protein Imp, required for envelope biogenesis
2649 :     prod: Imp required for envelope biogenesis
2650 :     //
2651 :     func: Organic solvent tolerance protein precursor
2652 :     prod: organic solvent tolerance protein precursor
2653 :     //
2654 :     func: UPF0269 protein yggX
2655 :     prod: hypothetical protein
2656 :     //
2657 :     func: UPF0235 protein VC0458
2658 :     prod: hypothetical protein
2659 :     //
2660 :     func: UPF0301 protein yqgE
2661 :     prod: hypothetical protein
2662 :     //
2663 :     func: Protein sprT
2664 :     prod: protein SprT
2665 :     //
2666 :     func: Iron-regulated virulence regulatory protein irgB
2667 :     prod: iron-regulated virulence regulatory protein IrgB
2668 :     //
2669 :     func: Endopeptidase essential in most Bacteria (E. coli YgjD/B. subtilis YdiE)
2670 :     prod: endopeptidase
2671 :     //
2672 :     func: Cell division protein ftsB
2673 :     prod: cell division protein FtsB
2674 :     //
2675 :     func: 5'-nucleotidase surE (EC 3.1.3.5)
2676 :     prod: 5'-nucleotidase SurE
2677 :     ecnu: 3.1.3.5
2678 :     //
2679 :     func: Sulfate and thiosulfate binding protein cysP
2680 :     prod: sulfate and thiosulfate binding protein CysP
2681 :     //
2682 :     func: Sulfate transport system permease protein cysT
2683 :     prod: sulfate transport system permease protein CysT
2684 :     //
2685 :     func: Sulfate transport system permease protein cysW
2686 :     prod: sulfate transport system permease protein CysW
2687 :     //
2688 :     func: Sulfate and thiosulfate import ATP-binding protein cysA (EC 3.6.3.25)
2689 :     prod: sulfate and thiosulfate import ATP-binding protein CysA
2690 :     ecnu: 3.6.3.25
2691 :     //
2692 :     func: Regulatory protein recX
2693 :     prod: regulatory protein RecX
2694 :     //
2695 :     func: COG3105: Uncharacterized protein conserved in bacteria
2696 :     prod: hypothetical protein
2697 :     //
2698 :     func: C4-type zinc finger protein, DksA/TraR family
2699 :     prod: C4-type zinc finger protein, DksA/TraR family
2700 :     //
2701 :     func: Cell division protein ftsJ
2702 :     prod: cell division protein FtsJ
2703 :     //
2704 :     func: Ribosomal RNA large subunit methyltransferase J (EC 2.1.1.-)
2705 :     prod: ribosomal RNA large subunit methyltransferase J
2706 :     //
2707 :     func: Cell division protein ftsH (EC 3.4.24.-)
2708 :     prod: cell division protein FtsH
2709 :     //
2710 :     func: COG0779: clustered with transcription termination protein NusA
2711 :     prod: clustered with transcription termination protein NusA
2712 :     //
2713 :     func: COG4123: Predicted O-methyltransferase
2714 :     prod: predicted O-methyltransferase
2715 :     //
2716 :     func: Protein of unknown function DUF81
2717 :     prod: hypothetical protein
2718 :     //
2719 :     func: FKBP-type peptidyl-prolyl cis-trans isomerase slpA (EC 5.2.1.8)
2720 :     prod: FKBP-type peptidyl-prolyl cis-trans isomerase SlpA
2721 :     ecnu: 5.2.1.8
2722 :     //
2723 :     func: Beta N-acetyl-glucosaminidase( EC 3.2.1.52 )
2724 :     prod: beta N-acetyl-glucosaminidase
2725 :     ecnu: 3.2.1.52
2726 :     //
2727 :     func: C-di-GMP phosphodiesterase MbaA, repressor of biofilm formation
2728 :     prod: C-di-GMP phosphodiesterase MbaA repressor of biofilm formation
2729 :     //
2730 :     func: COG1496: Uncharacterized conserved protein
2731 :     prod: hypothetical protein
2732 :     //
2733 :     func: Virulence factor mviN homolog
2734 :     prod: hypothetical protein
2735 :     desc: virulence factor MviN homolog
2736 :     //
2737 :     func: Uncharacterized conserved protein
2738 :     prod: hypothetical protein
2739 :     //
2740 :     func: UPF0260 protein BMEI0534
2741 :     prod: hypothetical protein
2742 :     //
2743 :     func: UPF0181 protein VC_A0569
2744 :     prod: hypothetical protein
2745 :     //
2746 :     func: UPF0067 protein yebR
2747 :     prod: hypothetical protein
2748 :     //
2749 :     func: UPF0131 protein VC_2546
2750 :     prod: hypothetical protein
2751 :     //
2752 :     func: UPF0114 protein VC_0208
2753 :     prod: hypothetical protein
2754 :     //
2755 :     func: UPF0125 protein yfjF
2756 :     prod: hypothetical protein
2757 :     //
2758 :     func: UPF0274 protein ycfC
2759 :     prod: hypothetical protein
2760 :     //
2761 :     func: UPF0263 protein VC1208
2762 :     prod: hypothetical protein
2763 :     //
2764 :     func: ISSod13, transposase
2765 :     prod: ISSod13 transposase
2766 :     //
2767 :     func: iSSod13, transposase
2768 :     prod: ISSod13 transposase
2769 :     //
2770 :     func: Zn-dependent protease with chaperone function
2771 :     prod: Zn-dependent protease with chaperone function
2772 :     //
2773 :     func: Oligopeptide transport system permease protein oppC (TC 3.A.1.5.1)
2774 :     prod: oligopeptide transport system permease protein OppC
2775 :     note: TC 3.A.1.5.1
2776 :     //
2777 :     func: Oligopeptide transport system permease protein oppB (TC 3.A.1.5.1)
2778 :     prod: oligopeptide transport system permease protein OppB
2779 :     note: TC 3.A.1.5.1
2780 :     //
2781 :     func: ISSod2, transposase OrfB
2782 :     prod: ISSod2 transposase OrfB
2783 :     //
2784 :     func: ISSod2, transposase OrfA
2785 :     prod: ISSod2 transposase OrfA
2786 :     //
2787 :     func: Putative uncharacterized protein VC_A0360
2788 :     prod: hypothetical protein
2789 :     //
2790 :     func: Mll3428 protein
2791 :     prod: hypothetical protein
2792 :     //
2793 :     func: Cytochrome B561
2794 :     prod: cytochrome b561
2795 :     //
2796 :     func: Iron(III) dicitrate transport system permease protein fecD (TC 3.A.1.14.1)
2797 :     prod: iron(III) dicitrate transport system permease protein FecD
2798 :     note: TC 3.A.1.14.1
2799 :     //
2800 :     func: Na+/H+ antiporter
2801 :     prod: Na+/H+ antiporter
2802 :     //
2803 :     func: Na(+) H(+) antiporter subunit A; Na(+) H(+) antiporter subunit B
2804 :     prod: Na(+) H(+) antiporter subunit A/Na(+) H(+) antiporter subunit B
2805 :     //
2806 :     func: Na(+) H(+) antiporter subunit A
2807 :     prod: Na(+) H(+) antiporter subunit A
2808 :     //
2809 :     func: Na(+) H(+) antiporter subunit B
2810 :     prod: Na(+) H(+) antiporter subunit B
2811 :     //
2812 :     func: Na(+) H(+) antiporter subunit C
2813 :     prod: Na(+) H(+) antiporter subunit C
2814 :     //
2815 :     func: Na(+) H(+) antiporter subunit D
2816 :     prod: Na(+) H(+) antiporter subunit D
2817 :     //
2818 :     func: Na(+) H(+) antiporter subunit E
2819 :     prod: Na(+) H(+) antiporter subunit E
2820 :     //
2821 :     func: Na(+) H(+) antiporter subunit F
2822 :     prod: Na(+) H(+) antiporter subunit F
2823 :     //
2824 :     func: Na(+) H(+) antiporter subunit G
2825 :     prod: Na(+) H(+) antiporter subunit G
2826 :     //
2827 :     func: Ribosyl nicotinamide transporter, pnuC-like
2828 :     prod: ribosyl nicotinamide transporter PnuC-like protein
2829 :     //
2830 :     func: COG1683: Uncharacterized conserved protein / Hypothetical protein ybgA
2831 :     prod: hypothetical protein
2832 :     //
2833 :     func: Dipeptide transport system permease protein dppC (TC 3.A.1.5.2)
2834 :     prod: dipeptide transport system permease protein DppC
2835 :     note: TC 3.A.1.5.2
2836 :     //
2837 :     func: Oligopeptide ABC transporter, periplasmic oligopeptide-binding protein oppA (TC 3.A.1.5.1)
2838 :     prod: oligopeptide ABC transporter periplasmic oligopeptide-binding protein OppA
2839 :     note: TC 3.A.1.5.1
2840 :     //
2841 :     func: Metallo-beta-lactamase superfamily protein PA0057
2842 :     prod: metallo-beta-lactamase superfamily protein
2843 :     //
2844 :     func: N-Acetyl-D-glucosamine ABC transport system, sugar-binding protein
2845 :     prod: N-Acetyl-D-glucosamine ABC transport system sugar-binding protein
2846 :     //
2847 :     func: Thioredoxin-like protein clustered with PA0057
2848 :     prod: hypothetical protein
2849 :     desc: thioredoxin-like protein
2850 :     //
2851 :     func: Metallo-beta-lactamase superfamily protein PA0057
2852 :     prod: metallo-beta-lactamase superfamily protein
2853 :     //
2854 :     func: COG1559 protein yceG like
2855 :     prod: hypothetical protein
2856 :     desc: protein yceG like
2857 :     //
2858 :     func: Na(+)-translocating NADH-quinone reductase subunit F (EC 1.6.5.-)
2859 :     prod: Na(+)-translocating NADH-quinone reductase subunit F
2860 :     //
2861 :     func: Na(+)-translocating NADH-quinone reductase subunit E (EC 1.6.5.-)
2862 :     prod: Na(+)-translocating NADH-quinone reductase subunit E
2863 :     //
2864 :     func: Na(+)-translocating NADH-quinone reductase subunit D (EC 1.6.5.-)
2865 :     prod: Na(+)-translocating NADH-quinone reductase subunit D
2866 :     //
2867 :     func: Na(+)-translocating NADH-quinone reductase subunit C (EC 1.6.5.-)
2868 :     prod: Na(+)-translocating NADH-quinone reductase subunit C
2869 :     //
2870 :     func: Na(+)-translocating NADH-quinone reductase subunit B (EC 1.6.5.-)
2871 :     prod: Na(+)-translocating NADH-quinone reductase subunit B
2872 :     //
2873 :     func: Na(+)-translocating NADH-quinone reductase subunit A (EC 1.6.5.-)
2874 :     prod: Na(+)-translocating NADH-quinone reductase subunit A
2875 :     //
2876 :     func: Peptidyl-prolyl cis-trans isomerase ppiA precursor (EC 5.2.1.8)
2877 :     prod: peptidyl-prolyl cis-trans isomerase PpiA precursor
2878 :     ecnu: 5.2.1.8
2879 :     //
2880 :     func: NADPH-dependent glutamate synthase, large subunit
2881 :     prod: NADPH-dependent glutamate synthase large subunit
2882 :     //
2883 :     func: S-adenosyl-methyltransferase mraW (EC 2.1.1.-)
2884 :     prod: S-adenosyl-methyltransferase MraW
2885 :     //
2886 :     func: Single-stranded-DNA-specific exonuclease recJ (EC 3.1.-.-)
2887 :     prod: single-stranded-DNA-specific exonuclease RecJ
2888 :     //
2889 :     func: Hypothetical UPF0243 zinc-binding protein VP2529
2890 :     prod: hypothetical protein
2891 :     desc: hypothetical zinc-binding protein
2892 :     //
2893 :     func: Hypothetical ATP-binding protein UPF0042, contains P-loop # frameshift
2894 :     prod: hypothetical protein
2895 :     note: hypothetical ATP-binding protein, contains P-loop
2896 :     //
2897 :     func: MiaB-like tRNA modifying enzyme YliG, TIGR01125
2898 :     prod: MiaB-like tRNA modifying enzyme YliG
2899 :     //
2900 :     func: LysR-family transcriptional regulator clustered with PA0057
2901 :     prod: LysR-family transcriptional regulator
2902 :     //
2903 :     func: P pilus assembly/Cpx signaling pathway, periplasmic inhibitor/zinc-resistance associated protein
2904 :     prod: P pilus assembly/Cpx signaling pathway inhibitor/zinc-resistance associated protein
2905 :     //
2906 :     func: Hypothetical lysR-family transcriptional regulator YdhB
2907 :     prod: hypothetical protein
2908 :     //
2909 :     func: MG(2+) CHELATASE FAMILY PROTEIN
2910 :     prod: Mg(2+) chelatase family protein
2911 :     //
2912 :     func: Tyrosine recombinase xerC
2913 :     prod: tyrosine recombinase XerC
2914 :     //
2915 :     func: Cell division transporter, ATP-binding protein ftsE (TC 3.A.5.1.1)
2916 :     prod: cell division transporter ATP-binding protein FtsE
2917 :     note: TC 3.A.5.1.1
2918 :     //
2919 :     func: Cell division protein ftsX
2920 :     prod: cell division protein FtsX
2921 :     //
2922 :     func: Protein of unknown function DUF541
2923 :     prod: hypothetical protein
2924 :     //
2925 :     func: Tetrapyrrole (Corrin-Porphyrin) methylase family protein UPF0011
2926 :     prod: tetrapyrrole (Corrin-Porphyrin) methylase family protein
2927 :     //
2928 :     func: COG1132
2929 :     prod: hypothetical protein
2930 :     //
2931 :     func: RloF
2932 :     prod: RloF protein
2933 :     //
2934 :     func: COG1576: Uncharacterized conserved protein ## ybeA
2935 :     prod: hypothetical protein
2936 :     //
2937 :     func: Na+/H+ antiporter family protein
2938 :     prod: Na+/H+ antiporter family protein
2939 :     //
2940 :     func: Hypothetical protein DUF454
2941 :     prod: hypothetical protein
2942 :     //
2943 :     func: YciO family
2944 :     prod: YciO family protein
2945 :     //
2946 :     func: VirK
2947 :     prod: VirK protein
2948 :     //
2949 :     func: orf 104
2950 :     prod: hypothetical protein
2951 :     //
2952 :     func: ABC-type amino acid transport, signal transduction systems, periplasmic component/domain
2953 :     prod: ABC-type amino acid transport system periplasmatic component
2954 :     //
2955 :     func: Outer membrane protein ImpK/VasF, OmpA/MotB domain
2956 :     prod: ImpK/VasF outer membrane protein
2957 :     //
2958 :     func: Phosphotransferase system mannitol/fructose-specific IIA domain
2959 :     prod: phosphotransferase system mannitol/fructose-specific IIA domain protein
2960 :     //
2961 :     func: Fructosamine kinase family protein, At3g61080 homolog
2962 :     prod: fructosamine kinase family protein
2963 :     //
2964 :     func: Starvation lipoprotein Slp paralog
2965 :     prod: starvation lipoprotein Slp like protein
2966 :     //
2967 :     func: Transcriptional regulator, VCA0231 ortholog
2968 :     prod: AraC-type DNA-binding domain-containing protein
2969 :     //
2970 :     func: Translation elongation factor G paralog
2971 :     prod: translation elongation factor G-like protein
2972 :     //
2973 :     func: Dihydrolipoamide acetyltransferase component of pyruvate dehydrogenase complex (EC 2.3.1.12)
2974 :     prod: dihydrolipoamide acetyltransferase component of pyruvate dehydrogenase complex
2975 :     ecnu: 2.3.1.12
2976 :     //
2977 :     func: Dihydrolipoamide succinyltransferase component (E2) of 2-oxoglutarate dehydrogenase complex (EC 2.3.1.61)
2978 :     prod: dihydrolipoamide succinyltransferase component (E2) of 2-oxoglutarate dehydrogenase complex
2979 :     ecnu: 2.3.1.61
2980 :     //
2981 :     func: Acylphosphate phosphohydrolase (EC 3.6.1.7), putative
2982 :     prod: acylphosphate phosphohydrolase
2983 :     ecnu: 3.6.1.7
2984 :     //
2985 :     func: Iron-containing alcohol dehydrogenase (EC 1.1.1.1)
2986 :     prod: iron-containing alcohol dehydrogenase
2987 :     ecnu: 1.1.1.1
2988 :     //
2989 :     func: ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
2990 :     prod: ABC-type transport system periplasmic component
2991 :     //
2992 :     func: cAMP-binding proteins - catabolite gene activator and regulatory subunit of cAMP-dependent protein kinases
2993 :     prod: cAMP-binding protein
2994 :     note: catabolite gene activator and regulatory subunit of cAMP-dependent protein kinases
2995 :     //
2996 :     func: GGDEF and EAL domain proteins
2997 :     prod: GGDEF and EAL domain-containing protein
2998 :     //
2999 :     func: NAD(FAD)-utilizing dehydrogenases
3000 :     prod: NAD(FAD)-utilizing dehydrogenase
3001 :     //
3002 :     func: RTX toxins and related Ca2+-binding proteins
3003 :     prod: Ca2+-binding protein
3004 :     note: putative RTX toxin
3005 :     //
3006 :     func: SAM-dependent methyltransferases
3007 :     prod: SAM-dependent methyltransferase
3008 :     //
3009 :     func: ATP-dependent RNA helicase VCA0768
3010 :     prod: ATP-dependent RNA helicase
3011 :     //
3012 :     func: Fe-S protein, homolog of lactate dehydrogenase SO1521
3013 :     prod: Fe-S oxidoreductase
3014 :     note: similar to lactate dehydrogenase SO1521
3015 :     //
3016 :     func: Metallo-beta-lactamase superfamily protein PA0057
3017 :     prod: metallo-beta-lactamase family protein
3018 :     note: similar to PA00057
3019 :     //
3020 :     func: Ycg4D
3021 :     prod: hypothetical protein
3022 :     //
3023 :     func: 4-Hydroxy-2-oxoglutarate aldolase (EC 4.1.3.16)
3024 :     prod: 4-hydroxy-2-oxoglutarate aldolase
3025 :     ecnu: 4.1.3.16
3026 :     //
3027 :     func: 2-dehydro-3-deoxyphosphogluconate aldolase (EC 4.1.2.14)
3028 :     prod: 2-dehydro-3-deoxyphosphogluconate aldolase
3029 :     ecnu: 4.1.2.14
3030 :     //
3031 :     func: Biotin synthesis protein bioH
3032 :     prod: biotin synthesis protein BioH
3033 :     //
3034 :     func: Biotin synthesis protein bioC
3035 :     prod: biotin synthesis protein BioC
3036 :     //
3037 :     func: Cob(I)alamin adenosyltransferase (EC 2.5.1.17)
3038 :     prod: cob(I)alamin adenosyltransferase
3039 :     ecnu: 2.5.1.17
3040 :     //
3041 :     func: L-rhamnose operon transcriptional activator rhaR
3042 :     prod: L-rhamnose operon transcriptional activator RhaR
3043 :     //
3044 :     func: Amide synthase component of siderophore synthetase # Vibriobactin-specific, VibH
3045 :     prod: amide synthase component of siderophore synthetase
3046 :     desc: vibriobactin-specific, VibH
3047 :     //
3048 :     func: Phosphopantetheinyl transferase component of siderophore synthetase (EC 2.7.8.-) # Vibriobactin-specific, VibD
3049 :     prod: phosphopantetheinyl transferase component of siderophore synthetase
3050 :     desc: vibriobactin-specific, VibD
3051 :     //
3052 :     func: Toxin co-regulated pilus biosynthesis protein T, putative ATP-binding translocase of TcpA
3053 :     prod: toxin co-regulated pilus biosynthesis protein T
3054 :     desc: putative ATP-binding translocase of TcpA
3055 :     //
3056 :     func: Toxin co-regulated pilus biosynthesis protein F, putative outer membrane channel for TcpA extrusion
3057 :     prod: toxin co-regulated pilus biosynthesis protein F
3058 :     desc: putative outer membrane channel for TcpA extrusion
3059 :     //
3060 :     func: TCP pilus virulence regulatory protein toxT, transcription activator, AraC family
3061 :     prod: TCP pilus virulence regulatory protein ToxT transcription activator AraC family
3062 :     //
3063 :     func: TCP pilin signal peptidase, TcpA processing
3064 :     prod: TCP pilin signal peptidase TcpA processing
3065 :     //
3066 :     func: Rare lipoprotein A precursor
3067 :     prod: rare lipoprotein A precursor
3068 :     //
3069 :     func: N-acetylglucosamine-6P-responsive transcriptional repressor NagC, ROK family
3070 :     prod: N-acetylglucosamine-6P-responsive transcriptional repressor NagC ROK family
3071 :     //
3072 :     func: RstA
3073 :     prod: RstA phage-related replication protein
3074 :     //
3075 :     func: transcriptional repressor RstR
3076 :     prod: RstR phage-related transcriptional repressor
3077 :     //
3078 :     func: S-adenosylmethionine-dependent methyltransferase Functionally Coupled to the MukBEF Chromosome Partitioning Mechanism
3079 :     prod: S-adenosylmethionine-dependent methyltransferase functionally coupled to the MukBEF chromosome partitioning mechanism
3080 :     //
3081 :     func: Membrane Protein Functionally coupled to the MukBEF Chromosome Partitioning Mechanism
3082 :     prod: membrane protein functionally coupled to the MukBEF chromosome partitioning mechanism
3083 :     //
3084 :     func: PvcA protein, related to known isonitrile synthases
3085 :     prod: PvcA protein
3086 :     //
3087 :     func: PvcB protein, related to amino acid oxidizing enzymes
3088 :     prod: PvcB protein
3089 :     //
3090 :     func: Cholera enterotoxin subunit B precursor (Cholera enterotoxin B chain) (Cholera enterotoxin gamma chain) (Choleragenoid)
3091 :     prod: Enterotoxin subunit B
3092 :     //
3093 :     func: protein of unknown function
3094 :     prod: hypothetical protein
3095 :     //
3096 :     func: Protein of unknown function Smg
3097 :     prod: hypothetical protein
3098 :     //
3099 :     func: orf30
3100 :     prod: hypothetical protein
3101 :     //
3102 :     func: orf29
3103 :     prod: hypothetical protein
3104 :     //
3105 :     func: orf4
3106 :     prod: hypothetical protein
3107 :     //
3108 :     func: FIG018583: protein of unknown function
3109 :     prod: hypothetical protein
3110 :     //
3111 :     func: Cryptic phage CTXphi transcriptional repressor rstR
3112 :     prod: cryptic phage CTXphi transcriptional repressor RstR
3113 :     //
3114 :     func: Outer membrane chaperone Skp (OmpH) precursor @ Outer membrane protein H precursor
3115 :     prod: outer membrane chaperone Skp (OmpH) precursor
3116 :     //
3117 :     func: AAA ATPase, central region
3118 :     prod: AAA ATPase central region
3119 :     //
3120 :     func: Wzy
3121 :     prod: Wzy protein
3122 :     //
3123 :     func: 50S ribosomal protein L33
3124 :     prod: LSU ribosomal protein L33p
3125 :     //
3126 :     func: Ribosomal protein S12p Asp88 (E. coli) methylthiotransferase
3127 :     prod: ribosomal protein S12p Asp88 methylthiotransferase
3128 :     //
3129 :     func: WavQ
3130 :     prod: WavQ protein
3131 :     //
3132 :     func: NT01VC2352
3133 :     prod: hypothetical protein
3134 :     //
3135 :     func: COG1301: Na+/H+-dicarboxylate symporters
3136 :     prod: Na+/H+-dicarboxylate symporter
3137 :     //
3138 :     func: TorCAD operon transcriptional regulatory protein torR
3139 :     prod: TorCAD operon transcriptional regulatory protein TorR
3140 :     //
3141 :     func: protein of unknown function DUF847
3142 :     prod: hypothetical protein
3143 :     //
3144 :     func: Membrane protein, distant similarity to thiosulphate:quinone oxidoreductase DoxD
3145 :     prod: membrane protein, similar to thiosulphate:quinone oxidoreductase DoxD
3146 :     //
3147 :     func: Similarities with Photorhabdus cytotoxin
3148 :     prod: cytotoxin-like protein
3149 :     //
3150 :     func: Proline/sodium symporter PutP (TC 2.A.21.2.1) @ Propionate/sodium symporter
3151 :     prod: proline/sodium symporter PutP
3152 :     note: TC 2.A.21.2.1
3153 :     //
3154 :     func: Chain A, Crystal Structure Of Protein Vc1899 From Vibrio Cholerae
3155 :     prod: hypothetical protein
3156 :     //
3157 :     func: haemagglutinin associated protein
3158 :     prod: hemagglutinin associated protein
3159 :     //
3160 :     func: TPR repeat
3161 :     prod: TPR repeat-containing protein
3162 :     //
3163 :     func: COG0610: Type I site-specific restriction-modification system, R (restriction) subunit and related helicases
3164 :     prod: type I site-specific restriction-modification system R (restriction) subunit
3165 :     //
3166 :     func: COG2369: Uncharacterized protein, homolog of phage Mu protein gp30
3167 :     prod: phage protein
3168 :     //
3169 :     func: Ribonuclease HI, Vibrio paralog
3170 :     prod: ribonuclease HI
3171 :     //
3172 :     func: COG1961: Site-specific recombinases, DNA invertase Pin homologs
3173 :     prod: site-specific recombinase
3174 :     //
3175 :     func: COG1434: Uncharacterized conserved protein
3176 :     prod: hypothetical protein
3177 :     //
3178 :     func: Trp operon repressor homolog
3179 :     prod: Trp operon repressor-like protein
3180 :     //
3181 :     func: Hypothetical protein YqcC (clustered with tRNA pseudouridine synthase C)
3182 :     prod: hypothetical protein
3183 :     //
3184 :     func: Sua5 YciO YrdC YwlC family protein
3185 :     prod: YrdC family protein
3186 :     //
3187 :     func: FIG000859 (not subsystem-based): hypothetical protein
3188 :     prod: hypothetical protein
3189 :     //
3190 :     func: Hypothetical protein colocalized with Enterobactin receptor VctA
3191 :     prod: hypothetical protein
3192 :     //
3193 :     func: COG1004: Predicted UDP-glucose 6-dehydrogenase( EC:1.1.1.22 )
3194 :     prod: UDP-glucose 6-dehydrogenase
3195 :     ecnu: EC:1.1.1.22
3196 :     //
3197 :     func:
3198 :     prod:

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3