[Bio] / FigKernelScripts / sphinx_index_genome.pl Repository:
ViewVC logotype

Annotation of /FigKernelScripts/sphinx_index_genome.pl

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.4 - (view) (download) (as text)

1 : olson 1.1
2 :     use strict;
3 :     use Encode;
4 :     use FIG;
5 :     my $fig = new FIG;
6 :    
7 :     print <<END;
8 :     <?xml version="1.0" encoding="utf-8"?>
9 :     <sphinx:docset>
10 :     <sphinx:schema>
11 :     <sphinx:field name="fid"/>
12 :     <sphinx:field name="annotation"/>
13 :     <sphinx:field name="content"/>
14 :     </sphinx:schema>
15 :     END
16 :    
17 :     my %tmap = (peg => 1, rna => 2);
18 :    
19 :     for my $genome ($fig->genomes(1))
20 :     {
21 :     print STDERR "$genome\n";
22 :     my $gs = $fig->genus_species($genome);
23 : olson 1.4 $gs =~ s/&/&amp;/g;
24 :     $gs =~ s/</&lt;/g;
25 :     $gs =~ s/>/&gt;/g;
26 : olson 1.1 for my $feature (@{$fig->all_features_detailed_fast($genome)})
27 :     {
28 :     my($fid, $loc, $aliases, $type, $b, $e, $func, $who) = @$feature;
29 : olson 1.2
30 :     my @ss = $fig->peg_to_subsystems($fid, 1, 1);
31 : olson 1.3 @ss = map { defined($_) ? encode_utf8($_) : () } @ss;
32 : olson 1.2 my $ss = join("\n", map { s/_/ /g; $_ } @ss);
33 : olson 1.4 $ss =~ s/&/&amp;/g;
34 :     $ss =~ s/</&lt;/g;
35 :     $ss =~ s/>/&gt;/g;
36 : olson 1.1
37 : olson 1.3 $func = defined($func) ? encode_utf8($func) : "";
38 : olson 1.1 $func =~ s/&/&amp;/g;
39 :     $func =~ s/</&lt;/g;
40 :     $func =~ s/>/&gt;/g;
41 :     $aliases =~ s/&/&amp;/g;
42 :     $aliases =~ s/</&lt;/g;
43 :     $aliases =~ s/>/&gt;/g;
44 :     $aliases =~ s/,/ /g;
45 :     if ($fid =~ /^fig\|(\d+)\.(\d+)\.([^.]+)\.(\d+)$/)
46 :     {
47 :     my ($g, $ext, $type, $num) = ($1, $2, $3, $4);
48 :     my $tnum = $tmap{$type};
49 :     my $enc = $g << 26 | $ext << 18 | $tnum << 16 | $num;
50 :     print <<END;
51 :     <sphinx:document id="$enc">
52 :     <fid>$fid</fid>
53 :     <annotation>$func</annotation>
54 :     <content>$genome $gs
55 : olson 1.2 $aliases
56 :     $ss</content>
57 : olson 1.1 </sphinx:document>
58 :     END
59 :     }
60 :     }
61 :     }
62 :     print "</sphinx:docset>\n";

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3