[Bio] / FigKernelScripts / check_sims_basic.pl Repository:
ViewVC logotype

Annotation of /FigKernelScripts/check_sims_basic.pl

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.2 - (view) (download) (as text)

1 : overbeek 1.2 # -*- perl -*-
2 : overbeek 1.1
3 : overbeek 1.2 $SIG{HUP} = 'ignore';
4 :    
5 :     use File::Path;
6 :     use File::Basename;
7 :    
8 :     $usage = "usage: check_sims_basic [-delint_dir=Dir] [-logfile=log] NR [SimsDir | Sims1 Sims2 Sims3 ...] < sims > checked.sims [2> errors (recommended if a logfile isn't specified)]";
9 :    
10 :     $outdir = "";
11 :     $logfh = \*STDERR;
12 :     $trouble = 0;
13 :     for ($i=0; $i < @ARGV; )
14 :     {
15 :     if ($ARGV[$i] =~ m/-delint_dir=(\S+)/)
16 :     {
17 :     $outdir = $1;
18 :     splice @ARGV, $i, 1;
19 :     if (-d $outdir)
20 :     {
21 :     $trouble = 1;
22 :     warn "$outdir exists";
23 :     } else {
24 :     mkpath($outdir, 0, 0777) || die "Could not create $outdir";
25 :     }
26 :     }
27 :     elsif ($ARGV[$i] =~ m/-logfile=(\S+)/)
28 :     {
29 :     $logfile = $1;
30 :     splice @ARGV, $i, 1;
31 :     open(LOG, ">$logfile") || die "Could not open $logfile";
32 :     $logfh = \*LOG;
33 :     }
34 :     elsif (-s $ARGV[$i]) {
35 :     ++$i;
36 :     }
37 :     else {
38 :     print STDERR "Invalid arg $ARGV[$i]";
39 :     ++$i;
40 :     }
41 :     }
42 :     die "There were bad args" if ($trouble);
43 :    
44 :     (($nr = shift @ARGV) && (-s $nr))
45 : overbeek 1.1 || die $usage;
46 :    
47 : overbeek 1.2 if (@ARGV == 0) { push @ARGV, "$FIG_Config::data/Sims"; }
48 :     if ((@ARGV == 1) && (-d $ARGV[0]))
49 :     {
50 :     $sims_dir = shift @ARGV;
51 :     opendir(SIMS, $sims_dir) || die "Could not open $sims_dir";
52 :     @ARGV = grep !/^\./, readdir(SIMS);
53 :     @ARGV = map { $_ = "$sims_dir/$_" } @ARGV;
54 :     closedir(SIMS) || die "Could not close $sims_dir";
55 :     }
56 :    
57 :     $trouble = 0;
58 :     foreach $file (@ARGV)
59 :     {
60 :     next if ($file eq '-');
61 :     if (!-e $file) { print STDERR "Simfile $file does not exist"; $trouble = 1; }
62 :     }
63 :     die "There were nonexistent input files" if $trouble;
64 :    
65 : overbeek 1.1 open(NR,"<$nr") || die $usage;
66 :    
67 :     $/ = "\n>";
68 :     while (defined($_ = <NR>))
69 :     {
70 :     chomp;
71 :     if ($_ =~ /^>?(\S+)[^\n]*\n(.*)/s)
72 :     {
73 :     $id = $1;
74 :     $seq = $2;
75 :     $seq =~ s/\s//gs;
76 :     $ln{$id} = length($seq);
77 :     }
78 :     }
79 :     $/ = "\n";
80 :     close(NR);
81 :    
82 : overbeek 1.2 if ($outdir)
83 :     {
84 :     $file = "$outdir/" . basename($ARGV[0]);
85 :     open(OUTPUT, ">$file") || die "could not write-open $file";
86 :     print STDERR "Opening $file" if $ENV{FIG_VERBOSE};
87 :     $outfh = \*OUTPUT;
88 :     }
89 :     else
90 :     {
91 :     $outfh = \*STDOUT;
92 :     }
93 :    
94 :     while (defined($_ = <>))
95 : overbeek 1.1 {
96 :     chomp; # $/)
97 :     if ($_ =~ m/^\S+\t\S+\t(\d+|\d+\.\d+)(\t\d+){7}\t(\d+(\.\d*)?e[-+]?\d+|\d+\.\d+)\t(\d\.\d*e[-+]?\d+|\d+\.\d+|\d+)/)
98 :     {
99 :     # print STDERR "$1\t$2\t$3\t$4\t$5\t$6\n";
100 :     ($id1,$id2,$iden,$ali_ln,$mis,$gaps,$b1,$e1,$b2,$e2,$psc,$bsc,$ln1,$ln2) =
101 :     split(/\t/,$_);
102 :    
103 :     if ($ln{$id1} && $ln{$id2} && ($ln{$id1} == $ln1) && ($ln{$id2} == $ln2))
104 :     {
105 : overbeek 1.2 print $outfh "$_\n"; #...print valid sims to OUTPUT
106 : overbeek 1.1 }
107 :     else
108 :     {
109 :     if ($ln{$id1})
110 :     {
111 : overbeek 1.2 if ($ln{$id1} != $ln1) { print $logfh "badlen1\t$ARGV, $.:\t$id1\t$ln{$id1}\t$ln1\t$_\n"; }
112 : overbeek 1.1 }
113 :     else
114 :     {
115 : overbeek 1.2 print $logfh "undef1\t$ARGV, $.:\t$id1\t\t\t$_\n";
116 : overbeek 1.1 }
117 :    
118 :     if ($ln{$id2})
119 :     {
120 : overbeek 1.2 if ($ln{$id2} != $ln2) { print $logfh "badlen2\t$ARGV, $.:\t$id2\t$ln{$id2}\t$ln2\t$_\n"; }
121 : overbeek 1.1 }
122 :     else
123 :     {
124 : overbeek 1.2 print $logfh "undef2\t$ARGV, $.:\t$id2\t\t\t$_\n";
125 : overbeek 1.1 }
126 :     }
127 :     }
128 :     else
129 :     {
130 : overbeek 1.2 print $logfh "INVALID FORMAT\t$ARGV, $.:\t$_\n";
131 :     }
132 :     }
133 :     continue
134 :     {
135 :     if (eof)
136 :     {
137 :     #...reset line-number to zero, so that we know which line of which file is bad...
138 :     close(ARGV) || warn "Could not close $ARGV";
139 :     print STDERR "Finished processing $ARGV\n\n" if $ENV{FIG_VERBOSE};
140 :    
141 :     if ($outdir && $ARGV)
142 :     {
143 :     $file = "$outdir/" . basename($ARGV[0]);
144 :     open(OUTPUT, ">$file") || die "could not write-open $file";
145 :     print STDERR "Opening $file" if $ENV{FIG_VERBOSE};
146 :     $outfh = \*OUTPUT;
147 :     }
148 : overbeek 1.1 }
149 :     }

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3