[Bio] / FigKernelPackages / Observation.pm Repository:
ViewVC logotype

Diff of /FigKernelPackages/Observation.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.32, Tue Aug 21 22:45:54 2007 UTC revision 1.38, Mon Sep 10 15:10:04 2007 UTC
# Line 2  Line 2 
2    
3  use lib '/vol/ontologies';  use lib '/vol/ontologies';
4  use DBMaster;  use DBMaster;
5    use Data::Dumper;
6    
7  require Exporter;  require Exporter;
8  @EXPORT_OK = qw(get_objects);  @EXPORT_OK = qw(get_objects);
# Line 320  Line 321 
321          my %domain_classes;          my %domain_classes;
322          my @attributes = $fig->get_attributes($fid);          my @attributes = $fig->get_attributes($fid);
323          $domain_classes{'CDD'} = 1;          $domain_classes{'CDD'} = 1;
324          #get_identical_proteins($fid,\@matched_datasets);          get_identical_proteins($fid,\@matched_datasets);
325          get_attribute_based_domain_observations($fid,\%domain_classes,\@matched_datasets,\@attributes);          get_attribute_based_domain_observations($fid,\%domain_classes,\@matched_datasets,\@attributes);
326          get_sims_observations($fid,\@matched_datasets);          get_sims_observations($fid,\@matched_datasets);
327          get_functional_coupling($fid,\@matched_datasets);          get_functional_coupling($fid,\@matched_datasets);
# Line 437  Line 438 
438      my ($observation, $fid) = @_;      my ($observation, $fid) = @_;
439      my $fig = new FIG;      my $fig = new FIG;
440      my %families;      my %families;
441      my @sims= $fig->nsims($fid,20000,10,"all");      my @sims= $fig->nsims($fid,20000,10,"fig");
442    
443      foreach my $sim (@sims){      foreach my $sim (@sims){
444          next if ($sim->[1] !~ /fig\|/);          next if ($sim->[1] !~ /fig\|/);
445          my $genome = $fig->genome_of($sim->[1]);          my $genome = $fig->genome_of($sim->[1]);
446          my $taxonomy = $fig->taxonomy_of($fig->genome_of($sim->[1]));          my $taxonomy = $fig->taxonomy_of($fig->genome_of($sim->[1]));
447          my $parent_tax = "Root";          my $parent_tax = "Root";
448            my @currLineage = ($parent_tax);
449          foreach my $tax (split(/\; /, $taxonomy)){          foreach my $tax (split(/\; /, $taxonomy)){
450              push (@{$families{children}{$parent_tax}}, $tax);              push (@{$families{children}{$parent_tax}}, $tax);
451                push (@currLineage, $tax);
452              $families{parent}{$tax} = $parent_tax;              $families{parent}{$tax} = $parent_tax;
453                $families{lineage}{$tax} = join(";", @currLineage);
454              $parent_tax = $tax;              $parent_tax = $tax;
455          }          }
456      }      }
# Line 641  Line 645 
645    
646      my ($fid,$datasets_ref) = (@_);      my ($fid,$datasets_ref) = (@_);
647      my $fig = new FIG;      my $fig = new FIG;
648      my @sims= $fig->nsims($fid,500,1e-20,"all");      my @sims= $fig->nsims($fid,500,10,"fig");
649      my ($dataset);      my ($dataset);
650    
651      my %id_list;      my %id_list;
# Line 739  Line 743 
743      my $fig = new FIG;      my $fig = new FIG;
744      my $funcs_ref;      my $funcs_ref;
745    
746      my %id_list;  #    my %id_list;
747      my @maps_to = grep { $_ ne $fid and $_ !~ /^xxx/ } map { $_->[0] } $fig->mapped_prot_ids($fid);      my @maps_to = grep { $_ ne $fid and $_ !~ /^xxx/ } map { $_->[0] } $fig->mapped_prot_ids($fid);
748      my @aliases = $fig->feature_aliases($fid);  #    my @aliases = $fig->feature_aliases($fid);
749      foreach my $alias (@aliases){  #    foreach my $alias (@aliases){
750          $id_list{$alias} = 1;  #       $id_list{$alias} = 1;
751      }  #    }
752    
753      foreach my $id (@maps_to) {      foreach my $id (@maps_to) {
754          my ($tmp, $who);          my ($tmp, $who);
755          if (($id ne $fid) && ($tmp = $fig->function_of($id)) && (! defined ($id_list{$id}))) {          if (($id ne $fid) && ($tmp = $fig->function_of($id))) {
756    #        if (($id ne $fid) && ($tmp = $fig->function_of($id)) && (! defined ($id_list{$id}))) {
757              $who = &get_database($id);              $who = &get_database($id);
758              push(@$funcs_ref, [$id,$who,$tmp]);              push(@$funcs_ref, [$id,$who,$tmp]);
759          }          }
# Line 1345  Line 1350 
1350      return $self;      return $self;
1351  }  }
1352    
1353    sub display_cello {
1354        my ($thing) = @_;
1355        my $html;
1356        my $cello_location = $thing->cello_location;
1357        my $cello_score = $thing->cello_score;
1358        if($cello_location){
1359            $html .= "<p>CELLO prediction: $cello_location </p>";
1360            $html .= "<p>CELLO score: $cello_score </p>";
1361        }
1362        return ($html);
1363    }
1364    
1365  sub display {  sub display {
1366      my ($thing,$gd) = @_;      my ($thing,$gd) = @_;
1367    
# Line 1369  Line 1386 
1386      #color is      #color is
1387      my $color = "6";      my $color = "6";
1388    
1389    =pod=
1390    
1391      if($cello_location){      if($cello_location){
1392          my $cello_descriptions = [];          my $cello_descriptions = [];
1393          my $line_data =[];          my $line_data =[];
# Line 1389  Line 1408 
1408    
1409          my $element_hash = {          my $element_hash = {
1410              "title" => "CELLO",              "title" => "CELLO",
1411                "color"=> $color,
1412              "start" => "1",              "start" => "1",
1413              "end" =>  $length + 1,              "end" =>  $length + 1,
             "color"=> $color,  
             "type" => 'box',  
1414              "zlayer" => '1',              "zlayer" => '1',
1415              "description" => $cello_descriptions};              "description" => $cello_descriptions};
1416    
# Line 1400  Line 1418 
1418          $gd->add_line($line_data, $line_config);          $gd->add_line($line_data, $line_config);
1419      }      }
1420    
1421    =cut
1422    
1423      $color = "2";      $color = "2";
1424      if($tmpred_score){      if($tmpred_score){
# Line 1408  Line 1427 
1427                              'short_title' => 'Transmembrane',                              'short_title' => 'Transmembrane',
1428                              'basepair_offset' => '1' };                              'basepair_offset' => '1' };
1429    
   
1430          foreach my $tmpred (@tmpred_locations){          foreach my $tmpred (@tmpred_locations){
1431              my $descriptions = [];              my $descriptions = [];
1432              my ($begin,$end) =split("-",$tmpred);              my ($begin,$end) =split("-",$tmpred);
# Line 1423  Line 1441 
1441              "end" =>  $end + 1,              "end" =>  $end + 1,
1442              "color"=> $color,              "color"=> $color,
1443              "zlayer" => '5',              "zlayer" => '5',
1444              "type" => 'smallbox',              "type" => 'box',
1445              "description" => $descriptions};              "description" => $descriptions};
1446    
1447              push(@$line_data,$element_hash);              push(@$line_data,$element_hash);
# Line 1708  Line 1726 
1726    
1727  }  }
1728    
1729    =head3 display_domain_composition()
1730    
1731    If available use the function specified here to display a graphical observation of the CDD(later Pfam or selected) domains that occur in the set of similar proteins
1732    
1733    =cut
1734    
1735    sub display_domain_composition {
1736        my ($self,$gd) = @_;
1737    
1738        my $fig = new FIG;
1739        my $peg = $self->acc;
1740    
1741        my $line_data = [];
1742        my $links_list = [];
1743        my $descriptions = [];
1744    
1745        my @domain_query_results =$fig->get_attributes($peg,"CDD");
1746    
1747        foreach $dqr (@domain_query_results){
1748            my $key = @$dqr[1];
1749            my @parts = split("::",$key);
1750            my $db = $parts[0];
1751            my $id = $parts[1];
1752            my $val = @$dqr[2];
1753            my $from;
1754            my $to;
1755            my $evalue;
1756    
1757            if($val =~/^(\d+\.\d+|0\.0);(\d+)-(\d+)/){
1758                my $raw_evalue = $1;
1759                $from = $2;
1760                $to = $3;
1761                if($raw_evalue =~/(\d+)\.(\d+)/){
1762                    my $part2 = 1000 - $1;
1763                    my $part1 = $2/100;
1764                    $evalue = $part1."e-".$part2;
1765                }
1766                else{
1767                    $evalue = "0.0";
1768                }
1769            }
1770    
1771            my $dbmaster = DBMaster->new(-database =>'Ontology');
1772            my ($name_value,$description_value);
1773    
1774            if($db eq "CDD"){
1775                my $cdd_objs = $dbmaster->cdd->get_objects( { 'id' => $id } );
1776                if(!scalar(@$cdd_objs)){
1777                    $name_title = "name";
1778                    $name_value = "not available";
1779                    $description_title = "description";
1780                    $description_value = "not available";
1781                }
1782                else{
1783                    my $cdd_obj = $cdd_objs->[0];
1784                    $name_value = $cdd_obj->term;
1785                    $description_value = $cdd_obj->description;
1786                }
1787            }
1788    
1789            my $domain_name;
1790            $domain_name = {"title" => "name",
1791                     "value" => $name_value};
1792            push(@$descriptions,$domain_name);
1793    
1794            my $description;
1795            $description = {"title" => "description",
1796                            "value" => $description_value};
1797            push(@$descriptions,$description);
1798    
1799            my $score;
1800            $score = {"title" => "score",
1801                      "value" => $evalue};
1802            push(@$descriptions,$score);
1803    
1804            my $link_id = $id;
1805            my $link;
1806            my $link_url;
1807            if ($db eq "CDD"){$link_url = "http://0-www.ncbi.nlm.nih.gov.library.vu.edu.au:80/Structure/cdd/cddsrv.cgi?uid=$link_id"}
1808            elsif($db eq "PFAM"){$link_url = "http://www.sanger.ac.uk/cgi-bin/Pfam/getacc?$link_id"}
1809            else{$link_url = "NO_URL"}
1810    
1811            $link = {"link_title" => $name_value,
1812                     "link" => $link_url};
1813            push(@$links_list,$link);
1814    
1815            my $domain_element_hash = {
1816                "title" => $peg,
1817                "start" => $from,
1818                "end" =>  $to,
1819                "type"=> 'box',
1820                "zlayer" => '4',
1821                "links_list" => $links_list,
1822                "description" => $descriptions
1823                };
1824    
1825            push(@$line_data,$domain_element_hash);
1826    
1827            #just one CDD domain for now, later will add option for multiple domains from selected DB
1828            last;
1829        }
1830    
1831        my $line_config = { 'title' => $peg,
1832                            'short_title' => $peg,
1833                            'basepair_offset' => '1' };
1834    
1835        $gd->add_line($line_data, $line_config);
1836    
1837        return ($gd);
1838    
1839    }
1840    
1841  =head3 display_table()  =head3 display_table()
1842    
1843  If available use the function specified here to display the "raw" observation.  If available use the function specified here to display the "raw" observation.
# Line 1718  Line 1848 
1848  =cut  =cut
1849    
1850  sub display_table {  sub display_table {
1851      my ($self,$dataset, $columns, $query_fid) = @_;      my ($self,$dataset, $scroll_list, $query_fid) = @_;
1852    
1853      my $data = [];      my $data = [];
1854      my $count = 0;      my $count = 0;
# Line 1732  Line 1862 
1862      }      }
1863    
1864      my (%box_column, %subsystems_column, %evidence_column, %e_identical);      my (%box_column, %subsystems_column, %evidence_column, %e_identical);
1865      foreach my $col (@$columns){  
1866          # get the column for the subsystems          # get the column for the subsystems
         if ($col eq "subsystem"){  
1867              %subsystems_column = &get_subsystems_column(\@ids);              %subsystems_column = &get_subsystems_column(\@ids);
1868          }  
1869          # get the column for the evidence codes          # get the column for the evidence codes
         elsif ($col eq "evidence"){  
1870              %evidence_column = &get_evidence_column(\@ids);              %evidence_column = &get_evidence_column(\@ids);
1871          }  
1872      }      # get the column for pfam_domain
1873        %pfam_column = &get_pfam_column(\@ids);
1874    
1875      my %e_identical = &get_essentially_identical($query_fid);      my %e_identical = &get_essentially_identical($query_fid);
1876        my $all_aliases = $fig->feature_aliases_bulk(\@ids);
1877    
1878      foreach my $thing (@$dataset) {      foreach my $thing (@$dataset) {
1879          next if ($thing->class ne "SIM");          next if ($thing->class ne "SIM");
# Line 1786  Line 1916 
1916          push(@$single_domain,$reg2);                           # permanent column          push(@$single_domain,$reg2);                           # permanent column
1917          push(@$single_domain,$thing->organism);                # permanent column          push(@$single_domain,$thing->organism);                # permanent column
1918          push(@$single_domain,$thing->function);                # permanent column          push(@$single_domain,$thing->function);                # permanent column
1919          foreach my $col (@$columns){          foreach my $col (sort keys %$scroll_list){
1920              (push(@$single_domain,$subsystems_column{$id}) && (next)) if ($col eq "subsystem");              if ($col =~ /associated_subsystem/)          {push(@$single_domain,$subsystems_column{$id});}
1921              (push(@$single_domain,$evidence_column{$id}) && (next)) if ($col eq "evidence");              elsif ($col =~ /evidence/)                   {push(@$single_domain,$evidence_column{$id});}
1922              (push(@$single_domain,&get_prefer($thing->acc, 'NCBI')) && (next)) if ($col eq "ncbi_id");              elsif ($col =~ /pfam_domains/)               {push(@$single_domain,$pfam_column{$id});}
1923              (push(@$single_domain,&get_prefer($thing->acc, 'RefSeq')) && (next)) if ($col eq "refseq_id");              elsif ($col =~ /ncbi_id/)                    {push(@$single_domain,&get_prefer($thing->acc, 'NCBI', $all_aliases));}
1924              (push(@$single_domain,&get_prefer($thing->acc, 'SwissProt')) && (next)) if ($col eq "swissprot_id");              elsif ($col =~ /refseq_id/)                  {push(@$single_domain,&get_prefer($thing->acc, 'RefSeq', $all_aliases));}
1925              (push(@$single_domain,&get_prefer($thing->acc, 'UniProt')) && (next)) if ($col eq "uniprot_id");              elsif ($col =~ /swissprot_id/)               {push(@$single_domain,&get_prefer($thing->acc, 'SwissProt', $all_aliases));}
1926              (push(@$single_domain,&get_prefer($thing->acc, 'TIGR')) && (next)) if ($col eq "tigr_id");              elsif ($col =~ /uniprot_id/)                 {push(@$single_domain,&get_prefer($thing->acc, 'UniProt', $all_aliases));}
1927              (push(@$single_domain,&get_prefer($thing->acc, 'PIR')) && (next)) if ($col eq "pir_id");              elsif ($col =~ /tigr_id/)                    {push(@$single_domain,&get_prefer($thing->acc, 'TIGR', $all_aliases));}
1928              (push(@$single_domain,&get_prefer($thing->acc, 'KEGG')) && (next)) if ($col eq "kegg_id");              elsif ($col =~ /pir_id/)                     {push(@$single_domain,&get_prefer($thing->acc, 'PIR', $all_aliases));}
1929              (push(@$single_domain,&get_prefer($thing->acc, 'TrEMBL')) && (next)) if ($col eq "trembl_id");              elsif ($col =~ /kegg_id/)                    {push(@$single_domain,&get_prefer($thing->acc, 'KEGG', $all_aliases));}
1930              (push(@$single_domain,&get_prefer($thing->acc, 'ASAP')) && (next)) if ($col eq "asap_id");              elsif ($col =~ /trembl_id/)                  {push(@$single_domain,&get_prefer($thing->acc, 'TrEMBL', $all_aliases));}
1931              (push(@$single_domain,&get_prefer($thing->acc, 'JGI')) && (next)) if ($col eq "jgi_id");              elsif ($col =~ /asap_id/)                    {push(@$single_domain,&get_prefer($thing->acc, 'ASAP', $all_aliases));}
1932                elsif ($col =~ /jgi_id/)                     {push(@$single_domain,&get_prefer($thing->acc, 'JGI', $all_aliases));}
1933          }          }
1934          push(@$data,$single_domain);          push(@$data,$single_domain);
1935      }      }
# Line 1907  Line 2038 
2038      return (%column);      return (%column);
2039  }  }
2040    
2041  sub html_enc { $_ = $_[0]; s/\&/&amp;/g; s/\>/&gt;/g; s/\</&lt;/g; $_ }  sub get_pfam_column{
2042        my ($ids) = @_;
2043        my $fig = new FIG;
2044        my $cgi = new CGI;
2045        my (%column, %code_attributes);
2046        my $dbmaster = DBMaster->new(-database =>'Ontology');
2047    
2048        my @codes = grep { $_->[1] =~ /^PFAM/i } $fig->get_attributes($ids);
2049        foreach my $key (@codes){
2050            push (@{$code_attributes{$$key[0]}}, $$key[1]);
2051        }
2052    
2053        foreach my $id (@$ids){
2054            # add evidence code with tool tip
2055            my $pfam_codes=" &nbsp; ";
2056            my @pfam_codes = "";
2057            my %description_codes;
2058    
2059            if ($id =~ /^fig\|\d+\.\d+\.peg\.\d+$/) {
2060                my @codes;
2061                @codes = @{$code_attributes{$id}} if (defined @{$code_attributes{$id}});
2062                @pfam_codes = ();
2063                foreach my $code (@codes) {
2064                    my @parts = split("::",$code);
2065                    my $pfam_link = "<a href=http://www.sanger.ac.uk//cgi-bin/Pfam/getacc?" . $parts[1] . ">$parts[1]</a>";
2066                    if (defined ($description_codes{$parts[1]})){
2067                        push(@pfam_codes, "$description_codes{$parts[1]} ($parts[1])");
2068                    }
2069                    else {
2070                        my $description = $dbmaster->pfam->get_objects( { 'id' => $parts[1] } );
2071                        $description_codes{$parts[1]} = ${$$description[0]}{term};
2072                        push(@pfam_codes, "${$$description[0]}{term} ($pfam_link)");
2073                    }
2074                }
2075            }
2076    
2077            $column{$id}=join("<br><br>", @pfam_codes);
2078        }
2079        return (%column);
2080    
2081    }
2082    
2083  sub get_prefer {  sub get_prefer {
2084      my ($fid, $db) = @_;      my ($fid, $db, $all_aliases) = @_;
2085      my $fig = new FIG;      my $fig = new FIG;
2086      my $cgi = new CGI;      my $cgi = new CGI;
2087    
2088      my @aliases = $fig->feature_aliases($fid);      foreach my $alias (@{$$all_aliases{$fid}}){
   
     foreach my $alias (@aliases){  
2089          my $id_db = &Observation::get_database($alias);          my $id_db = &Observation::get_database($alias);
2090          if ($id_db eq $db){          if ($id_db eq $db){
2091              my $acc_col .= &HTML::set_prot_links($cgi,$alias);              my $acc_col .= &HTML::set_prot_links($cgi,$alias);
# Line 1926  Line 2095 
2095      return (" ");      return (" ");
2096  }  }
2097    
2098    sub html_enc { $_ = $_[0]; s/\&/&amp;/g; s/\>/&gt;/g; s/\</&lt;/g; $_ }
2099    
2100  sub color {  sub color {
2101      my ($evalue) = @_;      my ($evalue) = @_;
2102    
# Line 1981  Line 2152 
2152  }  }
2153    
2154  sub display {  sub display {
2155      my ($self,$gd) = @_;      my ($self,$gd,$selected_taxonomies) = @_;
2156    
2157      my $fid = $self->fig_id;      my $fid = $self->fig_id;
2158      my $compare_or_coupling = $self->context;      my $compare_or_coupling = $self->context;
2159      my $gd_window_size = $gd->window_size;      my $gd_window_size = $gd->window_size;
2160      my $fig = new FIG;      my $fig = new FIG;
2161      my $all_regions = [];      my $all_regions = [];
2162        my $gene_associations={};
2163    
2164      #get the organism genome      #get the organism genome
2165      my $target_genome = $fig->genome_of($fid);      my $target_genome = $fig->genome_of($fid);
2166        $gene_associations->{$fid}->{"organism"} = $target_genome;
2167        $gene_associations->{$fid}->{"main_gene"} = $fid;
2168        $gene_associations->{$fid}->{"reverse_flag"} = 0;
2169    
2170      # get location of the gene      # get location of the gene
2171      my $data = $fig->feature_location($fid);      my $data = $fig->feature_location($fid);
# Line 2017  Line 2192 
2192          $region_end = $beg+4000;          $region_end = $beg+4000;
2193          $offset = ($3+(($2-$3)/2))-($gd_window_size/2);          $offset = ($3+(($2-$3)/2))-($gd_window_size/2);
2194          $reverse_flag{$target_genome} = $fid;          $reverse_flag{$target_genome} = $fid;
2195            $gene_associations->{$fid}->{"reverse_flag"} = 1;
2196      }      }
2197    
2198      # call genes in region      # call genes in region
# Line 2027  Line 2203 
2203    
2204      my %all_genes;      my %all_genes;
2205      my %all_genomes;      my %all_genomes;
2206      foreach my $feature (@$target_gene_features){ $all_genes{$feature} = $fid;}      foreach my $feature (@$target_gene_features){ $all_genes{$feature} = $fid; $gene_associations->{$feature}->{"main_gene"}=$fid;}
2207    
2208      if ($compare_or_coupling eq "diverse")      if ($compare_or_coupling eq "diverse")
2209      {      {
# Line 2051  Line 2227 
2227                  {                  {
2228                      $pair_region_start = $pair_beg - 4000;                      $pair_region_start = $pair_beg - 4000;
2229                      $pair_region_stop = $pair_end+4000;                      $pair_region_stop = $pair_end+4000;
2230                      $offset = ($2+(($3-$2)/2))-($gd_window_size/2);                      $offset = ($pair_beg+(($pair_end-$pair_beg)/2))-($gd_window_size/2);
2231                  }                  }
2232                  else                  else
2233                  {                  {
2234                      $pair_region_start = $pair_end-4000;                      $pair_region_start = $pair_end-4000;
2235                      $pair_region_stop = $pair_beg+4000;                      $pair_region_stop = $pair_beg+4000;
2236                      $offset = ($3+(($2-$3)/2))-($gd_window_size/2);                      $offset = ($pair_end+(($pair_beg-$pair_end)/2))-($gd_window_size/2);
2237                      $reverse_flag{$pair_genome} = $peg1;                      $reverse_flag{$pair_genome} = $peg1;
2238                  }                  }
2239    
# Line 2071  Line 2247 
2247              $coup_count++;              $coup_count++;
2248          }          }
2249      }      }
2250        elsif ($compare_or_coupling eq "sims"){
2251            # get the selected boxes
2252            #my @selected_taxonomy = ("Streptococcaceae", "Enterobacteriales");
2253            my @selected_taxonomy = @$selected_taxonomies;
2254    
2255            # get the similarities and store only the ones that match the lineages selected
2256            my @selected_sims;
2257            my @sims= $fig->nsims($fid,20000,10,"fig");
2258    
2259      elsif ($compare_or_coupling eq "close")          if (@selected_taxonomy > 0){
2260      {              foreach my $sim (@sims){
2261          # make a hash of genomes that are phylogenetically close                  next if ($sim->[1] !~ /fig\|/);
2262          #my $close_threshold = ".26";                  my $genome = $fig->genome_of($sim->[1]);
2263          #my @genomes = $fig->genomes('complete');                  my $lineage = $fig->taxonomy_of($fig->genome_of($sim->[1]));
2264          #my %close_genomes = ();                  foreach my $taxon(@selected_taxonomy){
2265          #foreach my $compared_genome (@genomes)                      if ($lineage =~ /$taxon/){
2266          #{                          push (@selected_sims, $sim->[1]);
         #    my $dist = $fig->crude_estimate_of_distance($target_genome,$compared_genome);  
         #    #$close_genomes{$compared_genome} = $dist;  
         #    if ($dist <= $close_threshold)  
         #    {  
         #       $all_genomes{$compared_genome} = 1;  
         #    }  
         #}  
         $all_genomes{"216592.1"} = 1;  
         $all_genomes{"79967.1"} = 1;  
         $all_genomes{"199310.1"} = 1;  
         $all_genomes{"216593.1"} = 1;  
         $all_genomes{"155864.1"} = 1;  
         $all_genomes{"83334.1"} = 1;  
         $all_genomes{"316407.3"} = 1;  
   
         foreach my $comp_genome (keys %all_genomes){  
             my $return = $fig->bbh_list($comp_genome,[$fid]);  
             my $feature_list = $return->{$fid};  
             foreach my $peg1 (@$feature_list){  
                 my $location = $fig->feature_location($peg1);  
                 my ($pair_contig,$pair_beg,$pair_end,$pair_region_start,$pair_region_stop,$pair_genome);  
                 $pair_genome = $fig->genome_of($peg1);  
   
                 if($location =~/(.*)_(\d+)_(\d+)$/){  
                     $pair_contig = $1;  
                     $pair_beg = $2;  
                     $pair_end = $3;  
                     if ($pair_beg < $pair_end)  
                     {  
                         $pair_region_start = $pair_beg - 4000;  
                         $pair_region_stop = $pair_end + 4000;  
                         $offset = ($2+(($3-$2)/2))-($gd_window_size/2);  
                     }  
                     else  
                     {  
                         $pair_region_start = $pair_end-4000;  
                         $pair_region_stop = $pair_beg+4000;  
                         $offset = ($3+(($2-$3)/2))-($gd_window_size/2);  
                         $reverse_flag{$pair_genome} = $peg1;  
2267                      }                      }
   
                     push (@start_array_region, $offset);  
                     $all_genomes{$pair_genome} = 1;  
                     my ($pair_features) = $fig->genes_in_region($pair_genome, $pair_contig, $pair_region_start, $pair_region_stop);  
                     push(@$all_regions,$pair_features);  
                     foreach my $pair_feature (@$pair_features){ $all_genes{$pair_feature} = $peg1;}  
2268                  }                  }
2269                    my %saw;
2270                    @selected_sims = grep(!$saw{$_}++, @selected_sims);
2271              }              }
2272          }          }
2273    
2274            # get the gene context for the sorted matches
2275            foreach my $sim_fid(@selected_sims){
2276                #get the organism genome
2277                my $sim_genome = $fig->genome_of($sim_fid);
2278                $gene_associations->{$sim_fid}->{"organism"} = $sim_genome;
2279                $gene_associations->{$sim_fid}->{"main_gene"} = $sim_fid;
2280                $gene_associations->{$sim_fid}->{"reverse_flag"} = 0;
2281    
2282                # get location of the gene
2283                my $data = $fig->feature_location($sim_fid);
2284                my ($contig, $beg, $end);
2285    
2286                if ($data =~ /(.*)_(\d+)_(\d+)$/){
2287                    $contig = $1;
2288                    $beg = $2;
2289                    $end = $3;
2290      }      }
2291    
2292      # get the PCH to each of the genes              my $offset;
2293      my $pch_sets = [];              my ($region_start, $region_end);
2294      my %pch_already;              if ($beg < $end)
     foreach my $gene_peg (keys %all_genes)  
     {  
         if ($pch_already{$gene_peg}){(next);};  
         my $gene_set = [$gene_peg];  
         foreach my $pch_peg ($fig->in_pch_pin_with($gene_peg)) {  
             $pch_peg =~ s/,.*$//;  
             my $pch_genome = $fig->genome_of($pch_peg);  
             if ( ($gene_peg ne $pch_peg) && ($all_genomes{$pch_genome})) {  
                 push(@$gene_set,$pch_peg);  
                 $pch_already{$pch_peg}=1;  
             }  
             $pch_already{$gene_peg}=1;  
         }  
         push(@$pch_sets,$gene_set);  
     }  
   
     #create a rank of the pch's  
     my %pch_set_rank;  
     my $order = 0;  
     foreach my $set (@$pch_sets){  
         my $count = scalar(@$set);  
         $pch_set_rank{$order} = $count;  
         $order++;  
     }  
   
     my %peg_rank;  
     my $counter =  1;  
     foreach my $pch_order (sort {$pch_set_rank{$b} <=> $pch_set_rank{$a}} keys %pch_set_rank){  
         my $good_set = @$pch_sets[$pch_order];  
         my $flag_set = 0;  
         if (scalar (@$good_set) > 1)  
2295          {          {
2296              foreach my $peg (@$good_set){                  $region_start = $beg - 4000;
2297                  if ((!$peg_rank{$peg})){                  $region_end = $end+4000;
2298                      $peg_rank{$peg} = $counter;                  $offset = ($beg+(($end-$beg)/2))-($gd_window_size/2);
                     $flag_set = 1;  
                 }  
             }  
             $counter++ if ($flag_set == 1);  
2299          }          }
2300          else          else
2301          {          {
2302              foreach my $peg (@$good_set){                  $region_start = $end-4000;
2303                  $peg_rank{$peg} = "20";                  $region_end = $beg+4000;
2304              }                  $offset = ($end+(($beg-$end)/2))-($gd_window_size/2);
2305                    $reverse_flag{$sim_genome} = $sim_fid;
2306                    $gene_associations->{$sim_fid}->{"reverse_flag"} = 1;
2307          }          }
2308    
2309                # call genes in region
2310                my ($sim_gene_features, $reg_beg, $reg_end) = $fig->genes_in_region($sim_genome, $contig, $region_start, $region_end);
2311                push(@$all_regions,$sim_gene_features);
2312                push (@start_array_region, $offset);
2313                foreach my $feature (@$sim_gene_features){ $all_genes{$feature} = $sim_fid;$gene_associations->{$feature}->{"main_gene"}=$sim_fid;}
2314                $all_genomes{$sim_genome} = 1;
2315      }      }
2316    
2317        }
2318    
2319  #    my $bbh_sets = [];      # cluster the genes
2320  #    my %already;      my @all_pegs = keys %all_genes;
2321  #    foreach my $gene_key (keys(%all_genes)){      my $color_sets = &cluster_genes($fig,\@all_pegs,$fid);
 #       if($already{$gene_key}){(next);}  
 #       my $gene_set = [$gene_key];  
 #  
 #       my $gene_key_genome = $fig->genome_of($gene_key);  
 #  
 #       foreach my $genome_key (keys(%all_genomes)){  
 #           #(next) if ($gene_key_genome eq $genome_key);  
 #           my $return = $fig->bbh_list($genome_key,[$gene_key]);  
 #  
 #           my $feature_list = $return->{$gene_key};  
 #           foreach my $fl (@$feature_list){  
 #               push(@$gene_set,$fl);  
 #           }  
 #       }  
 #       $already{$gene_key} = 1;  
 #       push(@$bbh_sets,$gene_set);  
 #    }  
 #  
 #    my %bbh_set_rank;  
 #    my $order = 0;  
 #    foreach my $set (@$bbh_sets){  
 #       my $count = scalar(@$set);  
 #       $bbh_set_rank{$order} = $count;  
 #       $order++;  
 #    }  
 #  
 #    my %peg_rank;  
 #    my $counter =  1;  
 #    foreach my $bbh_order (sort {$bbh_set_rank{$b} <=> $bbh_set_rank{$a}} keys %bbh_set_rank){  
 #       my $good_set = @$bbh_sets[$bbh_order];  
 #       my $flag_set = 0;  
 #       if (scalar (@$good_set) > 1)  
 #       {  
 #           foreach my $peg (@$good_set){  
 #               if ((!$peg_rank{$peg})){  
 #                   $peg_rank{$peg} = $counter;  
 #                   $flag_set = 1;  
 #               }  
 #           }  
 #           $counter++ if ($flag_set == 1);  
 #       }  
 #       else  
 #       {  
 #           foreach my $peg (@$good_set){  
 #               $peg_rank{$peg} = "20";  
 #           }  
 #       }  
 #    }  
2322    
2323      foreach my $region (@$all_regions){      foreach my $region (@$all_regions){
2324          my $sample_peg = @$region[0];          my $sample_peg = @$region[0];
# Line 2249  Line 2334 
2334    
2335          my $second_line_config = { 'title' => "$region_gs",          my $second_line_config = { 'title' => "$region_gs",
2336                                     'short_title' => "",                                     'short_title' => "",
2337                                     'basepair_offset' => '0'                                     'basepair_offset' => '0',
2338                                       'no_middle_line' => '1'
2339                                     };                                     };
2340    
2341          my $line_data = [];          my $line_data = [];
# Line 2266  Line 2352 
2352              my $links_list = [];              my $links_list = [];
2353              my $descriptions = [];              my $descriptions = [];
2354    
2355              my $color = $peg_rank{$fid1};              my $color = $color_sets->{$fid1};
2356    
2357              # get subsystem information              # get subsystem information
2358              my $function = $fig->function_of($fid1);              my $function = $fig->function_of($fid1);
# Line 2334  Line 2420 
2420                  # if there is an overlap, put into second line                  # if there is an overlap, put into second line
2421                  if ($second_line_flag == 1){ push(@$second_line_data,$element_hash); $prev_second_flag = 1;}                  if ($second_line_flag == 1){ push(@$second_line_data,$element_hash); $prev_second_flag = 1;}
2422                  else{ push(@$line_data,$element_hash); $prev_second_flag = 0;}                  else{ push(@$line_data,$element_hash); $prev_second_flag = 0;}
   
2423              }              }
2424          }          }
2425          $gd->add_line($line_data, $line_config);          $gd->add_line($line_data, $line_config);
# Line 2343  Line 2428 
2428      return $gd;      return $gd;
2429  }  }
2430    
2431    sub cluster_genes {
2432        my($fig,$all_pegs,$peg) = @_;
2433        my(%seen,$i,$j,$k,$x,$cluster,$conn,$pegI,$red_set);
2434    
2435        my @color_sets = ();
2436    
2437        $conn = &get_connections_by_similarity($fig,$all_pegs);
2438    
2439        for ($i=0; ($i < @$all_pegs); $i++) {
2440            if ($all_pegs->[$i] eq $peg) { $pegI = $i }
2441            if (! $seen{$i}) {
2442                $cluster = [$i];
2443                $seen{$i} = 1;
2444                for ($j=0; ($j < @$cluster); $j++) {
2445                    $x = $conn->{$cluster->[$j]};
2446                    foreach $k (@$x) {
2447                        if (! $seen{$k}) {
2448                            push(@$cluster,$k);
2449                            $seen{$k} = 1;
2450                        }
2451                    }
2452                }
2453    
2454                if ((@$cluster > 1) || ($cluster->[0] eq $pegI)) {
2455                    push(@color_sets,$cluster);
2456                }
2457            }
2458        }
2459        for ($i=0; ($i < @color_sets) && (! &in($pegI,$color_sets[$i])); $i++) {}
2460        $red_set = $color_sets[$i];
2461        splice(@color_sets,$i,1);
2462        @color_sets = sort { @$b <=> @$a } @color_sets;
2463        unshift(@color_sets,$red_set);
2464    
2465        my $color_sets = {};
2466        for ($i=0; ($i < @color_sets); $i++) {
2467            foreach $x (@{$color_sets[$i]}) {
2468                $color_sets->{$all_pegs->[$x]} = $i;
2469            }
2470        }
2471        return $color_sets;
2472    }
2473    
2474    sub get_connections_by_similarity {
2475        my($fig,$all_pegs) = @_;
2476        my($i,$j,$tmp,$peg,%pos_of);
2477        my($sim,%conn,$x,$y);
2478    
2479        for ($i=0; ($i < @$all_pegs); $i++) {
2480            $tmp = $fig->maps_to_id($all_pegs->[$i]);
2481            push(@{$pos_of{$tmp}},$i);
2482            if ($tmp ne $all_pegs->[$i]) {
2483                push(@{$pos_of{$all_pegs->[$i]}},$i);
2484            }
2485        }
2486    
2487        foreach $y (keys(%pos_of)) {
2488            $x = $pos_of{$y};
2489            for ($i=0; ($i < @$x); $i++) {
2490                for ($j=$i+1; ($j < @$x); $j++) {
2491                    push(@{$conn{$x->[$i]}},$x->[$j]);
2492                    push(@{$conn{$x->[$j]}},$x->[$i]);
2493                }
2494            }
2495        }
2496    
2497        for ($i=0; ($i < @$all_pegs); $i++) {
2498            foreach $sim ($fig->nsims($all_pegs->[$i],500,10,"raw")) {
2499                if (defined($x = $pos_of{$sim->id2})) {
2500                    foreach $y (@$x) {
2501                        push(@{$conn{$i}},$y);
2502                    }
2503                }
2504            }
2505        }
2506        return \%conn;
2507    }
2508    
2509    sub in {
2510        my($x,$xL) = @_;
2511        my($i);
2512    
2513        for ($i=0; ($i < @$xL) && ($x != $xL->[$i]); $i++) {}
2514        return ($i < @$xL);
2515    }

Legend:
Removed from v.1.32  
changed lines
  Added in v.1.38

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3