[Bio] / FigKernelPackages / HTML.pm Repository:
ViewVC logotype

Annotation of /FigKernelPackages/HTML.pm

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1.7 - (view) (download) (as text)

1 : efrank 1.1 package HTML;
2 :    
3 :     use Carp;
4 :     use Data::Dumper;
5 :     use LWP::UserAgent;
6 :     use LWP::Simple;
7 :     use URI::URL;
8 :     use HTTP::Request::Common;
9 :    
10 :     sub show_page {
11 :     my($cgi,$html,$no_home) = @_;
12 :     my $i;
13 :    
14 : olson 1.2 #
15 :     # Find the HTML header
16 :     #
17 :    
18 :     my $html_hdr_file = "./Html/html.hdr";
19 :     if (! -f $html_hdr_file)
20 :     {
21 :     $html_hdr_file = "$FIG_Config::fig/CGI/Html/html.hdr";
22 :     }
23 :    
24 :     my $html_tail_file = "./Html/html.tail";
25 :     if (! -f $html_tail_file)
26 :     {
27 :     $html_tail_file = "$FIG_Config::fig/CGI/Html/html.tail";
28 :     }
29 :    
30 :    
31 : efrank 1.1 print $cgi->header;
32 : golsen 1.5
33 :     #
34 : golsen 1.6 # The SEED header file goes immediately after <BODY>. Figure out
35 :     # what parts of the HTML document skeleton are there, and fill in
36 :     # missing ones.
37 : golsen 1.5 #
38 : golsen 1.6 # This list should be as comprehensive as feasible:
39 : golsen 1.5 #
40 :    
41 : golsen 1.6 my %head_tag = ( base => 1,
42 :     basefont => 1,
43 :     html => 1,
44 :     isindex => 1,
45 :     link => 1,
46 :     meta => 1,
47 :     nextid => 1,
48 :     style => 1,
49 :     title => 1
50 :     );
51 :    
52 :     #
53 :     # This list need not be comprehensive; it is just stopping conditions:
54 :     #
55 :    
56 :     my %body_tag = ( a => 1,
57 :     br => 1,
58 :     center => 1,
59 :     form => 1,
60 :     h1 => 1,
61 :     h2 => 1,
62 :     h3 => 1,
63 :     hr => 1,
64 :     img => 1,
65 :     p => 1,
66 :     pre => 1,
67 :     table => 1
68 :     );
69 :    
70 :     my $html_line = -1;
71 :     my $head_line = -1;
72 :     my $base_line = -1;
73 :     my $head_end_line = -1;
74 :     my $body_line = -1;
75 :     my $last_head_line = -1; # If no head tags are found, text goes at top.
76 :     my $done = 0;
77 :    
78 :     for ( $i = 0; $i < @$html; $i++ )
79 :     {
80 :     # Some special cases:
81 :    
82 :     if ( $html->[$i] =~ /\<html[^0-9a-z]/i ) { $html_line = $i }
83 :     if ( $html->[$i] =~ /\<head[^0-9a-z]/i ) { $head_line = $i }
84 :     if ( $html->[$i] =~ /\<base[^0-9a-z]/i ) { $base_line = $i }
85 :     if ( $html->[$i] =~ /\<\/head\>/i ) { $head_end_line = $i }
86 :    
87 :     # The content goes after this line:
88 :    
89 :     if ( $html->[$i] =~ /\<body[^0-9a-z]/i )
90 :     {
91 :     $body_line = $i;
92 :     $last;
93 :     }
94 :    
95 :     # Now the general case.
96 :     # Analyze all the html tags on the line:
97 :    
98 :     foreach ( $html->[$i] =~ /\<\/?([0-9a-z]+)/ig )
99 :     {
100 :     # At first body tag, we stop the search and put the text
101 :     # after the last line with a head tag:
102 :    
103 :     if ( $body_tag{ lc $_ } )
104 :     {
105 :     $done = 1;
106 :     last;
107 :     }
108 :    
109 :     # If this is a head tag, then move the marker forward
110 :    
111 :     elsif ( $head_tag{ lc $_ } )
112 :     {
113 :     $last_head_line = $i;
114 :     }
115 :     }
116 :     last if $done; # When done, break loop to avoid increment
117 : efrank 1.1 }
118 : golsen 1.6
119 :     # Some sanity checks on structure:
120 :    
121 :     if ( 1 )
122 : efrank 1.1 {
123 : golsen 1.6 if ( $html_line >= 0 )
124 : efrank 1.1 {
125 : golsen 1.6 if ( ( $head_line >= 0 ) && ( $html_line > $head_line ) )
126 :     {
127 :     print STDERR "<HTML> tag follows <HEAD> tag\n";
128 :     }
129 :     if ( ( $head_end_line >= 0 ) && ( $html_line > $head_end_line ) )
130 :     {
131 :     print STDERR "<HTML> tag follows </HEAD> tag\n";
132 :     }
133 : efrank 1.1 }
134 : golsen 1.6 if ( $head_line >= 0 )
135 : efrank 1.1 {
136 : golsen 1.6 if ( ( $head_end_line >= 0 ) && ( $head_line > $head_end_line ) )
137 :     {
138 :     print STDERR "<HEAD> tag follows </HEAD> tag\n";
139 :     }
140 : efrank 1.1 }
141 :     }
142 :    
143 : golsen 1.6 #
144 :     # Okay. Let's put in the html header file, and missing tags:
145 :     #
146 :     # <BODY> goes after last head line
147 :     #
148 :    
149 :     if ( $body_line < 0 )
150 :     {
151 :     $body_line = $last_head_line + 1;
152 :     splice( @$html, $body_line, 0, "<BODY>\n" );
153 :     }
154 :    
155 :     #
156 :     # Seed page header (if it exists) goes after <BODY>
157 :     #
158 :    
159 :     if ( -f $html_hdr_file )
160 :     {
161 :     splice( @$html, $body_line + 1, 0, `cat $html_hdr_file` );
162 :     }
163 :    
164 :     #
165 :     # </HEAD> goes before <BODY>
166 :     #
167 :    
168 :     if ( $head_end_line < 0 )
169 :     {
170 :     $head_end_line = $body_line;
171 :     splice( @$html, $body_line, 0, "</HEAD>\n" );
172 :     }
173 :    
174 :     #
175 :     # <BASE ...> goes before </HEAD>
176 :     #
177 :    
178 :     if ( $base_line < 0 )
179 :     {
180 :     #
181 :     # Use a relative base address for pages. Also, because I am
182 :     # worried about when FIG_config.pm gets updated (clean installs
183 :     # only, or every update?), I provide an alternative derivation
184 :     # from $cgi_url. -- GJO
185 :     #
186 : olson 1.7 # BASE href needs to be absolute. RDO.
187 :     #
188 :     #
189 :     $base_url = &FIG::cgi_url;
190 :     # my $base_url = $FIG_Config::cgi_base;
191 :     # if ( ! $base_url ) # if cgi_base was not defined
192 :     # {
193 :     # $base_url = $FIG_Config::cgi_url; # get the full cgi url
194 :     # $base_url =~ s~^http://[^/]*~~; # remove protocol and host
195 :     # $base_url =~ m~/$~ || $base_url =~ s~$~/~; # check trailing slash
196 :     # }
197 : golsen 1.6
198 :     $base_line = $head_end_line;
199 :     splice( @$html, $base_line, 0, "<BASE href=\"$base_url\">\n" );
200 :     }
201 :    
202 :     #
203 :     # <HTML> goes at the top of the output
204 :     #
205 :    
206 :     if ( $html_line < 0 )
207 :     {
208 :     $html_line = 0;
209 :     splice( @$html, $html_line, 0, "<HTML>\n" );
210 :     }
211 :    
212 :     #
213 :     # <HEAD> goes after <HTML>
214 :     #
215 :    
216 :     if ( $head_line < 0 )
217 :     {
218 :     $head_line = $html_line + 1;
219 :     splice( @$html, $head_line, 0, "<HEAD>\n" );
220 :     }
221 :    
222 :     #
223 :     # Place FIG search link at bottom of page
224 :     #
225 :    
226 :     my @tail = -f $html_tail_file ? `cat $html_tail_file` : ();
227 : efrank 1.1 if (! $no_home)
228 :     {
229 : golsen 1.6 my $user = $cgi->param('user') || "";
230 :     push( @tail, "<hr><a href=\"index.cgi?user=$user\">FIG search</a>\n" );
231 : efrank 1.1 }
232 :    
233 : golsen 1.6 #
234 :     # Figure out where to insert The SEED tail. Before </body>,
235 :     # or before </html>, or at end of page.
236 :     #
237 :    
238 :     my @tags = ();
239 :    
240 :     for ($i=0; ($i < @$html) && ($html->[$i] !~ /\<\/body\>/i); $i++) {}
241 :     if ($i >= @$html) # </body> not found; look for </html>
242 : efrank 1.1 {
243 : golsen 1.6 push @tags, "\n</BODY>\n";
244 :     # Even if tag is not found, index points to correct place for splice
245 :     for ($i=0; ($i < @$html) && ($html->[$i] !~ /\<\/html\>/i); $i++) {}
246 :     if ($i >= @$html) # </html> not found; add it
247 : efrank 1.1 {
248 : golsen 1.6 push @tags, "</HTML>\n";
249 : efrank 1.1 }
250 :     }
251 : golsen 1.6
252 :     if ( @tail )
253 :     {
254 :     splice( @$html, $i, 0, @tail, @tags );
255 :     }
256 :     elsif ( @tags )
257 :     {
258 :     splice( @$html, $i, 0, @tags );
259 :     }
260 :    
261 : efrank 1.1 print @$html;
262 :     }
263 :    
264 :     sub make_table {
265 :     my($col_hdrs,$tab,$title,$instr) = @_;
266 :     my(@tab);
267 :    
268 : golsen 1.6 push( @tab, "\n<table border>\n",
269 :     "\t<caption><b>$title</b></caption>\n",
270 :     "\t<tr>\n\t\t<th>"
271 :     . join( "</th>\n\t\t<th>", @$col_hdrs )
272 :     . "</th>\n\t</tr>\n"
273 :     );
274 : efrank 1.1 my($i,$nowrap);
275 :    
276 :     for ($i=0; ($i < @$instr) && ($instr->[$i] !~ /nowrap/); $i++) {}
277 :     $nowrap = ($i == @$instr) ? "" : " nowrap";
278 :    
279 : overbeek 1.3 my $row;
280 :     foreach $row (@$tab)
281 : efrank 1.1 {
282 : golsen 1.6 push( @tab, "\t<tr>\n"
283 :     . join( "\n", map { &expand($_,$nowrap) } @$row )
284 :     . "\n\t</tr>\n"
285 :     );
286 : efrank 1.1 }
287 :     push(@tab,"</table>\n");
288 :     return join("",@tab);
289 :     }
290 :    
291 : overbeek 1.3 sub expand {
292 : overbeek 1.4 my($x,$nowrap) = @_;
293 : overbeek 1.3
294 :     if ($x =~ /^\@([^:]+)\:([^:]+)\:(.*)$/)
295 :     {
296 : golsen 1.6 return "\t\t<td$nowrap $1=\"$2\">$3</td>";
297 : overbeek 1.3 }
298 :     else
299 :     {
300 : golsen 1.6 return "\t\t<td$nowrap>$x</td>";
301 : overbeek 1.3 }
302 :     }
303 :    
304 : efrank 1.1 sub ec_link {
305 :     my($role) = @_;
306 :    
307 :     if ($role =~ /(\d+\.\d+\.\d+\.\d+)/)
308 :     {
309 :     return "<a href=\"http://www.genome.ad.jp/dbget-bin/www_bget?ec:$1\">$role</a>";
310 :     }
311 :     else
312 :     {
313 :     return $role;
314 :     }
315 :     }
316 :    
317 :     sub role_link {
318 :     my($cgi,$role) = @_;
319 :    
320 :     my $roleR = ($role =~ /^(\d+\.\d+\.\d+\.\d+)\s+-\s+/) ? $1 : $role;
321 :     my $user = $cgi->param('user');
322 :     if (! $user) { $user = "" }
323 :     my $link = $cgi->url() . "?role=$roleR&user=$user";
324 :     $link =~ s/[a-z]+\.cgi\?/pom.cgi?/;
325 :     return "<a href=$link>$role</a>";
326 :     }
327 :    
328 :     sub fid_link {
329 :     my($cgi,$fid,$local,$just_url) = @_;
330 :     my($n);
331 :    
332 :     if ($fid =~ /^fig\|\d+\.\d+\.([a-z]+)\.(\d+)/)
333 :     {
334 :     if ($local)
335 :     {
336 :     if ($1 eq "peg")
337 :     {
338 :     $n = $2;
339 :     }
340 :     else
341 :     {
342 :     $n = "$1.$2";
343 :     }
344 :     }
345 :     else
346 :     {
347 :     $n = $fid;
348 :     }
349 :     if ($1 ne "peg") { return $n }
350 :     my $user = $cgi->param('user');
351 :     if (! $user) { $user = "" }
352 :     my $trans = $cgi->param('translate') ? "&translate=1" : "";
353 :     my $link = $cgi->url() . "?prot=$fid&user=$user$trans";
354 :     $link =~ s/[a-z_A-Z]+\.cgi\?/protein.cgi?/;
355 :     if ($just_url)
356 :     {
357 :     return $link;
358 :     }
359 :     else
360 :     {
361 :     return "<a href=$link>$n</a>";
362 :     }
363 :     }
364 :     return $fid;
365 :     }
366 :    
367 :     sub family_link {
368 :     my($family,$user) = @_;
369 :    
370 :     return $family;
371 :     }
372 :    
373 :     use URI::Escape;
374 :    
375 :     sub get_html {
376 :     my( $url, $type, $kv_pairs) = @_;
377 :     my( $encoded, $ua, $args, @args, $out, @output, $x );
378 :    
379 :     $ua = new LWP::UserAgent;
380 :     $ua->timeout( 900 );
381 :    
382 :     if ($type =~/post/i)
383 :     {
384 :     $args = [];
385 :     foreach $x (@$kv_pairs)
386 :     {
387 :     push(@$args, ( $x->[0], $x->[1]) );
388 :     }
389 :     my $request = POST $url, $args;
390 :     my $response = $ua->request($request);
391 :     $out = $response->content;
392 :     }
393 :     else
394 :     {
395 :     @args = ();
396 :     foreach $x (@$kv_pairs)
397 :     {
398 :     push( @args, "$x->[0]=" . uri_escape($x->[1]) );
399 :     }
400 :    
401 :     if (@args > 0)
402 :     {
403 :     $url .= "?" . join("&",@args);
404 :     }
405 :     $request = new HTTP::Request('GET', $url);
406 :     my $response = $ua->request($request);
407 :    
408 :     if ($response->is_success)
409 :     {
410 :     $out = $response->content;
411 :     }
412 :     else
413 :     {
414 :     $out = "<H1>Error: " . $response->code . "</H1>" . $response->message;
415 :     }
416 :     }
417 :     # set up a document with proper eol characters
418 :     @output = split(/[\012\015]+/,$out);
419 :     foreach $out (@output) { $out .= "\n"; }
420 :    
421 :     # Now splice in a line of the form <base href=URL> to cause all relative links to work
422 :     # properly. Remove the header.
423 :    
424 :     for ($i=0; ($i < @output) && ($output[$i] !~ /^\s*\</); $i++) {}
425 :     if ($i < @output)
426 :     {
427 :    
428 :     splice(@output,0,$i);
429 :     }
430 :    
431 :     for ($i=0; ($i < @output) && ($output[$i] !~ /\<body\>/i); $i++) {}
432 :     if ($i == @output)
433 :     {
434 :     $i = -1;
435 :     }
436 :     splice(@output,$i+1,0,"<base href=\"$url\">\n");
437 :     return @output;
438 :     }
439 :    
440 :     sub trim_output {
441 :     my($out) = @_;
442 :     my $i;
443 :    
444 :     for ($i=0; ($i < @$out) && ($out->[$i] !~ /^\</); $i++) {}
445 :     splice(@$out,0,$i);
446 :    
447 :     for ($i=0; ($i < @$out) && ($out->[$i] !~ /\<body\>/i); $i++) {}
448 :     if ($i == @$out)
449 :     {
450 :     for ($i=0; ($i < @$out) && ($out->[$i] !~ /\<html\>/i); $i++) {}
451 :     if ($i == @$out)
452 :     {
453 :     $i = -1;
454 :     }
455 :     }
456 :     for ($j=$i+1; ($j < @$out) && ($out->[$j] !~ /^\<hr\>$/); $j++) {}
457 :     if ($j < @$out)
458 :     {
459 :     splice(@$out,$i+1,($j-$i));
460 :     }
461 :    
462 :     for ($i=0; ($i < @$out) && ($out->[$i] !~ /\<\/body\>/i); $i++) {}
463 :     if ($i == @$out)
464 :     {
465 :     for ($i=0; ($i < @$out) && ($out->[$i] !~ /\<\/html\>/i); $i++) {}
466 :     }
467 :    
468 :     for ($j=$i-1; ($j > 0) && ($out->[$j] !~ /FIG search/); $j--) {}
469 :     if ($j > 0)
470 :     {
471 : olson 1.2 my @tmp = `cat $html_tail_file`;
472 : efrank 1.1 my $n = @tmp;
473 :     splice(@$out,$j-$n,$n+1);
474 :     }
475 :     }
476 :    
477 :     sub set_prot_links {
478 :     my($cgi,$x) = @_;
479 :     my($before,$match,$after);
480 :    
481 :     if ($x =~ /^(.*)(fig\|\d+\.\d+\.peg\.\d+)(.*)$/)
482 :     {
483 :     $before = $1;
484 :     $match = $2;
485 :     $after = $3;
486 :     return &set_prot_links($cgi,$before) . &HTML::fid_link($cgi,$match) . &set_prot_links($cgi,$after) . "\n";
487 :     }
488 :     elsif ($x =~ /^(.*)(gi\|\d+)(.*)$/)
489 :     {
490 :     $before = $1;
491 :     $match = $2;
492 :     $after = $3;
493 :     return &set_prot_links($cgi,$before) . &HTML::gi_link($cgi,$match) . &set_prot_links($cgi,$after) . "\n";
494 :     }
495 :     elsif ($x =~ /^(.*)(sp\|[A-Z0-9]{6})(.*)$/)
496 :     {
497 :     $before = $1;
498 :     $match = $2;
499 :     $after = $3;
500 :     return &set_prot_links($cgi,$before) . &HTML::sp_link($cgi,$match) . &set_prot_links($cgi,$after) . "\n";
501 :     }
502 :     elsif ($x =~ /^(.*)(pirnr\|NF\d+)(.*)$/)
503 :     {
504 :     $before = $1;
505 :     $match = $2;
506 :     $after = $3;
507 :     return &set_prot_links($cgi,$before) . &HTML::pir_link($cgi,$match) . &set_prot_links($cgi,$after) . "\n";
508 :     }
509 :     return $x;
510 :     }
511 :    
512 :     sub gi_link {
513 :     my($cgi,$gi) = @_;
514 :    
515 :     if ($gi =~ /^gi\|(\d+)$/)
516 :     {
517 :     return "<a href=http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?cmd=Retrieve&db=Protein&list_uids=$1&dopt=GenPept>$gi</a>";
518 :     }
519 :     return $gi;
520 :     }
521 :    
522 :     sub sp_link {
523 :     my($cgi,$sp) = @_;
524 :    
525 :     if ($sp =~ /^sp\|(\S+)$/)
526 :     {
527 :     return "<a href=http://us.expasy.org/cgi-bin/get-sprot-entry?$1>$sp</a>";
528 :     }
529 :     return $sp;
530 :     }
531 :    
532 :     sub pir_link {
533 :     my($cgi,$pir) = @_;
534 :    
535 :     if ($pir =~ /^pirnr\|(NF\d+)$/)
536 :     {
537 :     return "<a href=http://pir.georgetown.edu/cgi-bin/nfEntry.pl?id=$1>$pir</a>";
538 :     }
539 :     return $pir;
540 :     }
541 :    
542 :    
543 :     1

MCS Webmaster
ViewVC Help
Powered by ViewVC 1.0.3