- RU.PERL ----------------------------------------------------------- RU.PERL - Msg : #1568 [757] От : Kirill Solomko 2:5020/400 27 ноября 03, 13:03 Кому : Юрий Жуков 02 декабря 03, 21:05 Тема : Re: Как лучше парсить html? ------------------------------------------------------------------------------- From: Kirill SolomkoЮрий Жуков wrote: > Привет. > > Как вырезать из HTML - часть заключенную в теги? > Конкренто таблицу со всеми потрохами? > > Читаю пока про HTML::Parser, но может кто подскажет ссылочку... Как вариант: #!/usr/bin/perl # use strict; use HTML::Parser; use vars qw($in_table); $in_table = 0; my $p = HTML::Parser->new( api_version => 3, start_h => [\&start, "self,tagname,text"], end_h => [\&end, "self,tagname,text"] ); $p->parse_file(shift) || die $!; sub start { my ($self,$tagname,$text) = @_; $in_table = 1 if $tagname eq 'table'; if ($in_table) { print $text; $p->handler(text => sub { print shift }, "dtext"); } } sub end { my ($self,$tagname,$text) = @_; if ($in_table) { print $text; } if ($tagname eq "table") { $self->eof ; $in_table = 0; print "\n" }; } -- / Loki / --- ifmail v.2.15dev5.1 * Origin: Unknown (2:5020/400)