Картинка блога

Здесь я уже говорил об одном из способов преобразовать HTML в XML для упрощения дальнейшей работы с ним. Теперь я расскажу еще об одной библиотеке под названием Html Agility Pack.

Архив проекта состоит из исходного кода, документации и нескольких примеров — как конвертировать HTML в текст, RSS или XML.

Вот — небольшой пример использования парсера:

HtmlWeb htmlWeb = new HtmlWeb();
HtmlDocument doc = htmlWeb.Load(«http://www.bbc.co.uk/»);

HtmlNodeCollection links =
doc.DocumentNode.SelectNodes(«//a[@href]«);

foreach (HtmlNode link in links)
{
Response.Write(link.Attributes["href"].Value + »
«
);
}

Метки:,

Один комментарий в “HTML парсинг (parsing).”

  1. Спасибо за информацию! Помогло :) .

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>