Картинка блога

Здесь я уже говорил об одном из способов преобразовать HTML в XML для упрощения дальнейшей работы с ним. Теперь я расскажу еще об одной библиотеке под названием Html Agility Pack.

Архив проекта состоит из исходного кода, документации и нескольких примеров — как конвертировать HTML в текст, RSS или XML.

Вот — небольшой пример использования парсера:

HtmlWeb htmlWeb = new HtmlWeb();
HtmlDocument doc = htmlWeb.Load(«http://www.bbc.co.uk/»);

HtmlNodeCollection links =
doc.DocumentNode.SelectNodes(«//a[@href]»);

foreach (HtmlNode link in links)
{
Response.Write(link.Attributes[«href»].Value + »
«
);
}

Метки:,

2 комментария в “HTML парсинг (parsing).”

  1. Спасибо за информацию! Помогло :).

  2. Спасибо, помогло!