Картинка блога

В Wikipedia есть список доменов. Но хранится он в таблице с дополнительными полями. В ручную вытаскивать эти данные лень, но получить список нужно. Что делать? В очередной раз спасет JavaScript Shell Bookmarklet. На странице Wikipedia не используется JQuery. Зато google libraries api хранит всегда свежую и доступную версию. Это своего рода CDN, который можно использовать в своих проектах. В итоге, проблема решается в два шага:

  • Загружаем JQuery: load(‘http://ajax.googleapis.com/ajax/libs/jquery/1.4.2/jquery.min.js’)
  • Выполняем выборку: $(‘.wikitable tr td:first-child’).each(function(){print($(this).text());});

Или получаем список в формате select:


$('.wikitable tr').each(function(){if($('td:nth-child(1)',this).text()) {print('<option value="'+$('td:nth-child(1)',this).text().substr(1)+'" name="'+$('td:nth-child(2)',this).text().trim()+'">');}});

Метки:, ,

5 комментариев в “Получаем список доменов первого уровня из Wikipedia”

  1. А зачем вам эти домены?

  2. Есть способ проше и без программирования. :)
    В фаерфоксе откраваем страничку, зажимаем контрл и выделяем мышкой столбец с доменными зонами, ctrl-c, ctrl-v.

  3. Да, видимо я не сторонник легких путей ;)
    С другой стороны, программный способ позволяет получить данные в более чистом формате, или даже отфильтровать.

  4. Igor, спасибо, незнал. Приходилось чуть что парсеры писать, хотя в большинстве случаев можно копипастом обходиться.

  5. придумали конечно применение))

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>