Картинка блога

В Wikipedia есть список доменов. Но хранится он в таблице с дополнительными полями. В ручную вытаскивать эти данные лень, но получить список нужно. Что делать? В очередной раз спасет JavaScript Shell Bookmarklet. На странице Wikipedia не используется JQuery. Зато google libraries api хранит всегда свежую и доступную версию. Это своего рода CDN, который можно использовать в своих проектах. В итоге, проблема решается в два шага:

  • Загружаем JQuery: load(‘http://ajax.googleapis.com/ajax/libs/jquery/1.4.2/jquery.min.js’)
  • Выполняем выборку: $(‘.wikitable tr td:first-child’).each(function(){print($(this).text());});

Или получаем список в формате select:


$('.wikitable tr').each(function(){if($('td:nth-child(1)',this).text()) {print('<option value="'+$('td:nth-child(1)',this).text().substr(1)+'" name="'+$('td:nth-child(2)',this).text().trim()+'">');}});

Метки:, ,

5 комментариев в “Получаем список доменов первого уровня из Wikipedia”

  1. А зачем вам эти домены?

  2. Есть способ проше и без программирования. 🙂
    В фаерфоксе откраваем страничку, зажимаем контрл и выделяем мышкой столбец с доменными зонами, ctrl-c, ctrl-v.

  3. Да, видимо я не сторонник легких путей 😉
    С другой стороны, программный способ позволяет получить данные в более чистом формате, или даже отфильтровать.

  4. Igor, спасибо, незнал. Приходилось чуть что парсеры писать, хотя в большинстве случаев можно копипастом обходиться.

  5. придумали конечно применение))