Картинка блога

В статье о том, как искать mp3 в сети я показал пример использования не совсем обычного поиска в Гугле. Способ настолько интересен, что я часто использую его для поиска определенного файла, или например для поиска бэкапов сайтов или просто хранилищ «ушастых» пользователей. Дополнительные параметры чаще всего используются в SEO и хакерами. Просто так, для себя я использовал только фильтр по региону — которого, как ни странно, нет в качестве дополнительного параметра.

Так например, этот способ частично находит проблему переноса исходников SVN на публичный сервер. Как находит их сам Гугл, это уже другой вопрос 🙂

Остаток поста был скопирован с блога SeoNinja. И так, Данный список содержит популярные операторы поисковой системы Google, а также полезные параметры адресной строки.

Операторы строки запроса

Оператор Пример запроса Описание
filetype: продвижение оптимизация filetype:doc Искать файлы только указанного типа (по расширению файла)
site: черный список site:searchengines.ru Искать в пределах сайта или домена (с поддоменами)
inurl: inurl:продвижение Искать страницы со словом в адресе (URL), с русским языком работает нормально
allinurl: allinurl: продвижение сайтов Искать несколько слов в URL страницы
intext: intext:раскрутка Искать слово в тексте (<body>) страницы
allintext: allintext: раскрутка бесплатно Искать несколько слов в тексте (<body>) страницы
intitle: intitle:»Бесплатное продвижение» Искать слово или фразу (в кавычках) в заголовке (<title>) страницы
allintitle: allintitle: Продвижение гарантии Искать несколько слов в заголовке страницы (<title> в html и его аналоги в других типах документов)
inanchor: inanchor:»SEO анализ» Искать несколько слово или фразу в текстах ссылок (<a>)
allinanchor: allinanchor: SEO продвижение Искать несколько слов в анкорах (<a>)
daterange: ePassporte daterange:2454833-2454863 Искать в страницах, проиндексированных в указанный промежуток дней (указывать необходимо Юлианские даты)
related: related:seo.ru Найти похожие (по мнению Google) страницы
info: info:seoninja.ru Показать информацию о странице (если она проиндексирована)
link: link:domain.com Показать список страниц, ссылающихся на указанный документ (URL)
cache: cache:domain.com/page.html Показать версию документа, сохраненного в Google Cache
define: define:идиосинкразия Определение (значение) фразы или слова.

Пояснения и комментарии

filetype:

Вы можете ограничить тип искомого документа, например filetype:doc для Word, filetype:xls для Excel, filetype:pdf для PDF, filetype:ppt для PowerPoint.

Удобный оператор, если вы хотите найти образец какого-либо договора или презентации, чек-лист, заготовку для документа. Наоборот, если не хотите делиться со всем человечеством своими материалами — не вставляйте ссылки на свои документы, иначе они будут проиндексированы и доступны для поиска. Как вариант, закрывайте критичные типы файлов с помощью robots.txt (Disallow: /*.doc$).

Google ничего не знает о реальном типе документа, он ориентируется только на расширение файла/документа. У оператора есть синоним ext, то есть filetype:pdf и ext:pdf делают одно и то же. Важно: не ставьте пробел между двоеточием и расширением!

site:

С помощью этого оператора можно найти что-либо в пределах одного сайта, либо раздела сайта (google site:seoninja.ru/tag/). Если не указывать сам запрос, то Google покажет список всех проиндексированных страниц на сайте, либо домене с под доменами, либо в разделе сайта — что укажете в параметре site. В качестве области поиска можно использовать даже доменную зону (.ru, .co.uk, .gov и так далее). Пробел после двоеточия ставить тоже не надо.

inurl:

Поиск определенного слова в адресе страницы. Пригодно, например, для розыска однотипных приложений, например каталогов (inurl:addurl.pl) по заранее известному названию скрипта. Пробела тоже не надо.

allinurl:

Похоже на оператор inurl, но ищет страницы с несколькими словами в адресе. Как и предыдущий оператор, для осмысленного поиска по словам в рунете менее пригоден, чем для англоязычного сегмента — русский язык в адресах используется мало, а способов perevoda v latinicu больше, чем один, особенно для сложных слов.

intext:

Поиск слова в тексте документа, внутри тега body. Любопытен в комбинации с другими операторами, например intitle:seo -inbody:seo выдаст список страниц с плохой оптимизацией, по крайней мере по слову SEO.

allintext:

Поиск нескольких слов в текстах проиндексированных Гуглом страниц. Принцип тот же, что у allinurl, только область поиска иная.

intitle:

Поиск по заголовкам страниц. Принцип действия, полагаю, уже понятен. Любопытна возможность искать не только html по тегу title, но и по заголовку вордовского файла (intitle:bomb filetype:doc), который находится в свойствах документа (Файл — Свойства).

allintitle:

То же, что intitle, но ищет несколько слов. Например: allintitle:seo dumbest mistake.

inanchor:

Еще одна область для обнаружения искомого слова (или фразы, если в кавычках) — текст ссылки, он же якорь, он же анкор. Учитываются как исходящие ссылки, так и ссылки, ведущие на страницу.

allinanchor:

Тот же inanchor, только для нескольких слов. Поиск wordpress theme allinanchor: free download, теоретически, найдет нам страницу с бесплатными темами для WordPress.

daterange:

Оператор ограничивает область поиска только теми документами, которые были изменены или добавлены в индекс Google в течение указанного промежутка времени. Проблема в том, что промежуток надо указывать в Юлианских датах, например daterange:2455440-2455445 — это поиск с 1го по 6е сентября 2010 года. Перевести Грегорианские даты в Юлианские «дни с начала времен» можно здесь. Менее экзотический способ указать диапазон дат — выбрать ссылку ‘More search tools’ в результатах поиска, там есть набор популярных диапазонов, а также возможность указать свой.

related:

Поиск похожих страниц. Параметром к этому оператору будет адрес (URL) интересующей вас страницы, присутствующей в индексе. Результатом — список похожих страниц в индексе Google.

info:

Запрос info:site.com/path/page покажет, есть ли это страница в индексе, поможет узнать присутствует ли она в кеше Google, посмотреть список ссылающихся страниц и упоминаний — короче, это неплохой стартовый запрос, который несколько обесценивает операторы related, link, cache.

link:

Оператор link позволяет получить список страниц, ссылающихся на интересующую нас страницу, адрес которой необходимо указать после двоеточия. Проблема в том, что Google не позволяет отфильтровать ссылки с какого либо сайта, то есть link:seoninja.ru -site:seoninja.ru работать не будет, равно как и наоборот — нельзя посмотреть ссылки с какого-либо определенного сайта. Кроме этого, этот оператор показывает далеко не все проиндексированные ссылки.

cache:

Оператор cache показывает последнюю сохраненную в кеше Google копию страницы, а также показывает дату сохранения страницы.

define:

Учебно-развлекательный оператор, ищет значение, толкование, определение указанного в запросе слова или выражения. Полезно для устранения пробелов в эрудиции и образовании: define:smite

Параметры в строке запроса

Операторы можно использовать для создания эффективных запросов, но есть вещи, которые можно получить проще (или исключительно) путем подстановки параметров в строку с адресом выдачи Google.

Параметры передаются в виде пар переменная=значение, разделяются амперсандом (&) и начинаются после адреса страницы поиска, после знака вопроса. Порядок следования параметров не важен. Базовый адрес для поиска будет http://google.com/search или http://google.ru/search для рунета.

Параметр в URL Пример Описание
q http://google.com/search?q=путин+калина Самый простой запрос, искомые слова перечислены через +. Это единственный необходимый параметр.
num http://google.com/search?q=калина&num=100 Установить количество результатов на страницу. По-умолчанию Google выдает только 10 результатов, то откровенно мало.
start http://google.com/search?q=сухой&start=990 Показать выдачу, начиная с указанной в параметре позиции
filter http://google.com/search?q=мокрый&filter=0 Включить отображение результатов поиска, которые Google по-умолчанию исключает, ввиду их сильной, по его мнению, похожести. Аналогично нажатию ссылки «repeat the search with the omitted results included» на последней странице выдачи.
pws http://google.com/search?q=синий&pws=0 Выключить «персонализированный поиск». Запрос с добавлением &pws=0 выключает всякую персонализацию и ищет одинаково для всех пользователей, без учета «шлейфа» посещенных сайтов, предыдущих запросов и т.п.
safe http://google.com?q=зеленый&safe=off Выключает (off) или включает (on) безопасный поиск Google. Фильтр убирает из результатов поиска «взрослые» страницы. Бывает любопытно, не попал ли сайт под него.
strip http://google.com/search?q=cache:www.amazon.com&strip=1 Параметр специфичен для запросов к Google Cache. Добавление &strip=1 убирает из отображения картинки, стили, скрипты, которые кеш не хранит, то есть без этого параметра браузер заново обращается за ничи непосредственно на сайт.
imgtype http://google.com/images?q=cheese&imgtype=face Работает только для поска картинок в Google Images. Варианты: face, photo, clipart, lineart, news.

Метки:,

Один комментарий в “Расширенный google поиск”

  1. Как посмотреть список страниц проиндексированных Гуглом с домена БЕЗ учета страниц на поддоменах?