понедельник, 24 октября 2011 г.

Урок по Хрумеру номер 4. Играем на опережение.

Данная статья была написана для англоязычного конкурс, организованного Ботмастер Лаб. Для тех, у кого проблема с английским, предлагаю русскую версию статьи You can outdistance competitors with the help of Hrefer


Программный комплекс «Xrumer+Hrefer» просто незаменимая вещь для веб-мастера, не зависимо от того чем он занимается: Black Hat или White Hat SEO. Но как использовать программу с максимальной отдачей? Как добиться большего, чем другие? Мы же ведь хотим быть лучше и успешнее, чем остальные. Да, это так. Но что для этого нужно сделать? Очень просто – научиться выжимать из Xrumer+Hrefer максимум.

Ну, что ж, приступим. Я покажу вам, как можно оказаться во главе пелетона веб-мастеров, играя на опережение остальных. Ведь время – деньги.

А помогать нам в этом будут Hrefer 3.7 и информация о новой версии - Xrumer 7.08 Elite. От Ботмастера мы узнаём, что в версии 7.08 улучшен пробив форумов на движках Yabb and Punbb. Что даёт нам эта информация? А то, что для этого апа программы нам срочно нужно собирать форумы именно на этих движках! Ведь именно на этом повороте мы сможем обойти наших конкурентов! Пока они будут раскачиваться, админы на этих форумах введут дополнительные защиты и все будут снова ждать очередного апа, довольствуясь стандартным пробивом стандартного набора форумов. Поэтому – вперед и как можно быстрее. Будем собирать форумы именно на движках Yabb and Punbb. Остальные форумы мы успеем собрать и пройти в любое время, они не так актуальны сегодня. Итак, что же нам нужно в данный момент? Только Hrefer 3.7 и наша голова. Соберём для начала форумы на движке Yabb.

Открываем браузер и перейдём на сайт этого движка: yabbforum.com/community/ , чтобы детально его рассмотреть.


Тут замечаем, что версия движка, на котором работает форум - YaBB 3.0 Beta. Это нам пригодится в нашей работе, но главная надпись, по которой начнём сбор признаков в футере несколько иная: Powered by YaBB. Именно по данному признаку и начнём работу. Вбиваем запрос в Гугл и смотрим выдачу.
Замечаем, что помимо форумов на движке YaBB нам Гугл даёт ссылки и на форумы YaBB SE, а это немного другой движок, который использует в отличие от простого YaBB базу данных и имеет другие отличия от своего родителя. Xrumer его пробивает, но в данном апе программы про улучшения в работе с ним ничего не говорится, поэтому, если бы мы собирали просто форумы для работы, то его попадание в нашу базу только приветствовалось бы, но мы собираем базу именно под конкретный движок и лишнее нам тут нежелательно. Поэтому модернизируем запрос: "Powered by YaBB" -"yabb se". Всё, теперь всё замечательно. «Широкий» запрос есть, теперь будем добивать «узкими». «Узкие», как правило, дают более «чистые» результаты, поэтому нам нужно сделать упор на них. Ну, во-первых, такими «узкими» запросами будут варианты с различными модификациями движка. Собираем их и проверяем. Результат будет примерно следующим:

"Powered by YaBB" -"yabb se"
"Powered by YaBB 1 Gold - SP1"
"Powered by YaBB 1 Gold - SP 1.1"
"Powered by YaBB 1 Gold - SP 1.2"
"Powered by YaBB 1 Gold - SP 1.3.1"
"Powered by YaBB 1 Gold - SP 1.3.2"
"Powered by YaBB 1 Gold - SP 1.4"
"Powered by YaBB 1 Gold - Release (Yet Another Bulletin Board)"
"Powered by YaBB 2.1"
"Powered by YaBB 2.2"
"Powered by YaBB 2.2.1"
"Powered by YaBB 2.2.2"
"Powered by YaBB 2.2.3"
"Powered by YaBB 2.3"
"Powered by YaBB 2.3.1"
"Powered by YaBB 2.4"
"Powered by YaBB 2.5 AE"
"Powered by YaBB 3.0 Beta"

Когда мы собрали список всех модификаций движков, можно переходить к дополнительным поискам. Открываем какой-нибудь форум YaBB и ищем дополнительные универсальные признаки. Возьмем, например, тот же yabbforum.com/community/:


Находим замечательный запрос в верхней части страницы: «Welcome, Guest. Please Login or Register», а чтобы отсечь ненужное, добавляем к запросу признак yabb. Всё. Есть еще один запрос. Идем дальше. В нижней части страницы находим: «Username, Displayed Name or Email address:». Отлично! И снова добавляем признак yabb, чтобы отсечь возможный «мусор». Рассмотрим еще один форум: www.prismkites.com/cgi-bin/yabb2/YaBB.pl


Интересный раздел «Forum Statistics». Его стоит изучить по-детальнее. Вот, что мы там находим: Our users have made 47359 Posts within 3504 Topics.
View the 10 most recent posts of this forum.
Most Users ever online was 126 on Aug 22nd, 2011, 10:50pm.
Most Members ever online was 13 on Oct 6th, 2008, 11:58am.
Most Guests ever online was 119 on Aug 22nd, 2011, 10:50pm.
Most Search Engines ever online was 29 on Oct 21st, 2009, 7:57am.

 Это просто Клондайк для нас! По этим запросам мы сможем найти море форумов! Но как их правильно переработать для Hrefer? Наврядли мы получим хороший результат, если напрямую «скормим» эти запросу Гуглу. Можете проверить вставив в строку поиска Гугл, например, данный запрос: «Most Users ever online was 126 on Aug 22nd, 2011, 10:50pm». Задачка вроде бы сложная, но решить нам её поможем сам Гугл! Мы знаем, что для облегчения поиска Гугл дает возможность нам пользоваться различными операторами. И если операторы типа inurl для поиска использовать нежелательно, Гугл очень быстро банит за такие запросы, то оператор «*» (про который мало кто знает, а если и знает, то практически не использует в работе) нам будет здесь незаменим, плюс и Гугл лояльно смотрит на его использование серферами! Эврика!

Первая фраза у нас приобретает вид: "Our users have made * Posts within * Topics". Нам только снова нужно добавить к запросу слово yabb. Вот, что у нас получилось:

"View the 10 most recent posts of this forum" yabb
"Most Users ever online was * on * *, 2010, *" yabb
"Most Users ever online was * on * *, 2011, *" yabb
"Most Members ever online was * on * *, 2010, *" yabb
"Most Members ever online was * on * *, 2011, *" yabb
"Most Guests ever online was * on * *, 2010, *" yabb
"Most Guests ever online was * on * *, 2011, *" yabb
"Most Search Engines ever online was * on * *, 2010, *" yabb
"Most Search Engines ever online was * on * *, 2011, *" yabb

В итоге темплейт для парсинга форумов yabb будет выглядеть примерно так:


Может стоит только добавить вот такой ещё запрос: "Baidu (*), Crawler (*), Google (*), Yahoo! (*)" yabb . Как он вам? :)

Ну, и в sieve-filter желательно разместить примерно это:

/yabb/
/yabb.pl
/yabb1/
/yabb2/
/yabb.cgi

Остается еще один не раскрытый вопрос. Как собрать форумы "Powered by YaBB" на языках отличных от английского. Всё очень просто. Покажу это на примере немецкого языка, искать на других языках аналогично. Ну, во-первых, можно выбрать язык German на вкладке Search Engines options & Filter в меню Language в Hrefer. Можно также на этой же вкладке сделать указание Domain / site - .de. Можно в Words database разместить немецкие ключевики. Но это всё равно не позволит нам собрать все именно немецкие форумы на движке YaBB, потому что не все форумы прописывают в футере «Powered by YaBB» с номером версии, а весь контент в них на немецком. Поэтому открываем такой немецкий форум и ищем признаки, присущие именно немецкой версии. Выглядеть это будет примерно так:

"Willkommen, Gast. Bitte Einloggen oder Registrieren" yabb
"Unsere Mitglieder schrieben * Beitrage in * Themen" yabb
 "Die 10 neuesten Beitrage anzeigen!" yabb
 "Größte Anzahl gleichzeitig anwesender Benutzer war * am * um *" yabb
 "Größte Anzahl gleichzeitig anwesender Mitglieder war * am * um *" yabb
 "Größte Anzahl gleichzeitig anwesender Gaste war * am * um *" yabb
и т.д.

Слова в Words database я рекомендую использовать редкие (если вы хотите собрать большую базу), потому что используя популярные ключевики Hrefer будет постоянно перебирать из практически одних и тех же популярных сайтов (ведь согласитесь, что на крупных сайтах обсуждается намного большее количество тем, чем на мелких, и крупные сайты всегда будут в выдаче по популярным запросам). Если же мы будем использовать редкие слова, то мы увеличим охват форумов, неплохо также использовать длинные кейворды под свою нишу, если мы хотим собрать тематичные форумы для «белого» продвижения.

Согласитесь – ничего сложного. Для испанского, французского, даже китайского языка всё будет аналогично. Просто эти простые секреты до этого никто не раскрывал. Попробуйте включить парсинг по тем запросам, которые я вам показал, и вы увидите, какая «чистая» будет база, собранная Hrefer 3.7 самостоятельно. Захотите ли вы после этого тратить деньги и покупать базы собранные кем-то и содержащие 99% «мусора». Я думаю, ответ очевиден.

Всё. Ботмастер подготовил апдейт Xrumer, а мы подготовили базу для работы. Теперь у нас есть все шансы снять сливки: осталось зарегистрировать профиля, пока админы поймут что к чему. :)

Вобщем, самое главное - перестать думать шаблонно и стараться идти на шаг впереди остальных. В этом ключ к успеху.

С Punbb ситуация аналогичная. Попробуйте составить правильные антибановые запросы к Гугл самостоятельно. Если же это вызывает трудности – задавайте вопросы, буду по чуть-чуть приоткрывать завесу. И запомните, ни одна база, которую вы попробуете купить, не будет лучше того, что вы можете собрать сами. Для этого у вас всё есть: замечательный парсер Hrefer 3.7 и ваша голова. Я видел много баз, которые продают и могу сказать, что в основном это мусор, который продают за деньги. :) Вы будете продолжать покупать «мусор»?

Видео 1:


Видео 2:
Если есть вопросы - задавайте.

4 комментария:

xuligan комментирует...

Серёга вот делаю как ты и написал, но выходит спарсить где-то 5-6K yabb, где-то я подозревал, что слова надо подбирать, как ты писал (слова в Words database я рекомендую использовать редкие) собирал разных тем слова хрефером, но всё ровно результат не радует, подскажи, как лучше подбирать слова.

Serge Glazko комментирует...

Прошу прощения за задержку с ответом, в данный момент всё время уходит на новую тему.
По поводу вопроса. Хрефер собирает слова специфически. И это нельзя назвать полноценным собиранием слов по теме.
А вообще, я посоветовал бы еще немного посидеть над теми же форумами ЯББ и попытаться найти побольше признаков. Я в статье привел только часть.
Далее. Я посоветовал бы после сбора по всем доменным зонами пройтись по отдельным. Вот десятка наиболее распространенных в мире: com, net, de, org, ru, uk, info, jp, it, cn.
На эти зоны приходится более 80% всех существующих сайтов. Кроме того, эта информация полезна еще и тем, что в Темплейтс желательно иметь запросы на английском, русском, немецком, японском, итальянском и китайском. Остальные языки постольку-поскольку. Можно, правда, и японский с китайским не брать в расчет. Тут уже, как решите.
Далее. Слова подбираются ручками. Да, долговато, но результат будет. В любом случае, если в хрефере будете подключать доменные зоны, то можете попробовать использовать в аддитив вордс цифры. От нуля и до...
Вобщем, попробуйте поэкспериментировать:
1) с доменными зонами
2) с языками (наиболее распространенные можно спрогнозировать, арабскими и прочими вьетнамскими не увлекайтесь, хрумер текстовые капчи на данных языках практически не побеждает, а там такого добра хватает)
3) с цифрами в адд_вордс при использовании 1) и 2)
4) собрать ручками редкие слова
5) собрать ручкми спам-слова (виагра, гёрл, чип, казино и т.д.) - тут будет с этими словами собираться практически все, где проходят хрумером.
вот вкратце как-то так.

vanyakonevich комментирует...

Спасибо, за статью!
вопрос такой: Будет ли толк от ссылок с немецких форумов, если продвигать сайт в US Google? Будет ли это способствовать продвижению?

Serge Glazko комментирует...

Толк будет и от немецких, и от французских, и от любых других. Но основная масса ссылок все же должна быть с ресурсов сегмента интернета, где вы ведете продвижение.

Отправить комментарий