Вообщем пока собирал слова своим парсером, нашёл клёвую утилиту под названием Магадан 1.1 .
Поставил, попробывал, понравилась. Автору за4ёт. Двадцать пять метров потраченого трафа и 50000 слов в кармане. Я его ещё не отклоючил, так что посмотрим может и тыщ сто соберу, чего мелочится то...
Базу собираю для русского адалта. Думаю здесь мне быстрее всего получиться подзаработать, блаог партнёрок на эту тему навалом. После того как Магадан соберёт базу, я загоню её в базу mysql, отсортирую поколичествам запросов и награблю для каждого тексту, прогоняя тексты через алгоритм цепей Маркова. А дальше имея базу с ключевикими и текстами, останется дело за малым, сгенерить на основе всего этого и какого нить шаблона мой первый путёвый дорвей, но об этом позже...
Скачивайте Магадан 1.1 и не запаривайтесь над своими парсерами, нового ничего не изобретёте. Магадан бесплатен, да и работает шустренько.
Вообщем свой путь к дорвеям я начал со сбора своей базы ключевых слов. Разумеется начал с яндекса и его сервисом по определению частоты запросов. За час набросал скрипт на который собирает фразы в базу вместе с количеством, потом будет проще отобрать низкочастотные запросы. Понемногу граблю яндекс, хотя он сопротивляется, ip проксе через которые ведётся граб постоянно банятся.
На данный момент собрано около 3500 запросов, я конечно понимаю что это очень мало, поэтому думаю подсобрать базу хотя бы из 50000 тысяч запросов и начну делать свой первый дорвей.
Теперь когда у меня уже почти есть база ключевиков, осталось то:
1. Напарсить тексту из поисковиков по собраным запросам и пройтись по нему скриптом который пересортирует слова по алгоритмам цепей Маркова
2. Сгенерить, на основе полученных текстов и ключевиков, страницы
3. Разместить дорвей и перенаправить всех на мой TDS, а далее уже буду искать куда пристраивать трафик, если он конечно будет.