Вот уже несколько дней время от времени я запускаю Магадан и собираю ключевики, прога работает без проскей, поэтому получается не очень быстро. Однако я уже преодолел предел в 200 тыщ. Ключевики идут вплоть до 5-6 слов и запросами по 5-50 в месяц, ну бывает и меньше и больше. Потом загоню всю базу в MySQL и фильтрону на шляпу и ВЧ запросы, благо додумался до начала сборов включить галку сохранять вместе с количеством запросов. Думаю пол миллиона я в состоянии напарсить, не кислые будут получаться доры))
Только вот с текстами для доров пока не очень понятно, думаю не буду запариваться сдирать уникальный контент для каждого ключевика, иначе это затянеться не на один месяц(( Долгостроев у меня и так хватает (это отложенные проекты по разным причинам на неопределённое время, так сказать до лучших времён). Нашёл многу тексту, точнее рассказов, которые думаю напарсить собрать в один, и мешаю слова и предложения по алгоритму цепей Маркова, генерить уникальный текст для каждого ключевика. Хорошо бы ещё картинок напарсить и подмешивать в текст, ну так для разнообразия, хотя многие говорят что и не стоит так запариваться.
Вообщем пока собирал слова своим парсером, нашёл клёвую утилиту под названием Магадан 1.1 .
Поставил, попробывал, понравилась. Автору за4ёт. Двадцать пять метров потраченого трафа и 50000 слов в кармане. Я его ещё не отклоючил, так что посмотрим может и тыщ сто соберу, чего мелочится то...
Базу собираю для русского адалта. Думаю здесь мне быстрее всего получиться подзаработать, блаог партнёрок на эту тему навалом. После того как Магадан соберёт базу, я загоню её в базу mysql, отсортирую поколичествам запросов и награблю для каждого тексту, прогоняя тексты через алгоритм цепей Маркова. А дальше имея базу с ключевикими и текстами, останется дело за малым, сгенерить на основе всего этого и какого нить шаблона мой первый путёвый дорвей, но об этом позже...
Скачивайте Магадан 1.1 и не запаривайтесь над своими парсерами, нового ничего не изобретёте. Магадан бесплатен, да и работает шустренько.