АРМАДА
Нужен парсер + синонимайзер + постер для WP на PHP, $100
Новая тема Написать ответ

Yabuti
V.I.P.
Зарегистрирован: 28.11.2008
Сообщений: 16263
Contest (Сумма: 2)
Обратиться по нику
# Добавлено:Пт Сен 16, 2011 9:39 amДобавить в избранноеОтветить с цитатой
Всем привет!
Задача:
Создать скрипт, который действует следующим образом:

Первый этап:
В файле keyword.txt задается кейворд;
Парсер идет на указанный в настройках тьюб (например xhamster.com) и собирает следующие данные с очередной страницы с видео:

Title (например "Hidden Japanese Shower Uncensored")
Thumb_url (например "http://et7.xhamster.com/t/007/3_b_851007.jpg")
Duration (например "41m37s")
Embed (например "<iframe width="510" height="400" src="http://xhamster.com/xembed.php?video=851007" frameborder="0" scrolling="no"></iframe>")

Второй этап:
Синонимайзер обрабатывает поле:

Title (стало, например, "Spycam Japanese Hot")
Добавляет новое поле:

Description - значение которого берется из файла с дескрипшенами и также синонимизируется. Пример файла с десками: пример.
Причем деск берется только из той категории, к которой относится видео.
Например, в спаршенном тайтле есть слова Hidden, Japanese, Shower, Uncensored. Значит скрипт рандомно берет одно из слов и ищет в десках категорию по этому слову. Если такой категории нет - берет рандомно другое слово - пока не найдет категорию.
Как категорию нашел - берет рандомом один деск и присваивает его значению переменной Description. Затем синонимизирует его и вновь присваивает уже измененное значение (стало, например, "Good asian japanese whore like fuck and deep throating").

Duration - вместо буквы "m" ставит двоеточие ":", букву "s" удаляет. ПОлучается, например "41:37".

Третий этап:
Полученные поля Title, Thumb_url, Duration, Embed, Description публикуются на заданом в настройках блоге.
Можно любым путем:
    XML-RPC-публикация через e-mail;
    Постинг через залогинивание в админку;
    Прямая запись в MySQL.

Спецификация:
Title -> Заголовок поста, тайтл;
Description ->Текст поста;
дополнительные поля:
Thumb_url -> в доп.поле thumb
Duration -> в доп.поле duration
Embed -> в доп.поле video_code
Время публикации - задается в настройках диапазоном (например "01.09.2011-31.12.2012)
Урл поста - ЧПУ, при прямой\RPC-публикации автоматом создается встроенными средствами, при прямой записи в MySQL нужно преобразовывать тайтл в ЧПУ (например "spycam-japanese-hot").

После отправки на публикацию скрипт заносит урл оригинала в old-list.txt, чтобы больше никогда не использовать этот урл (совпадение нового урла для работы ищется в этом списке, чтобы не было дублей постов).

Это был 1 цикл программы. В настройках можно задать количество циклов за 1 запуск и глубину (по-умолчанию, наверное, глубина =2, т.к. при поиске по кею "asian" (http://xhamster.com/search.php?q=asian&qcat=video) скрипту нужно переходить на один уровень внутрь, чтобы спарсить страницу каждого видео).

Присутствует возможность менять домен-получатель контента (мыло для отправки постов для публикации через RPC), менять "донора"-тьюба - указать другой урл и регулярки для экстракции нужных данных.

Синонимайзер - любой сторонний или самопис (есть fantastico, если можно его как-то заюзать, будет гуд).

На выходе получается тьюб на WordPress на embed\iframe-вставках и уникальными тайтлами и дескрипшенами с наличием отложенной публикации.

Цена вопроса = $100.
Время - 2-3 недели.
Оплата по факту - демонстрируется работа скрипта, оплачивается, передается скрипт (исходник, без зендов, ионкубов).

Если есть интерес заняться - пишите сюда, в ЛС, в асю 294292787.
Спасибо
Drinks or Beer
Ксен ВПС и выделенные серверы от PQCService.net с бесплатным администрированием в 7 локациях, icq: 87244588
--
Новая тема Написать ответ    ГЛАВНАЯ ~ РЕКЛАМА И ОБЪЯВЛЕНИЯ

Перейти:  





Генеральный спонсор



Партнеры