АРМАДА
Чем выдернуть тайтлы и дискрипшены по списку урлов???
Новая тема Написать ответ Advanced Hosters - профессиональный хостинг

GostonP
Опытный
Зарегистрирован: 19.07.2013
Сообщений: 487
Обратиться по нику
# Добавлено:Ср Янв 29, 2014 11:12 amДобавить в избранноеОтветить с цитатой
Подскажите плиз, чем по списку урлов (5К) повыдергивать тайтлы и дискрипшены,что-бы на выходе иметь их в столбик в двух txt файлах, в одном соответственно тайтлы, а в другом дискрипшены ??? :smk:

exolon
V.I.P.
Зарегистрирован: 22.11.2007
Сообщений: 2397
Обратиться по нику
# Добавлено:Ср Янв 29, 2014 1:32 pmОтветить с цитатой
content downloader

или свой скрипт

GostonP
Опытный
Зарегистрирован: 19.07.2013
Сообщений: 487
Обратиться по нику
# Добавлено:Ср Янв 29, 2014 2:23 pmОтветить с цитатой
блин точно, он был у меня где-то, кстати с армады мне скидывали.. ушел искать!
СПС! :smk:
Лью фарму без холда!

banzai
Профессионал
Зарегистрирован: 24.05.2007
Сообщений: 729
Обратиться по нику
# Добавлено:Ср Янв 29, 2014 7:39 pmОтветить с цитатой
тайтлы может и STGrabber повытягивать
Термоядерный спам или интеллектуальный, выбирай самЗло присуще любому скоплению людей

GostonP
Опытный
Зарегистрирован: 19.07.2013
Сообщений: 487
Обратиться по нику
# Добавлено:Сб Фев 01, 2014 11:53 amОтветить с цитатой
Надуюсь у нас тут есть кодеры???
Нашел такой вот говнокод, дергает тайтлы и дикриптион по списку урлов, только что-то с косяками, может кто-то доработает данный код??? думаю многим пригодится!
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...
2)какая-то борода с дискриптион....

Код:

<?php
ob_implicit_flush();
$urls = file("urls.txt");
$file_titles = fopen("titles.txt", "a");
$file_descs = fopen("descriptions.txt", "a");
$pattern1 = "/<title>(.*?)<\/title>/is";
$pattern2 = "/<meta name=(\"|')description(\"|') content=(\"|')(.*?)(\"|')(.*?)>/is";
foreach ($urls as $one_url)
{
    $html = file_get_contents(trim($one_url));
    preg_match($pattern1, $html, $matches);
    fwrite($file_titles, $matches[1]."\n");
    preg_match($pattern2, $html, $matches);
    fwrite($file_descs, $matches[4]."\n");
    echo $one_url . " done.<br />";
}
fclose($file_titles);
fclose($file_descs);
?>



:smk:
Лью фарму без холда!

sawm
V.I.P.
Зарегистрирован: 16.01.2008
Сообщений: 3108
Обратиться по нику
# Добавлено:Вс Фев 02, 2014 11:00 pmОтветить с цитатой
имхо написать под себя за баксов 10 реально
Stimul Cash - лучшее решение для фармы! Smile Все остальные нервно курят в сторонке. Wink

exolon
V.I.P.
Зарегистрирован: 22.11.2007
Сообщений: 2397
Обратиться по нику
# Добавлено:Пн Фев 03, 2014 4:49 pmОтветить с цитатой
GostonP писал(а):
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...


замени fwrite($file_titles, $matches[1]."\n"); на fwrite($file_titles, $matches[1]."\r\n");

И вообще, зачем тебе этот скрипт. Один поток это будет очень долго. Освой лучше тот же content downloader или аналог.

GostonP
Опытный
Зарегистрирован: 19.07.2013
Сообщений: 487
Обратиться по нику
# Добавлено:Вт Фев 04, 2014 1:15 amОтветить с цитатой
exolon писал(а):
GostonP писал(а):
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...


замени fwrite($file_titles, $matches[1]."\n"); на fwrite($file_titles, $matches[1]."\r\n");

И вообще, зачем тебе этот скрипт. Один поток это будет очень долго. Освой лучше тот же content downloader или аналог.



да кинул его сюда - может кому пригодиться!

А так да, content downloader норм! :smk:
Новая тема Написать ответ    ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ

Перейти:  





Генеральный спонсор



Партнеры