АРМАДА
Напиши свой генератор текстов!

На страницу Пред.  1, 2, 3, 4  След.
Новая тема Написать ответ

inferno[DGT]
Опытный
Зарегистрирован: 22.07.2007
Сообщ.: 217
Обратиться по нику
# Добавлено:Пт Ноя 09, 2007 9:41 pmОтветить с цитатой
Пост, конечно, хорош. Но не нужно принимать его за ТЗ. ОГРОМНОЕ кол-во нюансов опущено. С партнером примерно месяцев 6-7 назад решили создать подобную систему генерации. Было перерыто огромное кол-во материала, пробовали, делали. Добились неплохих результатов(еще ни один дор не забанен). Но все равно в системе постоянно что-то меняется, улучшается и оптимизируется. По прочтению сего поста появилось как минимум 2 новые идеи по улучшению генератора.
Content is King. Вацлав, принимай респекты Smile
Выделенные сервера в Европе и США. Самые правильные цены, самое трепетное отношение к клиентам

ABC
Свой
Зарегистрирован: 17.10.2007
Сообщ.: 3
Обратиться по нику
# Добавлено:Сб Ноя 10, 2007 12:24 amОтветить с цитатой
Сколько будет стоить денег заказать такой генератор текстов у программиста?

inferno[DGT]
Опытный
Зарегистрирован: 22.07.2007
Сообщ.: 217
Обратиться по нику
# Добавлено:Сб Ноя 10, 2007 3:07 amОтветить с цитатой
Тут не в деньгах дело Smile
Программисту нужно знать, что писать. Нужны четкие алгоритмы генерации.
Выделенные сервера в Европе и США. Самые правильные цены, самое трепетное отношение к клиентам

Sirgey
Опытный
Зарегистрирован: 06.05.2007
Сообщ.: 116
Обратиться по нику
# Добавлено:Чт Ноя 15, 2007 2:03 amОтветить с цитатой
По моему нормальный алгоритм, а вы все ругаете потому - что не хотите подать виду.
Вацлав - респект!

Главный вопрос тут - набивка баз и конструкций. Автоматом это сделать нельзя, так как в инглише, как и в русском есть слова которые меняют смысл и часть речи. В результате если автоматом забивать - будут ошибки, если вручную - то долго и будет палиться по общему шаблону предложения.

Имхо, ссылки рулят, а для генерации доров и марков подойдёт.

To inferno[DGT]: хочешь скажу почему не забанено? потому - что по гестам не срали, в топ не вылазили и траф не шёл. Проспамь по гестам/форумам, выйди в топ и получи траф. Забанят.
Мой блог о SEO, водке, фотках и продвижении

FOX
Свой
Зарегистрирован: 11.03.2007
Сообщ.: 53
Обратиться по нику
# Добавлено:Вс Dec 30, 2007 10:43 pmОтветить с цитатой
На серджинсе уже двое предоставляют сервис по размножению русскоязычных статей... там из 1 статьи при самом минимальном участии человека делается 1К статей сохраняющих смысл и логичискцую структуру оригинальной, тоесть получаются тексты для людей и поисковики их видят как разные и не клеют. Генерит довольно прилично судя по демкам и отзывам тех кто пользовался. Для английских текстов таких сервисов пока нет к сожалению, я вот лично лучше платил бы за такое размножение стаей чем за пиаристые ссылки.

Hello_Kitty
V.I.P.
Зарегистрирован: 30.04.2007
Сообщ.: 9850
Обратиться по нику
# Добавлено:Пн Dec 31, 2007 12:41 amОтветить с цитатой
FOX, дай в личку контакты этих субъектов с серчэнджинса. или топик тот в личку напиши.
Hello Kitty / Хелло Китти

BrokenBrake
Бомжевед
Зарегистрирован: 16.02.2007
Сообщ.: 3457
Обратиться по нику
# Добавлено:Пн Dec 31, 2007 1:17 amОтветить с цитатой
Насколько я знаю, эти люди размножают статьи полуручным методом. Там не генератор текстов, просто автоматизация некоторых рутинных задач по синонимизации.
Научись ценить время с microToDo
...а работу с рекламодателями автоматизируй!

FOX
Свой
Зарегистрирован: 11.03.2007
Сообщ.: 53
Обратиться по нику
# Добавлено:Пт Янв 04, 2008 5:14 pmОтветить с цитатой
Да там насколько я понял с описания на сайте есть часть ручной работы, но учитывая какими масштабами можно ворочать то это просто пыль на сапогах... замутить такое бы под инглыш.. ух

Dark Elf +
V.I.P.
Зарегистрирован: 23.12.2007
Сообщ.: 1550
Обратиться по нику
# Добавлено:Сб Янв 05, 2008 2:54 amОтветить с цитатой
Можно прочитать на aot.ru как это на самом деле выглядит с научной точки зрения и даже скачать софт для экспериментов. Это что касается семантики.
Мы делали немножко другой генератор, именно ГЕНЕРАТОР текстов, основанный на алгоритме "Элиза" почти 50-летней давности. А именно на фокусе внимания. Смысл в том, что читая фразу в тексте человек в качестве локального контекста воспринимает только несколько предыдущих фраз и общий контекст. То есть по мере его продвижения по тексту, его фокус внимания скользит вперед. Соответственно, программа, генерирующая текст, должна использовать тот же принцип. Используя систему джокеров, можно генерировать текст вполне релевантный глобальному контексту, хотя и не несущий никакой практической ценности, но вполне связный и читаемый. Более того, использовав модель цифровой ДНК, можно создать популяцию полиморфных зверушек, совершенствующих алгоритм (вернее около 100 его параметров, выступающих в роли генов) для генерации текстов, наиболее удовлетворяющих пожеланиям СЕ. Ограниченно-публичное тестирование алгоритма БОБОТ-666 должно было начаться в середине декабря, даже на паре форумов были набраны тестеры, был сделан официальный сайт (bobot.net.ru), но по некоторым причинам отложено. Результаты жизнедеятельности самой ранней версии лежат здесь dolphin-cafe.narod.ru Это мысли о заработке в Инете Smile
Мой старый блог про адалт-блоги
Тёмные — это те, кто хочет свободы и независимости, не стремятся к власти, не навязывают своих глупых желаний окружающим.

Cabal
Гуру
Зарегистрирован: 20.10.2007
Сообщ.: 1362
Обратиться по нику
# Добавлено:Сб Янв 05, 2008 8:59 pmОтветить с цитатой
Dark Elf, весьма кошерно. На человека правда непохоже но это вроде бы даже можно читать.
Cabal - патентованный зануда.

db
Опытный
Зарегистрирован: 04.12.2006
Сообщ.: 211
Обратиться по нику
# Добавлено:Вс Янв 06, 2008 3:01 amОтветить с цитатой
Вацлав
Порадовал однако, только слегка поздновато.... я месяц голову ломал как ТЗ програмеру поставить, в итоге поулчился более разширенный вариант... Прогер идею подхватил, в тему въехал, обещал еще нейронку под это дело обучить... бум надеятся получится толковое... Drinks or Beer

Kerk
Профессионал
Зарегистрирован: 30.09.2007
Сообщ.: 563
Обратиться по нику
# Добавлено:Вт Янв 08, 2008 6:07 pmОтветить с цитатой
Я распарсил словарь английской морфологии с aot.ru в базу FireBird (вся информация о слове вытаскивается одним SQL-запросом). Подумываю выложить для скачивания, но сомневаюсь, ибо FireBird не особо популярен у веб-мастеров, а в MySQL я не буду переводить из принципа.
Я — лучший программист, хочу поработать Wink

db
Опытный
Зарегистрирован: 04.12.2006
Сообщ.: 211
Обратиться по нику
# Добавлено:Вт Янв 08, 2008 6:38 pmОтветить с цитатой
выкладывай в FB, приймем как родненькую )

Rabbit
Кролики - это не только ценный мех
Зарегистрирован: 01.08.2005
Сообщ.: 19879
Star (Сумма: 1)
Обратиться по нику
# Добавлено:Ср Янв 09, 2008 10:00 amОтветить с цитатой
db писал(а):
выкладывай в FB, приймем как родненькую )

воть Smile

Словарь английской морфологии
Гость, а ты знаешь, что теперь для ру-трафика есть отличное решение - Золотая партнерка?
А это мой твиттер!

alexf2000
Свой
Зарегистрирован: 28.10.2005
Сообщ.: 64
Обратиться по нику
# Добавлено:Пт Апр 25, 2008 5:05 pmОтветить с цитатой
Описанный алгоритм будет делать текст, который ничем не отличается от простейшего синонимайзера (http://awt.win32utils.com/synonyms/), текст из него будет вылезать абсолютно нечитаемый. А чтобы он был действительно грамматически верным, надо решить одну небольшую задачку о которой скромно умолчали - определять к какой части речи относится слово в контексте предложения. Один небезизвестный производитель п/о для машинного перевода эту задачку решает уже лет 15, но особых прорывов в качестве машинногоперевода что-то пока не заметно.
Разница с синонимайзером у этого алгоритма только в том, как распределяется работа - для этой реализации нужно сначала набрать базы шаблонов фраз, сами базы слов и потом можно быстро генерить много бреда. А для синонимайзера нужен просто любой текст который потом перекраивается синонимами, базы которых есть в готовом виде. То есть чтобы получить средненький результат, нужно затратить усилия которые лучше пустить в мирных целях - на расстановку ссылок на текст полученный из цепей Маркова. Smile
Самый интересный SEO-блог: http://alexf.name/
Новая тема Написать ответ    ГЛАВНАЯ ~ СТАТЬИ На страницу Пред.  1, 2, 3, 4  След.

Перейти:  

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах




Генеральный спонсор



Партнеры

Rambler's Top100 Рейтинг@Mail.ru Выделенные сервера