АРМАДА
Напиши свой генератор текстов!
На страницу Пред.  1, 2, 3, 4  След.
Новая тема Написать ответ

inferno[DGT] + +
Опытный
Зарегистрирован: 22.07.2007
Сообщений: 319
Обратиться по нику
# Добавлено:Пт Ноя 09, 2007 9:41 pmОтветить с цитатой
Пост, конечно, хорош. Но не нужно принимать его за ТЗ. ОГРОМНОЕ кол-во нюансов опущено. С партнером примерно месяцев 6-7 назад решили создать подобную систему генерации. Было перерыто огромное кол-во материала, пробовали, делали. Добились неплохих результатов(еще ни один дор не забанен). Но все равно в системе постоянно что-то меняется, улучшается и оптимизируется. По прочтению сего поста появилось как минимум 2 новые идеи по улучшению генератора.
Content is King. Вацлав, принимай респекты Smile
Выделенные серверы и VPS с абсолютно бесплатным администрированием! Более 11 лет с вами!

ABC
Свой
Зарегистрирован: 17.10.2007
Сообщений: 3
Обратиться по нику
# Добавлено:Сб Ноя 10, 2007 12:24 amОтветить с цитатой
Сколько будет стоить денег заказать такой генератор текстов у программиста?

inferno[DGT] + +
Опытный
Зарегистрирован: 22.07.2007
Сообщений: 319
Обратиться по нику
# Добавлено:Сб Ноя 10, 2007 3:07 amОтветить с цитатой
Тут не в деньгах дело Smile
Программисту нужно знать, что писать. Нужны четкие алгоритмы генерации.
Выделенные серверы и VPS с абсолютно бесплатным администрированием! Более 11 лет с вами!

Sirgey
Опытный
Зарегистрирован: 06.05.2007
Сообщений: 116
Обратиться по нику
# Добавлено:Чт Ноя 15, 2007 2:03 amОтветить с цитатой
По моему нормальный алгоритм, а вы все ругаете потому - что не хотите подать виду.
Вацлав - респект!

Главный вопрос тут - набивка баз и конструкций. Автоматом это сделать нельзя, так как в инглише, как и в русском есть слова которые меняют смысл и часть речи. В результате если автоматом забивать - будут ошибки, если вручную - то долго и будет палиться по общему шаблону предложения.

Имхо, ссылки рулят, а для генерации доров и марков подойдёт.

To inferno[DGT]: хочешь скажу почему не забанено? потому - что по гестам не срали, в топ не вылазили и траф не шёл. Проспамь по гестам/форумам, выйди в топ и получи траф. Забанят.
Мой блог о SEO, водке, фотках и продвижении

FOX
Свой
Зарегистрирован: 11.03.2007
Сообщений: 52
Обратиться по нику
# Добавлено:Вс Dec 30, 2007 10:43 pmОтветить с цитатой
На серджинсе уже двое предоставляют сервис по размножению русскоязычных статей... там из 1 статьи при самом минимальном участии человека делается 1К статей сохраняющих смысл и логичискцую структуру оригинальной, тоесть получаются тексты для людей и поисковики их видят как разные и не клеют. Генерит довольно прилично судя по демкам и отзывам тех кто пользовался. Для английских текстов таких сервисов пока нет к сожалению, я вот лично лучше платил бы за такое размножение стаей чем за пиаристые ссылки.

Hello_Kitty
V.I.P.
Зарегистрирован: 30.04.2007
Сообщений: 10763
Обратиться по нику
# Добавлено:Пн Dec 31, 2007 12:41 amОтветить с цитатой
FOX, дай в личку контакты этих субъектов с серчэнджинса. или топик тот в личку напиши.

BrokenBrake
Бомжевед
Зарегистрирован: 16.02.2007
Сообщений: 3432
Обратиться по нику
# Добавлено:Пн Dec 31, 2007 1:17 amОтветить с цитатой
Насколько я знаю, эти люди размножают статьи полуручным методом. Там не генератор текстов, просто автоматизация некоторых рутинных задач по синонимизации.
Научись ценить время с microToDo
...а работу с рекламодателями автоматизируй!

FOX
Свой
Зарегистрирован: 11.03.2007
Сообщений: 52
Обратиться по нику
# Добавлено:Пт Янв 04, 2008 5:14 pmОтветить с цитатой
Да там насколько я понял с описания на сайте есть часть ручной работы, но учитывая какими масштабами можно ворочать то это просто пыль на сапогах... замутить такое бы под инглыш.. ух

Dark Elf +
V.I.P.
Зарегистрирован: 23.12.2007
Сообщений: 1545
Обратиться по нику
# Добавлено:Сб Янв 05, 2008 2:54 amОтветить с цитатой
Можно прочитать на aot.ru как это на самом деле выглядит с научной точки зрения и даже скачать софт для экспериментов. Это что касается семантики.
Мы делали немножко другой генератор, именно ГЕНЕРАТОР текстов, основанный на алгоритме "Элиза" почти 50-летней давности. А именно на фокусе внимания. Смысл в том, что читая фразу в тексте человек в качестве локального контекста воспринимает только несколько предыдущих фраз и общий контекст. То есть по мере его продвижения по тексту, его фокус внимания скользит вперед. Соответственно, программа, генерирующая текст, должна использовать тот же принцип. Используя систему джокеров, можно генерировать текст вполне релевантный глобальному контексту, хотя и не несущий никакой практической ценности, но вполне связный и читаемый. Более того, использовав модель цифровой ДНК, можно создать популяцию полиморфных зверушек, совершенствующих алгоритм (вернее около 100 его параметров, выступающих в роли генов) для генерации текстов, наиболее удовлетворяющих пожеланиям СЕ. Ограниченно-публичное тестирование алгоритма БОБОТ-666 должно было начаться в середине декабря, даже на паре форумов были набраны тестеры, был сделан официальный сайт (bobot.net.ru), но по некоторым причинам отложено. Результаты жизнедеятельности самой ранней версии лежат здесь dolphin-cafe.narod.ru Это мысли о заработке в Инете Smile
Мой старый блог про адалт-блоги
Тёмные — это те, кто хочет свободы и независимости, не стремятся к власти, не навязывают своих глупых желаний окружающим.

Cabal
Гуру
Зарегистрирован: 20.10.2007
Сообщений: 1360
Обратиться по нику
# Добавлено:Сб Янв 05, 2008 8:59 pmОтветить с цитатой
Dark Elf, весьма кошерно. На человека правда непохоже но это вроде бы даже можно читать.
Cabal - патентованный зануда.

db
Опытный
Зарегистрирован: 04.12.2006
Сообщений: 210
Обратиться по нику
# Добавлено:Вс Янв 06, 2008 3:01 amОтветить с цитатой
Вацлав
Порадовал однако, только слегка поздновато.... я месяц голову ломал как ТЗ програмеру поставить, в итоге поулчился более разширенный вариант... Прогер идею подхватил, в тему въехал, обещал еще нейронку под это дело обучить... бум надеятся получится толковое... Drinks or Beer

Kerk
Профессионал
Зарегистрирован: 30.09.2007
Сообщений: 550
Обратиться по нику
# Добавлено:Вт Янв 08, 2008 6:07 pmОтветить с цитатой
Я распарсил словарь английской морфологии с aot.ru в базу FireBird (вся информация о слове вытаскивается одним SQL-запросом). Подумываю выложить для скачивания, но сомневаюсь, ибо FireBird не особо популярен у веб-мастеров, а в MySQL я не буду переводить из принципа.
Я — лучший программист, хочу поработать Wink

db
Опытный
Зарегистрирован: 04.12.2006
Сообщений: 210
Обратиться по нику
# Добавлено:Вт Янв 08, 2008 6:38 pmОтветить с цитатой
выкладывай в FB, приймем как родненькую )

Rabbit
Кролики - это не только ценный мех
Зарегистрирован: 01.08.2005
Сообщений: 19788
Star (Сумма: 1)
Обратиться по нику
# Добавлено:Ср Янв 09, 2008 10:00 amОтветить с цитатой
db писал(а):
выкладывай в FB, приймем как родненькую )

воть Smile

Словарь английской морфологии
Новое. Прибыльное. Скоро!

alexf2000
Свой
Зарегистрирован: 28.10.2005
Сообщений: 62
Обратиться по нику
# Добавлено:Пт Апр 25, 2008 5:05 pmОтветить с цитатой
Описанный алгоритм будет делать текст, который ничем не отличается от простейшего синонимайзера (http://awt.win32utils.com/synonyms/), текст из него будет вылезать абсолютно нечитаемый. А чтобы он был действительно грамматически верным, надо решить одну небольшую задачку о которой скромно умолчали - определять к какой части речи относится слово в контексте предложения. Один небезизвестный производитель п/о для машинного перевода эту задачку решает уже лет 15, но особых прорывов в качестве машинногоперевода что-то пока не заметно.
Разница с синонимайзером у этого алгоритма только в том, как распределяется работа - для этой реализации нужно сначала набрать базы шаблонов фраз, сами базы слов и потом можно быстро генерить много бреда. А для синонимайзера нужен просто любой текст который потом перекраивается синонимами, базы которых есть в готовом виде. То есть чтобы получить средненький результат, нужно затратить усилия которые лучше пустить в мирных целях - на расстановку ссылок на текст полученный из цепей Маркова. Smile
Самый интересный SEO-блог: http://alexf.name/
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОЛЕЗНЫЕ СТАТЬИ

Перейти:  





Генеральный спонсор



Партнеры