На страницу Пред. 1, 2, 3 |
|
|
Зарегистрирован: 20.10.2007
Сообщ.: 471
|
Обратиться по нику
|
|
alexf2000, данный алгоритм позволяет из грамматически верного осмысленного текста о цветочках сделать грамматически верный не осмысленный(бредовый) текст о собачках на базе заранее заготовленного словаря частей речи. Ничего больше в стартовом посте не написано. По твоему это не возможно? Или будет жраться хуже цепей и хуже обходить фильтры? Задачку превратить текст о цветочках в текст о собачках можно частично решить с помощью словаря общей лексики(смотри ссылку Rabbit), а вот для узко комерческих или эротических тематик понадобится составлять свой словарь и про это тоже написано. Что ты хочешь до нас донести, а то я если честно не совсем понял?..
---добавлено---
То что для шаблонов предложений используется не один текст о цветочках, а несколько предложений из разных текстов я не на секунду не забыл. Просто для полной ясности утрировал. |
|
|
|
|
|
|
Зарегистрирован: 28.10.2005
Сообщ.: 47
|
Обратиться по нику
|
|
Cabal, Объясняю снова, для тех кто не понял. Одно и тоже слово может быть разной частью речи, определить какой именно - не так просто и процент таких слов в языке достаточно высокий. То есть чтобы качественно выполнить пункт первый алгоритма, по замене слов на теги частей речи, надо решить довольно нетривиальную задачу, которая не сводится к простому поиску слова в словаре. Иначе из грамматически верного текста будет получаться грамматически неверный. А значит непонятно, зачем вообще огород городить, качество текста будет таким же как у доргена на цепях Маркова, но при несравнимо больших трудозатратах. Для работы цепей Маркова надо найти хороший исходный текст, причём его нужно не так много, вычистить его от форматирования и прочего мусора и всё, больше ничего не требуется, не нужно никаких дополнительных баз и работать будет с любым языком, где текст в принципе разбивается на слова. Грамматическая правильность кстати вообще непонятная штука, допустим Гугл действительно поумнел и стал банить все грамматически неправильные тексты, что тогда от интернета то останется, кроме энциклопедий и варезных библиотек с Гарри Поттером?
Лучшие результаты получаются у "умных синонимайзеров", учитывающих частотность употребления слов и смысл слов в контексте, правда там уже не всегда можно получить уникальный текст, чтобы без сильных искажений сохранился его смысл. |
|
|
|
|
|
Самый интересный SEO-блог: http://alexf.name/ |
Зарегистрирован: 21.02.2006
Сообщ.: 3193
|
Обратиться по нику
|
|
| Решение, которое я предложил в данной статье и не претендует на создание читабельных текстов. Перечитай внимательно: она предлагает вариант БОЛЕЕ быстрого создания качественного и релевантного бреда, чем это делает марковка. Вопрос в том - важен ли для гугла контент или нет, в данном случае вообще вторичен. Речь в статье идет именно о создании быстрого и простого генератора без специальных знаний математики. |
|
|
|
|
|
Гость, не стесняйся спросить меня о правильной работе с PPC. |
Зарегистрирован: 28.10.2005
Сообщ.: 47
|
Обратиться по нику
|
|
Я внимательно прочитал, были заявлены: 1. большая скорость генерации, 2. лучшее качество генерации, 3. грамматическая верность текста. Из этого ничего не удаётся достичь.
1. Марков в режиме генерации текста работает очень быстро и знаний и умений для его реализации требуется явно меньше, чем для создания каких-то грамматических баз. Математики там нет вообще никакой и даже части речи заучивать не надо.
2. Текст получается нечитаемым во всех случаях и сразу определяется человеком как генерированный.
3. Чтобы грамотно реализовать заявленный тобой алгоритм, который бы сам разбирал любое предложение на части речи - коллективы программистов и лингвистов с учёными степенями работают годами и пока полного успеха достичь не могут. Часть фраз будет случайным образом составлена правильно, но так это и к цепям Маркова относится, там тоже часть полученного текста может оказаться грамматически правильной. |
|
|
|
|
|
Самый интересный SEO-блог: http://alexf.name/ |
Зарегистрирован: 21.02.2006
Сообщ.: 3193
|
Обратиться по нику
|
|
Алекс, ты упрямый зануда
Думаешь кто-то будет против, если ты выдашь свою статью на этот счет и выложишь в Open Source свою версию генератора? |
|
|
|
|
|
Гость, не стесняйся спросить меня о правильной работе с PPC. |
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах
|
|
|
Генеральный спонсор |
|