АРМАДА
Google запатентовала технологию распознавания текстов
Новая тема Написать ответ

Iceberg
V.I.P.
Зарегистрирован: 17.03.2010
Сообщений: 2345
Обратиться по нику
# Добавлено:Пт Июл 16, 2010 2:00 pmДобавить в избранноеОтветить с цитатой
Компания намерена заняться оцифровкой текстов из печатных СМИ. Новая технология позволит собрать воедино графически разнородные элементы статьи — заголовки, текст и иллюстрации. Изобретение поможет издателям газет и журналов составить электронный архив публикаций.

Статья в печатном журнале — это сложный и графически не однородный материал. Как правило, статья состоит из заголовка и подзаголовков, нескольких колонок текста и иллюстраций, причем все элементы находятся в строгой логической взаимосвязи.

Чтобы перевести статью из печатной формы в цифровую, сначала нужно отсканировать страницу журнала, а потом «распознать» ее с помощью специальной программы. Этот этап — самый сложный, потому что все элементы статьи должны быть расположены в строгой смысловой последовательности. Нельзя, например, поменять местами блоки текста или расположить заголовок посредине статьи.

Технология, предложенная Google, предполагает два этапа распознавания: сегментирование блоков и сегментирование статей. В ходе сегментирования блоков программа разбивает статью на отдельные элементы — текст, заголовки, подзаголовки, картинки, а затем определяет, принадлежат эти элементы к одной статье или к разным, и устанавливает последовательность, в которой они должны быть расположены.

Заявку на патент компания подала в августе 2008 года. Изобретенная Google технология получила название «Сегментирование страниц печатных СМИ в статьи», передает TG Daily. Вероятно, Google будет использовать свое ноу-хау для добавления материалов из журналов и газет в электронную библиотеку Google Books — если удастся договориться с правообладателями.

Источник: ruformator.ru

icedogas
Гуру
Зарегистрирован: 14.01.2008
Сообщений: 1285
Обратиться по нику
# Добавлено:Пт Июл 16, 2010 3:46 pmОтветить с цитатой
Им бы еще приделать к такому распознаванию свой собственный поиск - типо бот распознает статью, а где не уверен проверяет в гулгле))

zeoman
V.I.P.
Зарегистрирован: 19.03.2008
Сообщений: 3708
Обратиться по нику
# Добавлено:Пт Июл 16, 2010 8:28 pmОтветить с цитатой
Так недолго и до распознавания речи на улицах, в парках, офисах....
BidTraffic - Зарабатывай больше! | Мамин ребёнок | Бросить курить
Новая тема Написать ответ    ГЛАВНАЯ ~ НОВОСТИ ИНТЕРНЕТА

Перейти:  





Генеральный спонсор



Партнеры