|
|
Iceberg V.I.P. |
Зарегистрирован: 17.03.2010
Сообщений: 12044
|
Обратиться по нику
|
Iceberg |
Ответить с цитатой | | |
|
Компания намерена заняться оцифровкой текстов из печатных СМИ. Новая технология позволит собрать воедино графически разнородные элементы статьи — заголовки, текст и иллюстрации. Изобретение поможет издателям газет и журналов составить электронный архив публикаций.
Статья в печатном журнале — это сложный и графически не однородный материал. Как правило, статья состоит из заголовка и подзаголовков, нескольких колонок текста и иллюстраций, причем все элементы находятся в строгой логической взаимосвязи.
Чтобы перевести статью из печатной формы в цифровую, сначала нужно отсканировать страницу журнала, а потом «распознать» ее с помощью специальной программы. Этот этап — самый сложный, потому что все элементы статьи должны быть расположены в строгой смысловой последовательности. Нельзя, например, поменять местами блоки текста или расположить заголовок посредине статьи.
Технология, предложенная Google, предполагает два этапа распознавания: сегментирование блоков и сегментирование статей. В ходе сегментирования блоков программа разбивает статью на отдельные элементы — текст, заголовки, подзаголовки, картинки, а затем определяет, принадлежат эти элементы к одной статье или к разным, и устанавливает последовательность, в которой они должны быть расположены.
Заявку на патент компания подала в августе 2008 года. Изобретенная Google технология получила название «Сегментирование страниц печатных СМИ в статьи», передает TG Daily. Вероятно, Google будет использовать свое ноу-хау для добавления материалов из журналов и газет в электронную библиотеку Google Books — если удастся договориться с правообладателями.
Источник: ruformator.ru |
|
|
|
|
|
|
icedogas Гуру |
Зарегистрирован: 14.01.2008
Сообщений: 1284
|
Обратиться по нику
|
icedogas |
Ответить с цитатой | | |
|
Им бы еще приделать к такому распознаванию свой собственный поиск - типо бот распознает статью, а где не уверен проверяет в гулгле)) |
|
|
|
|
|
|
zeoman V.I.P. |
Зарегистрирован: 19.03.2008
Сообщений: 3708
|
Обратиться по нику
|
zeoman |
Ответить с цитатой | | |
|
Так недолго и до распознавания речи на улицах, в парках, офисах.... |
|
|
|
|
|
|
|
|
Партнеры
|