Home Page - Входная страница портала 'СОЮЗ'
  Новости   Доски объявлений Бизнес-каталог   Трудоустройство     Знакомства     Афиша  
03.12, Вторник
 События
 В Израиле
 Скандалы
 Катастрофы
 Это интересно!
 Про деньги
 Internet & Co
 Из стран исхода
 Криминал
 Культура
 Спорт
 ЗНАКОМСТВА
 Доска  объявлений

 

Новости :: Intertnet & Co ::
Cognitive придумал технологию, которая облегчит подделку документов
Cognitive Technologies намерена вывести на рынок свою технологию оцифровки документов ScanPack, которую отличает от аналогов способность распознавать текст с испорченным фоном. Система обладает интересным побочным эффектом: с ее помощью легко выделить в отдельный слой печати и подписи и использовать их для фальсификации документов.

Отечественный разработчик Cognitive Technologies объявил о скором выводе на рынок системы обработки деловых документов с редкими свойствами - Cognitive ScanPack. Система предназначена для решения традиционных задач: сканирования, обработки и сжатия документов. Однако в ней применены несколько технологических особенностей, которые принципиально отличают ее от существующих аналогов.

Принципиальной новацией ScanPack стали новые алгоритмы анализа изображений. Самыми значимыми свойствами, которые благодаря им появились в системе, в компании называют работу с документами со сложной структурой (большим числом печатей поверх текста) и с испорченным фоном («запачканными, ветхими, с залитой машинным маслом конструкторской документацией»). После обработки в ScanPack документ возвращается в «приемлемом визуальном качестве».

Использование для архивации формата PDF/A позволяет сжать исходный документ до 4-10 раз. В итоговом файле возможен текстовый поиск.

ScanPack автоматизирует процесс оцифровки документации от этапа сканирования до сжатия. В Cognitive полагают, что свойства системы делают ее особенно подходящей для работы с деловыми документами.

Григорий Липич, гендиректор Abbyy Россия, оказался не готов дать оценку технологии Cognitive ScanPack до тестирования, однако, заявил, что «подобные технологии существуют на рынке уже давно». Он говорит, что в продуктах его компании используется технология MRC (Mixed Raster Content), которая позволяет значительно уменьшать размер PDF-файлов и получать итоговые документы небольшого размера с возможностью полнотекстового поиска и сохранением первоначального внешнего вида. Она реализована в инструментарии для разработчика Abbyy FineReader Engine и в системах потокового ввода документов и данных Abbyy FlexiCapture и Abbyy Recognition Server.

При использовании технологии MRC изображение перед сжатием проходит через операцию, называемую «разделение на слои»: в изображении выделяются структурные элементы трех типов (текст, изображения (фото, схемы, диаграммы и пр.) и области, залитые одним и тем же цветом). В дальнейшем эти «слои» обрабатываются алгоритмами сжатия, независимо друг от друга.

Кроме того, в решениях Abbyy применяется технология адаптивного распознавания ADRT (Adaptive Document Recognition Technology), которая позволяет обрабатывать документы со сложным форматированием.

Глава технологической лаборатории Владимир Арлазаров ответил на претеннзию Abbyy, заявив, что формат PFD/A для сжатия изображений и хранения документов в своих продуктах и технологиях действительно используют многие разработчики. При этом применяется технология MRC (Mixed Raster Content), которая является расширением подхода, используемого в формате DjVu. При использовании MRC проводится геометрическая сегментация с использованием технологий распознавания, при которой изображение расслаивается на графические слои (картинка и текст), для которых используются различные алгоритмы сжатия.

По словам Арлазарова, у этого подхода есть серьезный минус: если система не сможет распознать объект (текст на картинке, печать или подпись на печатном тексте, плохое качество ксерокопии, книгу или газету на «желтой» бумаге), то он будет обработан как изображение, что сделает невозможным поиск по нему в итоговом документе.

В Cognitive ScanPack, поясняет Арлазаров, применена цветовая и геометрическая сегментация, которая позволяет выделять в документе несколько «информационных слоев», благодаря чему способна обрабатывать текст при наложении на него печати или подписи, при обводке текста фломастером, при зачеркивании или при сильных «шумах» из-за фона бумаги, артефактов ксерокопирования или жирных пятен.

Разбивка документа на независимые слои важна при работе с документами, в которых фон является значимым, например, при обработке паспортов.

Кроме того, говорит Арлазаров, «методы бинаризации, использованные для восстановления текста ScanPack повышают визуальное качество текста на итоговом документе по сравнению с исходным». После этого каждый информационный слой обрабатывается наиболее эффективным алгоритмом сжатия (текст сжимается в TIFF, изображения, как правило, в JPG).

Вице-президент по маркетингу Cognitive Technologies Николай Никольский утверждает, что продукты на основе ScanPack не будут прямыми конкурентами решениям Abbyy. Владимир Арлазаров добавляет, что, хотя по умолчанию в ScanPack используется ядро распознавания Cuneiform, при желании пользователь сможет подключить к системе Abbyy FineReader.

Интересно, что ScanPack, умеющий распознавать и выделять изображения печатей и подписей, способен упростить возможность фальсификации бумажных документов. Владимир Арлазаров признает, что с появлением на массовом рынке продуктов на основе ScanPack, будет облегчена подделка документов злоумышленниками. Однако, говорит он, она и сейчас вполне доступна всем желающим, освоившим Photoshop.

По словам Арлазарова, разработчики постараются снять опасность злоупотреблений своей технологией, например, путем добавления к итоговому документу водяных знаков или искусственным снижением качества воспроизведенных подписей и печатей.

Как говорят в Cognitive, cейчас система ScanPack используется в двух страховых компаниях - «Цюрих страхование» и «Ренессанс страхование», в Магнитогорском металлургическом комбинате и, насколько известно CNews, используется в силовых структурах (что не подтверждается и не опровергается руководством Cognitive).

Николай Никольский говорит, что решения на основе Cognitive ScanPack будут выведены на массовый рынок в течение 2011 г. Объем отечественного рынка «систем структурного анализа документов» он оценивает как $1 млрд. Оценить глобальный спрос на такие системы он затруднился, однако предположил, что, при практическом отсутствии аналогов, Cognitive ScanPack способен занять существенную долю и на мировом рынке.

Интересно, что ScanPack в значительной степени основан на свободных технологиях: ядро распознавания Cuneiform разработано Cognitive и опубликовано в 2008 г. под свободной лицензией BSD, а PDF/A - это подмножество PDF, стандартизованное в системе ISO. Компоненты распознавания и обработки изображений, как рассказали CNews в Cognitive, напротив, сейчас находятся в процессе патентования.

www.cnews.ru
15.04.2011
Обсудить статью в Форуме ...

  • Купить. Продать. Найти. Доски бесплатных объявлений >>>
  • Реклама в портале Союз - зарабатывай!

     Последние статьи
  • Зеленский послал Россию на три буквы. Как на это отреагировали в Москве?
  • Гладиатор 2 - Хлеб, зрелища и секс
  • Гладиатор 2 - Хлеб, зрелища и секс
  • Хезболла не планирует отправлять боевиков в Сирию
  • Доверие к Зеленскому падает: The Times выяснила причины
  • За что уволили Галанта и назначили Каца?
  • Офицер ШАБАС арестован из-за передачи информации Бен-Гвиру
  • ЦАХАЛ готовит ответный удар по Хезболле
  • Джо Байден помиловал своего сына Хантера
  • Лавров: Москва готова рассмотреть все мирные инициативы по Украине
  •  Последние 10 статей раздела
  • В Amazon объявили о масштабной забастовке
  • Контрабандисты, пойманные с 6000 кг метамфетамина, использовали Starlink Маска
  • Назван последний смартфон Huawei на Android
  • Сотруднику НИИ Минобороны дали 1,5 года за пиратский Windows
  • Стоимость биткойна превысила $99 тыс.
  • Apple готовится к презентации революционной новинки
  • Биткоин пробил отметку $94 тысячи благодаря Трампу
  • 63-летний житель центра страны задержан за публикации в соцсети
  • Ученые создали первую бессмертную муху с оцифрованным мозгом
  • Маск назвал причину провала демократов на выборах в США

  • Новости Израиля и всего мира. Cognitive придумал технологию, которая облегчит подделку документов

  • Новости портала ::
    1+1 СКИДКИ
    НА РЕКЛАМУ
    054-7231651
    Топ 10 месяца
    О лихорадке
    Западного
    Нила
    Еврейское
    население
    Нью-Йорка -
    1,4 миллиона
    Роналду -
    самый
    высокооплачиваемый
    спортсмен
    Изобретено
    извлечение
    золота
    с помощью
    бактерий
    Почему
    дорожают
    продукты
    в Израиле?
    Россиянок
    призвали
    реже имитировать
    оргазм
    В Аргентине
    открыли
    новый вид
    плотоядных
    динозавров
    74-летняя
    женщина
    ограбила
    банк
    Ученые
    обезвредили
    алкоголь
    Как умерла
    актриса
    Анастасия
    Заворотнюк
    Лучшее в Израиле
    - Здоровье
    - Компьютеры
    - Адвокаты
    - Обучение
    - Финансы
    - Автосервис
    - Мебель new
    - Перевозки new
    - Услуги
    - Ремонты
    - Туризм
    - Дом и Семья
    - Животные
    - Дискотеки-Клубы
    - Рестораны
    - Бары и пабы
    - Залы Торжеств
    - Всё для Торжеств
    - Стриптиз +
    - Секс-Клубы
    - Экстрим-спорт
    - Взрослые Игры
    - Бани-сауны
    - Интим-сервис
    Доски объявлений
    - Самое горячее
    - Срочные мивцаим
    - Требуются
    - Работа
    - Куплю
    - Продам
    - Услуги
    - Бизнес
    - Автомобили
    - Квартиры
    - Здоровье
    - Разное
    - Она ищет его
    - Он ищет её
    - Разные Знакомства
     

    Copyright © 2000 Pastech Software ltd Пишите нам: info@souz.co.il