Пресс-релизы // » Добавить пресс-релиз

ABBYY FineReader Engine научился классифицировать документы

Москва, 24 октября 2013 года – компания ABBYY® выпустила ABBYY FineReader Engine 11 – новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрихкодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.
Возможности новой версии
• Функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п.
• Улучшена работа с форматом PDF: экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие).
• Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет значительно упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API.
• Предобработка изображений. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшено исправление перекосов и других геометрических искажений, лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки, – при необходимости они могут быть сохранены в финальной версии документа.
• Распознавание визитных карточек. Новый API позволяет извлекать данные из всех полей визитной карточки – ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта – и экспортировать их в CRM-системы или другие программы.
• Улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). Количество ошибок при работе с арабским языком уменьшилось в 2 раза, скорость обработки выросла в 3 раза. Японский язык распознаётся в 2,5 раза быстрее, китайский – в 2,5-4 раза быстрее, корейский – в 3 раза быстрее.
«В новой версии ABBYY FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро «разложить» все документы по типам, - говорит директор по корпоративным проектам ABBYY Россия Дмитрий Шушкин. – Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как ABBYY FlexiCapture. Мы надеемся, новый продукт сможет ещё лучше помогать нашим клиентам в решении их задач».
ABBYY FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов.
ABBYY FineReader Engine 11 – мировой лидер по количеству языков распознавания среди других OCR-продуктов для разработчиков. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (т.е. заполненные от руки формы) – на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка.

Контактное лицо: Юлия Долякова
Компания: ABBYY
Добавлен: 17:01, 24.10.2013 Количество просмотров: 923


HRlink подключил в платформе кадрового ЭДО 4,5 тыс. сотрудников сети аптек «Максавит», HRlink, 00:27, 09.05.2024, Россия69
Федеральная сеть аптек «Максавит» отказалась от бумаги в кадровом делопроизводстве (КДП) и подключила сотрудников к платформе для кадрового ЭДО HRlink.


Тюменский индустриальный университет начнет использовать платформу для транспортного моделирования RITM³ от SIMETRA, Simetra, 00:48, 08.05.2024, Россия153
ГК SIMETRA, центр компетенций в области моделирования транспортных потоков и транспортного планирования, подписала соглашение о сотрудничестве с Тюменским индустриальным университетом (ТИУ) – одним из ведущих вузов региона


В Адыгее спецучреждение оснастят системой видеоинформации, Адыгейское УФАС России, 00:46, 08.05.2024, Россия145
Выявлены нарушения при проведении аукциона спецучреждением в Адыгее


ГК Юзтех и Ассоциация «Нефтегазовый кластер» заключили соглашение о сотрудничестве, ГК Юзтех, 00:46, 08.05.2024, Россия143
ГК Юзтех объявляет о стратегическом партнерстве с Нефтегазовым межрегиональным кластером для совместного развития и внедрения инновационных технологий в нефтегазовой отрасли.


Nubes (НУБЕС) предоставил облако для TravelTech-платформы «Погнали!», Nubes, 00:44, 08.05.2024, Россия140
ИТ-компания «Погнали!» запустила свое решение в облаке нового поколения NGcloud. На облачных ресурсах Nubes разработчик развернул масштабную онлайн-платформу для любителей путешествовать по России, а для хранения большого объема данных подключил сервис объектного хранилища S3.


Студенты платформы OTUS изучат создание хранилищ данных на основе продуктов Arenadata, Arenadata, 00:43, 08.05.2024, Россия138
Образовательная онлайн-платформа OTUS запускает курс «DWH на основе Arenadata». Обучение поможет освоить базовые навыки для успешной работы на проектах по созданию и развитию хранилищ данных и систематизировать уже имеющиеся знания.


Nubes (НУБЕС) предоставил облако для TravelTech-платформы «Погнали!», Nubes, 00:41, 08.05.2024, Россия49
ИТ-компания «Погнали!» запустила свое решение в облаке нового поколения NGcloud. На облачных ресурсах Nubes разработчик развернул масштабную онлайн-платформу для любителей путешествовать по России, а для хранения большого объема данных подключил сервис объектного хранилища S3.


Hybrid открывает собственную школу обучения программатик - специалистов Hybrid AdOps School, Hybrid, 00:41, 08.05.2024, Россия58
Компания Hybrid, специализирующаяся на высокотехнологичных разработках в области интернет-рекламы, запустила собственную школу обучения Ad operation менеджеров. Инициатива направлена на молодых специалистов города Тамбова и позволит со временем ликвидировать дефицит профессионалов в сфере adtech.


Т1 запустил ИТ-лагерь для студентов, Холдинг Т1, 00:39, 08.05.2024, Россия42
Студентов со всей России организаторы соберут на очный буткемп, а лучшим — предложат присоединиться к команде холдинга


Прием заявок на конкурс «Голос жизни» продлевается, Альянс СОНКО, 00:36, 08.05.2024, Россия118
Оргкомитет I Международного творческого конкурса авторов контента в поддержку идеи радикального продления жизни людей «Вместе против старения: голос Жизни» объявляет о продлении сроков приёма творческих работ до сентября 2024 года.


Студенты СПбГАСУ будут учиться моделированию на цифровой платформе RITM³ компании SIMETRA, Simetra, 00:58, 06.05.2024, Россия249
ГК SIMETRA и Санкт-Петербургский государственный архитектурно-строительный университет (СПбГАСУ) заключили соглашение о сотрудничестве. В рамках соглашения SIMETRA поставила вузу академические лицензии на использование в образовательном процессе цифровой платформы RITM³.


HRlink повысил надежность работы сервиса кадрового ЭДО, HRlink, 00:58, 06.05.2024, Россия247
Архитектуру платформы кадрового электронного документооборота (ЭДО) HRlink адаптировали к существенному росту количества пользователей. Кроме того, в 2024 году HRlink первой на рынке решений для безбумажного КДП занялась подключением второго удостоверяющего центра для электронных подписей.


Компания PMP Tech заняла второе место на премии Workspace Digital Awards, PMP Tech, 00:56, 06.05.2024, Россия312
PMP Tech, ведущая IT-компания из Петербурга, заняла второе место на независимой премии Workspace Digital Awards. Компания выдвинулась с кейсом "Мобильное приложение Брелок” в номинации "Недвижимость и строительство" в категории "Мобильные приложения".


В Санкт-Петербурге программные роботы оптимизировали работу Комитета по тарифам, itrend, 00:49, 06.05.2024, Россия241
Комитет по тарифам Санкт-Петербурга оптимизировал ряд своих рабочих процессов за счёт внедрения трех программных роботов. Проект реализовали специалисты Санкт‑Петербургского информационно-аналитического центра.


Efros Defence Operations начал серию совместимостей с оборудования D-Link, Газинформсервис, 00:43, 06.05.2024, Россия76
Специалисты компаний «Газинформсервис» и ООО «Д-Линк Трейд» успешно завершили технические испытания совместимости. Испытания подтвердили корректность функционирования комплекса по защите ИТ-инфраструктуры Efros DefOps с оборудования D-Link серий DGS-1210-XX, DGS-1210-XX/ME, DGS-3130-XX, DGS-3630-XX, DXS-3610-XX.


  © 2003-2024 inthepress.ru