Северо-американское отделение компании Panasonic анонсировало ПО PremierOCR, предназначенное для обработки интенсивных потоков сканируемых документов. PremierOCR представляет собой комплексное решение, включающие управление процессами оцифровки документов, оптического распознавания текста, формирования индексируемых файлов в нескольких форматах, в том числе .PDF, .docx и .epub, а также их постобработки . Последнее включает сжатие полученных текстовых и графических файлов, а также оптимизацию Web-файлов .PDF для ускорения обмена документами в системах электронного документооборота и просмотра файлов большого объема.
Благодаря специализированным средствам предварительной обработки отсканированных изображений PremierOCR может с высокой эффективностью распознавать цветные и малоконтрастные текстовые области, штрих-коды и другие типы данных. Такие функции предобработки, как автоматический поворот изображения, удаление пятен, разделение заднего и переднего планов способствуют ускорению дальнейшего процесса распознавания и повышению его надежности. По данным компании, применение усовершенствованных алгоритмов позволяет вести распознавание текста при обработке многостраничных документов практически в реальном времени, а проведенные тесты показали, что результаты распознавания текста, выполненного PremierOCR, оказываются на 5-10% точнее, чем с помощью аналогичных пакетов других производителей. В результате получаемые индексируемые файлы PDF требуют значительно меньше ручной коррекции, а извлечение из них нужных данных осуществляется быстрее. Всего поддерживается распознавание документов на 118 языках.
Использование эффективных методов сжатия данных позволяет существенно снизить объем оцифрованных файлов без потери качества контента (по данным компании, для черно-белых PDF-файлов — от 5 до 10 раз по сравнению с форматом TIFF G4 и для цветных — до 100 раз по сравнению с JPEG). Сжатие данных обеспечивает более быстрый обмен документами в сети, по электронной почте, с мобильными устройствами или в облачных системах.
ПО PremierOCR совместимо с большинством современных систем электронного документооборота.
По информации Московского офиса Panasonic, вопрос о продвижении PremierOCR на российский рынок находится в стадии обсуждения.