О проекте «ЯсноВидящий»
Проект «Clear Vision» («Ясновидящий»)
Технологиям распознавания текстовых образов (OCR) уделяется повышенное внимание в среде разработчиков и ученых с начала развития области машинного зрения. Причиной этого является множество сфер их потенциального применения (практическая мотивация), а задача распознавания – одна из классических в контексте искусственного интеллекта (творческая).
Проект «Clear Vision» («Ясновидящий») базируется на перспективном подходе белорусских ученых и программистов к построению универсальных классификаторов текстовых образов с использованием сверхточных нейронных сетей (далее CNN). В его основе лежит формирование комитетов CNN, обученных на образах различного масштаба, с последующей селекцией членов. Результаты экспериментов с использованием стандартных печатных и рукописных баз показали, что созданные классификаторы более эффективны, чем коммерческие системы.
В ходе исследований:
- Накоплен большой объем информации в форме моделей классификаторов, методов выделения признаков.
- Созданы работающие приложения, способные распознавать различные документы (например: система обработки анкет, банковских чеков, пр.). Разработано программное обеспечение для обучения сверхточных нейронных сетей (CNN) распознающих рукописные (и печатные) графические образы символов – цифр, заглавных и строчных букв.
- Проведены эксперименты, показавшие возможность достижения точности распознавания, сравнимой с человеческой на отдельных тестовых множествах.
Достигнута уникальная точность распознавания:
- Тестирование на стандартной базе рукописных цифр MNist 2-й результат в мире – 99.64% распознавания.
- Тестирование на подмножестве заглавных букв стандартной базы латинских букв Nist – лучший, из известных процент распознавания – 98.17%.
- Точность распознавания рукописных символов (латиница) - до 80%.
- Точность распознавания рукописных цифр - >99%.
Функциональные особенности приложения «ClearVision»
- Особый фокус внимания - распознавание не только печатных, но и рукописных символов.
- Решает задачи массового ввода документов (данные анкет, акций и опросов) с отсканированного изображения и проверки правильности введенных данных.
- Может быть встроен в систему управления документооборотом предприятия.
- Обеспечено шифрование информации для защиты персональных данных.
- Возможна реализация офлайн, онлайн, а также облачного приложения.