Главное Авторские колонки Вакансии Вопросы
88 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

ИИ для работы с документами: как мы ускорили обработку сканов смет и спецификаций в 5–7 раз

Представьте: 70% рабочего времени ваших сотрудников уходит не на решение задач, а на механическое переписывание цифр из сканов смет и спецификаций. Одна ошибка в позиции — и срыв поставок и финансовые потери. Мы нашли способ сократить эту рутину в 5–7 раз. Вот как.
Мнение автора может не совпадать с мнением редакции

Сегодня я хочу рассказать про один из наших проектов, где искусственный интеллект сыграл сразу две роли.

Во-первых, мы сами используем ИИ в разработке — для генерации кода, быстрого прототипирования и экономии ресурсов. Мы делаем это регулярно, поэтому на собственном опыте знаем, где нейросети реально полезны, а где без человека не обойтись.

Во-вторых, мы разрабатываем ИИ для заказчика — встраиваем компьютерное зрение и нейросети в его бизнес-процессы. И именно потому, что мы сами прошли путь внедрения, мы чётко понимаем, как должно выглядеть правильное использование ИИ у заказчика: с честными ограничениями, этапом проверки и реалистичными ожиданиями.

Вот как это выглядело в одном из наших проектов.

Краткий обзор

К нам в АЙТИФОКС обратилась российская строительная компания из Москвы. Они работают на рынке промышленного и гражданского строительства. Каждый месяц их операционный блок обрабатывает сотни смет и спецификаций от десятков подрядчиков со всей страны и из-за рубежа. Документы приходят на русском и английском языках. До 70 процентов времени сотрудников уходило на механический ручной перенос данных.

Задача звучала амбициозно: сделать автоматическое распознавание хаотичных сканов смет и спецификаций, чтобы система сама извлекала данные и приводила их к единому корпоративному формату.

Мы начали не с «готового продукта», а с прототипа. Как раз об этом — ниже.

С чего всё началось: ложная гипотеза

Всё выглядело просто: есть ПДФ, в них текст, мы его извлекаем и раскладываем. Но заказчик работал не с «цифровыми» документами, а со сканами — изображениями без текстового слоя. Скопировать текст нельзя, из-за чего сложность выросла кратно.

Так мы поняли: чтобы создать работающий искусственный интеллект для работы с документами, нужно не «прочитать», а «увидеть» и «понять» содержимое.

Задача из рутинной превратилась в исследовательскую. Мы проверили платный сервис за 20 долларов в месяц: границы таблиц он рисовал неплохо, но ошибался в содержании — пропускал цифры, путал надписи. Для процесса, где одна ошибка может потянуть за собой финансовые потери, критически важна автоматизация проверки документов на всех этапах.

Мы решили строить свой пайплайн. Но не полноценную систему с нуля — а быстрый, работающий прототип, чтобы проверить гипотезу и показать заказчику ценность технологии.

Часть первая. Как мы использовали ИИ в собственной разработке

Почему мы начали с прототипа

У заказчика не было жёстких требований к дизайну, удобству интерфейса или масштабируемости на тысячи пользователей. Ему было нужно одно: доказательство, что хаотичные сканы можно автоматически превращать в структурированные таблицы.

Это идеальная ситуация для прототипа. И здесь нам очень помог искусственный интеллект — но уже не в продукте для заказчика, а в самом процессе разработки.

Генерация кода: как мы ускорили создание прототипа

Фронтенд этого прототипа мы построили с помощью генерации кода на Флаттер.

Почему? Потому что для прототипа не требовалась идеальная поддерживаемость кода, сложная архитектура или бесконечная масштабируемость. Нужно было быстро показать заказчику работающий интерфейс: экран загрузки скана, выделение области таблицы, отображение распознанных данных, возможность проверки и кнопка «скачать Эксель».

Наш разработчик описывал интерфейс на естественном языке, искусственный интеллект генерировал код. Это позволило реализовать весь проект силами одного специалиста и сократить время создания прототипа до часов, а не недель.

Заказчик увидел живой, кликабельный прототип уже через несколько дней. Это ускорило сбор обратной связи и подтверждение гипотез.

Что мы поняли про ИИ в разработке

Мы в АЙТИФОКС регулярно используем ИИ для ускорения разработки. И на этом проекте мы ещё раз подтвердили для себя несколько важных вещей.

Где ИИ в разработке реально полезен. Для быстрого прототипирования, для демо, для проверки гипотез — там, где скорость важнее идеальной архитектуры. Он даёт кратный прирост, позволяет собрать работающий интерфейс за часы и показать заказчику ценность ещё до того, как начнётся большая разработка.

Где ИИ в разработке не подходит. Для промышленных систем, которые будут жить годы. Потому что искусственный интеллект не чистит за собой код: дописывает новый поверх старого, не удаляя неиспользуемое. Кодовая база быстро распухает. Разработчик без профильной экспертизы не может оценить качество и заметить неоптимальности.

Наш принцип. Для прототипа — генерация кода. Для продакшена — только профессиональная проверка сгенерированного кода командой. Без этого накапливаются технические ошибки и падает поддерживаемость.

Именно потому, что мы сами используем ИИ в работе, мы понимаем, как правильно внедрять его у заказчика.

Часть вторая. Какой ИИ мы разработали для заказчика

Теперь про сам продукт — конвейер для распознавания документов, который мы построили для строительной компании.

Как устроен конвейер искусственного интеллекта для работы с документами

Этап 1. Извлечение сырых данных

Пользователь загружает изображение и выделяет область с таблицей — на листе могут быть печати, заметки, подписи. Дальше в дело вступает компьютерное зрение: алгоритмы нормализуют картинку, находят строки и столбцы, извлекают текст. Это черновая работа — на выходе просто набор данных, без понимания их смысла. Мы перебрали несколько библиотек оптического распознавания символов, чтобы найти самую точную.

Этап 2. Интеллектуальное сопоставление

Здесь начинает работать нейросеть — ключевой элемент нашего корпоративного искусственного интеллекта для бизнеса. Она получает две сущности: список колонок из входящего документа и список колонок целевой таблицы заказчика. Задача — найти смысловые соответствия.

Пример: «Масса единицы» у поставщика — это «Вес изделия» у заказчика. Или сложнее: «Труба ДН677 600» — это не одна колонка, а две. «Труба» — наименование, «ДН677 600» — техническая характеристика. Нейросеть сама разделяет такие данные и распределяет по нужным полям.

Оркестрация — через LangChain, модели — YandexGPT и GigaChat.

Этап 3. Страховочный пояс: проверка человеком

Мы не обещаем стопроцентной точности — это технологически невозможно, и ни один сервис в мире её не даёт. Поэтому автоматизация проверки документов встроена прямо в интерфейс: пользователь видит, что распозналось, сверяет с исходной картинкой и может поправить ошибки.

Удалить лишнюю строку, переименовать колонку, подставить пропущенное — всё это делается за секунды.

Этап 4. Выгрузка

Пользователь нажимает «подтвердить» и скачивает готовый Эксель в едином корпоративном формате. Время обработки сокращается в 5–7 раз.

Что получилось

Мы показали прототип заказчику. Человек годами делал это руками и был готов, что машина осилит хотя бы 30 процентов — и уже этим сэкономит время. Фактическая точность оказалась значительно выше ожиданий.

Документ, на который раньше уходил час ручного труда, теперь обрабатывается за несколько минут.

Заказчик увидел: можно не переписывать таблицы, а загружать фото и получать готовый результат с возможностью точечной правки.

И да — это был именно прототип. Не «коробочное решение», не «интегрированная система управления предприятием», а быстрое, конкретное доказательство технологии. Именно с него начался путь к полноценной системе.

Почему решение получилось эффективным

Команда АЙТИФОКС не просто написала код под техническое задание. Мы переосмыслили задачу, когда реальность разошлась с ожиданиями.

Первое. Мы вовремя заметили подмену гипотезы. Не стали пилить извлечение текста из ПДФ, когда поняли, что документы — это просто картинки. Переключились на компьютерное зрение.

Второе. Мы не обещали стопроцентной автоматизации. Честно сказали заказчику: искусственный интеллект ошибается. Поэтому встроили этап проверки человеком. Это снижает риски и делает систему пригодной для реального бизнеса.

Третье. Мы использовали генерацию кода для фронтенда прототипа. Это позволило уложиться в одного разработчика и показать результат заказчику за дни, а не за недели. И мы смогли это сделать, потому что сами регулярно работаем с ИИ в разработке и понимаем его сильные и слабые стороны.

Четвёртое. Мы заложили архитектуру под масштабирование. Конвейер не привязан к стройке. Ту же задачу — разнородные документы от разных контрагентов, которые нужно приводить к единому формату — можно адаптировать для логистики, финансов, сферы гостеприимства, гостиничного бизнеса. Меняется только нейросетевой слой под новую модель данных.

Пятое. Мы оставили человека в контуре. Искусственный интеллект делает черновую работу — 80–90 процентов, человек — финальную проверку. Это даёт и скорость, и надёжность.

Ищете команду, которая решит задачу с документами, а не просто напишет код?

Этот кейс показывает, как работает АЙТИФОКС, когда реальность расходится с ожиданиями.

Мы не обещаем стопроцентной автоматизации там, где это невозможно — встраиваем проверку человеком. Мы не берём готовое техническое задание — помогаем сформировать его на основе боли бизнеса. Мы не гонимся за всеми возможностями сразу — запускаем прототип, проверяем, достраиваем. Архитектуру закладываем под масштабирование на другие отрасли — от стройки до логистики.

И самое главное: мы сами регулярно используем ИИ в своей разработке, поэтому понимаем, как должно выглядеть правильное внедрение у заказчика — с честными ограничениями, реалистичными ожиданиями и человеком в контуре.

Если ваш бизнес тонет в хаотичных сканах, сметах и спецификациях от десятков контрагентов — мы можем построить конвейер на основе искусственного интеллекта, который сократит ручной перенос данных в 5–7 раз.

Не нужно ждать стопроцентной автоматизации. Достаточно снизить рутину до комфортного уровня с проверкой человеком.

Расскажите о своей задаче — мы поможем спроектировать решение без переплат и скрытых этапов.

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.