Главное Авторские колонки Вакансии Вопросы
83 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Добавил второй AI-движок в сервис проверки договоров — нашёл в 2.5 раза больше рисков

Пару недель назад рассказывал, как сделал сервис проверки договоров на YandexGPT. Работало, но вылезли проблемы: ложные срабатывания и пропуски реальных рисков. Добавил Claude (AI от Anthropic) как второй движок — он нашёл в 2.5 раза больше рисков на том же договоре. Рассказываю, что изменилось.
Мнение автора может не совпадать с мнением редакции

Что было не так

YandexGPT — хорошая модель, но на юридических текстах случались фейлы:

Ложные срабатывания. Модель писала «асимметрия пеней: Покупатель 0.1%, Поставщик 0.1%». Подождите — 0.1% vs 0.1% это симметрия, не асимметрия. Просто галлюцинация.

Пропуски. В договоре было «1% за каждый день просрочки, но не более 2%». Модель увидела cap «не более 2%» и решила, что всё норм. А 1% в день — это 365% годовых, кабальное условие.

Противоречия между пунктами. П. 4.4 говорит «только самовывоз», п. 6.2 — «доставка транспортной компанией». YandexGPT не замечал.

Решение: два слоя проверки

Сделал двухслойную архитектуру:

Слой 1 — AI-анализ. Теперь можно выбрать: YandexGPT (дешевле) или Claude (точнее). Оба анализируют текст, ищут риски.

Слой 2 — проверка кодом. 25+ детекторов на конкретные паттерны. Код проверяет математику: вычисляет соотношение пеней, переводит «1% в день» в годовую ставку, сравнивает условия для разных сторон.

Если AI сказал «асимметрия», а код посчитал соотношение 1:1 — флаг отбрасывается. Меньше мусора в отчёте.

Тест: один договор, две модели

Прогнал договор поставки через оба движка:

YandexGPT: 11 рисков (2 критических, 4 высоких) Claude: 27 рисков (5 критических, 12 высоких)

Claude нашёл в 2.5 раза больше.

Что он поймал, а YandexGPT нет:

  1. Неустойку 1%/день (365% годовых) — YandexGPT отвлёкся на cap
  2. Противоречие между пунктами о доставке
  3. Короткий срок ответа на антикоррупционный запрос (10 дней — мало для серьёзной проверки)

Почему Claude лучше для договоров

По моим наблюдениям:

  1. Контекст 200K токенов — видит связи между пунктами на разных страницах
  2. Лучше reasoning — понимает юридическую логику, а не просто ищет ключевые слова
  3. Меньше галлюцинаций — реже выдумывает несуществующие риски

Как это выглядит для пользователя

Два режима:

  1. «Эконом» — YandexGPT, 299₽, быстро
  2. «Глубокий анализ» — Claude, 499₽, находит больше

Загружаешь договор → выбираешь режим → через 1-2 минуты получаешь отчёт с рисками, цитатами из договора и ссылками на ГК РФ.

Экономика

Себестоимость выросла — Claude дороже YandexGPT примерно в 2 раза на токенах. Но и цена выше (499 vs 299), так что маржинальность сохраняется.

Для пользователя всё равно копейки по сравнению с юристом:

Юрист: 1-5 дней, 15-50К ₽ Сервис: 1-2 минуты, 299-499 ₽

Компания с 10 договорами в месяц экономит ~200К/месяц.

Что дальше

  1. Больше детекторов — сейчас 25+, планирую 40+
  2. API для интеграций — чтобы встраивать в CRM и документооборот
  3. Подписка для бизнеса — безлимит на проверки за фикс в месяц

Выводы

  1. Одной модели недостаточно — нужна валидация кодом
  2. Claude реально лучше для сложных текстов, разница заметная
  3. Двухслойная архитектура (AI + код) убирает и ложные срабатывания, и пропуски

Попробовать: legalparser.ru — 2 бесплатных анализа при регистрации.

Вопросы — в комментариях.

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.