Главное Авторские колонки Вакансии Вопросы
127 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Как мы за день собрали ИИ-инструмент для проверки сайта на англицизмы, уменьшили человеческий фактор и случайно нашли ошибку, скрывавшую полсайта от поисковиков

Мы в АЙТИФОКС привыкли: если задача выглядит как рутина — значит, её нужно автоматизировать. Когда встал вопрос проверить сайт на иностранные слова, орфографию и грамматику, мы решили сделать это с помощью ИИ-инструмента, а не с помощью редакторов или сторонних сервисов. О том, как мы разработали ИИ за один день ниже.
Мнение автора может не совпадать с мнением редакции

Вы когда-нибудь пробовали вычитать 103 страницы текста вручную? Я — нет. И слава богу. Потому что когда перед нами встала задача проверить сайт на иностранные слова, орфографию и грамматику, я сразу поняла, что руками мы делать этого не будем.

Мы привыкли решать задачи не мышцами, а головой. И когда в России вступил в силу закон об ограничении иностранных слов, мы посмотрели на наш сайт (больше сотни страниц на русском и английском) и сказали: «Давайте автоматизировать».

Спойлер: мы не только справились, но и нашли баг, который пару недель прятал половину нашего контента от поисковиков. И сделали это за день.

Страх рутины: почему мы не хотели делать это руками

Изначально перед нами стояла задача проверки сайта на заимствования в связи с вступлением в силу закона об ограничении иностранных слов с 1 марта 2026 года. Для этого тестировщики выгрузили текст, прогнали через онлайн-сервисы, собрали список и готово.

Но почти сразу мы вернулись с новыми вводными. «Знаете, а давайте теперь проверим ещё и орфографию, и грамматику, и пробелы, и знаки препинания. И не разово, а постоянно. Чтобы система сама по расписанию всё проверяла».

И тогда мы решили: это идеальная задача для разработки решений на базе ИИ. Мы не хотели нанимать внешних подрядчиков и покупать дорогие лицензии. Мы хотели проверить гипотезу: можно ли за день собрать инструмент, который снимет эту головную боль?

Неожиданный поворот: как мы нашли «мёртвую зону» на живом сайте

Тестировщик из нашего сочинского офиса сел за ресёрч. Он выбрал открытый сервис Language Tool и начал писать сценарий на Python. Первый запуск — и мы в шоке: сценарий видит только 30 страниц из 103. Мы начали разбираться, и тут вскрылось то, о чём никто не подозревал.

Оказалось, часть страниц нашего сайта открывалась не по прямой ссылке, а исключительно по клику в браузерном сценарии. Для обычного посетителя это нормально: он кликает по меню и видит контент. Но для робота — поискового или нашего собственного — это мёртвая зона. Робот не может кликнуть на кнопку, он переходит по ссылкам. А раз ссылки нет, то и страницы для него нет.

Дело в том, что мы недавно обновили сайт, и еще не успели проверить доступность всех перенесенных материалов, как результат всё это не индексировалось поисковиками. ИИ проверка сайта вскрыла архитектурную проблему, о которой никто не подозревал. И мы не только починили орфографию, но и спасли видимость сайта.

Поэтому очень важно тестировать свои ИТ-продукты разными способами и на постоянной основе. У нас в компании своя методика тестирования, которая помогает находить критичные баги и держать руку на пульсе.

Как мы собирали конструктор: пошагово, но быстро

Мы решили строить не готовый продукт, а прототип. Потому что для проверки гипотезы не нужна идеальная архитектура и бесконечная масштабируемость. Нужно было одно: доказать, что хаотичный контент можно автоматически проверять и получать структурированный отчёт.

Весь проект вёл один тестировщик. Он и искал инструменты, и писал запросы к нейросети, и отлаживал сценарий. Благодаря автоматизации ИИ разработки мы не подключали серверную команду на этапе прототипа: создание кода с помощью ИИ закрыло рутинную часть, а специалист сфокусировался на логике и проверке результатов.

Этап 1. Обход и сбор данных. Сценарий берёт карту сайта и методично обходит каждый адрес, вытягивая весь текст. Никакого человеческого фактора — робот не забывает страницы и не отвлекается на кофе.

Этап 2. Смысловой анализ. Текст отправляется в Language Tool — это смесь нейросетевого агента и лингвистической базы. Он не просто подчёркивает слова красным, а понимает контекст. Мы добавили белый список разрешённых слов — заимствований, у которых нет аналога в русском языке. Настроили исключения для заголовков без точек. Каждая итерация делала отчёт удобнее и точнее.

Этап 3. Человеческая проверка. В нашем конвейере есть страховочный пояс — человек. Он открывает готовый отчёт и точечно правит ошибки. Разница с ручной вычиткой колоссальная: раньше нужно было прочитать 103 страницы целиком, теперь — проверить 7-10 находок.

Почему ИИ для прототипа — идеальный инструмент

Код сценария написан с помощью ИИ. Тестировщик описывал логику на естественном языке, нейросеть генерировала код. За счёт этого весь прототип собрали за день. Автоматизация ИИ разработки позволила не отвлекать серверную команду на раннем этапе.

Вывод: для быстрого прототипа и проверки предположений создание кода с помощью ИИ — отличный инструмент. За часы можно собрать работающий конвейер. Но для стабильного, масштабируемого корпоративного решения сгенерированный код должен проходить профессиональное ревью.

Что дальше: от прототипа к масштабу

Сейчас мы закладываем встройку в серверную часть. Периодическая задача будет автоматически запускать сценарий раз в месяц и отправлять отчёт на почту. Никаких напоминаний, никакого ручного запуска.

Механика не привязана к заимствованиям. Ту же связку можно адаптировать для контроля терминологии бренда, СЕО-мониторинга, проверки контента на соответствие законам любой страны. Заменили словарь — получили новый инструмент.

Почему мы — команда, которая решит вашу задачу, а не просто напишет код

Мы не обещаем стопроцентной автоматизации там, где это невозможно — встраиваем проверку человеком и белые списки. Мы не гонимся за всеми возможностями сразу — запускаем прототип, проверяем, достраиваем.

И самое главное: мы сами регулярно используем создание кода с помощью ИИ в своей разработке, поэтому понимаем, как должно выглядеть правильное внедрение у заказчика — с честными ограничениями, реалистичными ожиданиями и человеком в контуре.

Если ваш бизнес тонет в ручной проверке контента, а уменьшение человеческого фактора стало критическим — мы можем построить конвейер на основе искусственного интеллекта, который сократит проверку материалов в разы.

Не нужно ждать стопроцентной автоматизации. Достаточно снизить рутину до комфортного уровня с проверкой человеком. И начать этот путь — с быстрого прототипа.

Вот такая история

Я считаю, что ИИ нужно активно использовать при тестировании гипотез. Именно для этого он и создан — чтобы быстро, дёшево и без лишней бюрократии проверить: работает идея или нет? Можно ли заменить недели рутины на 10 минут автоматической проверки? Можно ли сэкономить миллионы, не нанимая внешних подрядчиков? Ответ — да.

Но важно помнить: ИИ для прототипа — это гениальный помощник. ИИ для продакшена — требует команды, которая знает, как его обуздать. Мы в АЙТИФОКС прошли этот путь и знаем, где нейросети экономят месяцы, а где без человека — никуда.

Поэтому мой совет: не бойтесь экспериментировать. Берите свои самые страшные рутинные задачи, набрасывайте прототип с помощью ИИ за день-два и смотрите, что получится. Хуже не будет. А лучше — может стать в разы. Как у нас.

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.