RAG-системы для чайников на n8n: пошаговый гайд без кода
Забудьте. В 2025 году RAG можно собрать за 30 минут — даже если вы не знаете, что такое embedding, а ваш опыт общения с API ограничивается подключением Telegram-бота.
Вот точный рабочий гайд, как настроить свою собственную RAG-систему на n8n — без единой строчки кода, но с реальной пользой для бизнеса.
Что такое RAG — простыми словами
RAG = «ИИ, который отвечает не от балды, а по вашим документам».
Примеры:
— Чат-бот на сайте отвечает на вопросы по вашему прайсу.
— Менеджер в Telegram получает подсказки по условиям доставки из внутреннего регламента.
— Клиент пишет «Как вернуть товар?» — и получает ответ из вашей политики возвратов, а не из общего интернета.
Что вам понадобится
1. n8n (облако или самохостинг — оба варианта работают)
2. Источник знаний: PDF, Google Docs, Notion, база знаний — любой текст
3. Векторное хранилище (мы возьмём бесплатное и простое — Pinecone Free Tier или Weaviate Cloud)
4. LLM (например, OpenRouter, который даёт доступ к Mistral, Llama 3, GPT-4o без прямого OpenAI API)
Шаг 1. Подготовьте данные
Возьмите документы, по которым должен отвечать ИИ:
— Регламенты
— Прайс-листы
— Часто задаваемые вопросы
— Описания услуг
Формат: лучше всего — текст или Markdown. PDF подойдёт, но его нужно сначала распарсить (в n8n есть нода Read PDF).
Совет: разбейте длинный текст на чанки по 300–500 символов — так точнее будет поиск.
Шаг 2. Загрузите документы в векторное хранилище
Как это работает:
Текст превращается в «цифровой отпечаток» (embedding), который система потом сможет искать по смыслу, а не по ключевым словам.
В n8n делаем так:
1. Добавьте ноду HTTP Request → подключитесь к OpenRouter или другому LLM-провайдеру для генерации embedding (например, используйте модель text-embedding-3-small через OpenRouter).
2. Полученные векторы отправьте в Pinecone или Weaviate через их API (есть готовые ноды в n8n).
3. Сохраните метаданные: откуда фрагмент, URL, категория — это нужно для формирования ответа.
✅ Готовый шаблон: n8n.io/workflows — «RAG Ingestion» → ищите по ключевым словам «RAG» или «knowledge base»
Шаг 3. Настройте поиск и генерацию ответа
Теперь, когда база загружена, создаём «мозг»:
1. Пользователь задаёт вопрос (например, через Telegram-бота или веб-форму).
2. n8n получает вопрос → генерирует его embedding тем же способом.
3. Отправляет запрос в Pinecone/Weaviate → получает 2–3 самых релевантных фрагмента из вашей базы.
4. Отправляет эти фрагменты + вопрос в LLM (через OpenRouter) с промптом:
«Ответь на вопрос, используя ТОЛЬКО информацию ниже. Если ответа нет — напиши: „Не знаю, уточните у менеджера.“»
5. Готовый ответ отправляется пользователю (в Telegram, email, веб-чат).
Шаг 4. Подключите вход и выход
Вход:
— Telegram-бот (Telegram Trigger)
— Веб-форма (через Webhook)
— Slack-сообщение
Выход:
— Ответ в том же канале (Telegram Reply, Webhook Response)
— Логирование в Notion или Google Sheets (для анализа, что спрашивают)
Пример из жизни
ИП «Цветочный Дворик» настроил RAG на базе прайса и условий доставки:
— Клиент пишет в Telegram: «Доставите ли букет на Уралмаш завтра до 9 утра?»
— Система ищет в базе: «Уралмаш — зона доставки», «Срочная доставка до 9:00 — +500 ₽»
— Отвечает: «Да, доставим завтра к 9:00. Стоимость срочной доставки — 500 ₽. Подтвердите заказ?»
Результат:
— На 70% меньше вопросов менеджеру
— Конверсия выросла — ответ мгновенный и точный
Сколько это стоит?
— n8n Cloud: от 2 000 ₽/мес (хватит для до 2 500 запросов)
— Pinecone Free Tier: до 1 000 векторов бесплатно
— OpenRouter: ~0,2 ₽ за вопрос (Mistral 7B)
— Ваше время: 30–60 минут на настройку
Что делать прямо сейчас?
1. Соберите 3–5 ключевых документов (FAQ, прайс, условия).
2. Зайдите в n8n io/workflows → найдите шаблон «RAG Starter».
3. Подставьте свои токены (Pinecone, OpenRouter, Telegram).
4. Запустите тест: задайте вопрос — получите ответ из ваших данных.
Важно: Это не «генерация текста». Это точный, контролируемый ИИ, который работает на ваш бренд — без галлюцинаций и без риска ошибиться.
Вы не технарь? Отлично. Ваша задача — дать правильные документы.
Всё остальное — сделает n8n.
P.S. Сохраните это — в будущем ещё не один раз пригодится!