RAG-системы для чайников на n8n: пошаговый гайд без кода

Вы слышали про RAG (Retrieval-Augmented Generation), но думаете, что это только для дата-сайентистов с PhD?

Нравится

Send

Мнение автора может не совпадать с мнением редакции

Забудьте. В 2025 году RAG можно собрать за 30 минут — даже если вы не знаете, что такое embedding, а ваш опыт общения с API ограничивается подключением Telegram-бота.

Вот точный рабочий гайд, как настроить свою собственную RAG-систему на n8n — без единой строчки кода, но с реальной пользой для бизнеса.

Что такое RAG — простыми словами

RAG = «ИИ, который отвечает не от балды, а по вашим документам».
Примеры:
— Чат-бот на сайте отвечает на вопросы по вашему прайсу.
— Менеджер в Telegram получает подсказки по условиям доставки из внутреннего регламента.
— Клиент пишет «Как вернуть товар?» — и получает ответ из вашей политики возвратов, а не из общего интернета.

Что вам понадобится

1. n8n (облако или самохостинг — оба варианта работают)
2. Источник знаний: PDF, Google Docs, Notion, база знаний — любой текст
3. Векторное хранилище (мы возьмём бесплатное и простое — Pinecone Free Tier или Weaviate Cloud)
4. LLM (например, OpenRouter, который даёт доступ к Mistral, Llama 3, GPT-4o без прямого OpenAI API)

Шаг 1. Подготовьте данные

Возьмите документы, по которым должен отвечать ИИ:
— Регламенты
— Прайс-листы
— Часто задаваемые вопросы
— Описания услуг

Формат: лучше всего — текст или Markdown. PDF подойдёт, но его нужно сначала распарсить (в n8n есть нода Read PDF).

Совет: разбейте длинный текст на чанки по 300–500 символов — так точнее будет поиск.

Шаг 2. Загрузите документы в векторное хранилище

Как это работает:
Текст превращается в «цифровой отпечаток» (embedding), который система потом сможет искать по смыслу, а не по ключевым словам.

В n8n делаем так:
1. Добавьте ноду HTTP Request → подключитесь к OpenRouter или другому LLM-провайдеру для генерации embedding (например, используйте модель text-embedding-3-small через OpenRouter).
2. Полученные векторы отправьте в Pinecone или Weaviate через их API (есть готовые ноды в n8n).
3. Сохраните метаданные: откуда фрагмент, URL, категория — это нужно для формирования ответа.

✅ Готовый шаблон: n8n.io/workflows — «RAG Ingestion» → ищите по ключевым словам «RAG» или «knowledge base»

Шаг 3. Настройте поиск и генерацию ответа

Теперь, когда база загружена, создаём «мозг»:

1. Пользователь задаёт вопрос (например, через Telegram-бота или веб-форму).
2. n8n получает вопрос → генерирует его embedding тем же способом.
3. Отправляет запрос в Pinecone/Weaviate → получает 2–3 самых релевантных фрагмента из вашей базы.
4. Отправляет эти фрагменты + вопрос в LLM (через OpenRouter) с промптом:
«Ответь на вопрос, используя ТОЛЬКО информацию ниже. Если ответа нет — напиши: „Не знаю, уточните у менеджера.“»

5. Готовый ответ отправляется пользователю (в Telegram, email, веб-чат).

Шаг 4. Подключите вход и выход

Вход:
— Telegram-бот (Telegram Trigger)
— Веб-форма (через Webhook)
— Slack-сообщение

Выход:
— Ответ в том же канале (Telegram Reply, Webhook Response)
— Логирование в Notion или Google Sheets (для анализа, что спрашивают)

Пример из жизни

ИП «Цветочный Дворик» настроил RAG на базе прайса и условий доставки:
— Клиент пишет в Telegram: «Доставите ли букет на Уралмаш завтра до 9 утра?»
— Система ищет в базе: «Уралмаш — зона доставки», «Срочная доставка до 9:00 — +500 ₽»
— Отвечает: «Да, доставим завтра к 9:00. Стоимость срочной доставки — 500 ₽. Подтвердите заказ?»

Результат:
— На 70% меньше вопросов менеджеру
— Конверсия выросла — ответ мгновенный и точный

Сколько это стоит?

— n8n Cloud: от 2 000 ₽/мес (хватит для до 2 500 запросов)
— Pinecone Free Tier: до 1 000 векторов бесплатно
— OpenRouter: ~0,2 ₽ за вопрос (Mistral 7B)
— Ваше время: 30–60 минут на настройку

Что делать прямо сейчас?

1. Соберите 3–5 ключевых документов (FAQ, прайс, условия).
2. Зайдите в n8n io/workflows → найдите шаблон «RAG Starter».
3. Подставьте свои токены (Pinecone, OpenRouter, Telegram).
4. Запустите тест: задайте вопрос — получите ответ из ваших данных.

Важно: Это не «генерация текста». Это точный, контролируемый ИИ, который работает на ваш бренд — без галлюцинаций и без риска ошибиться.

Вы не технарь? Отлично. Ваша задача — дать правильные документы.
Всё остальное — сделает n8n.

P.S. Сохраните это — в будущем ещё не один раз пригодится!

В избр. Сохранено

Нравится