редакции
Строка — платформа поиска компаний в РФ
Что сейчас есть на рынке
Давайте пройдемся по инструментам. Допустим, нам нужно найти 1000 компаний для валидации идеи (например, «поставщики медицинского оборудования» или «подрядчики монолитных работ»).
- Ручной поиск (карты, поисковики). Медленно, больно, неэффективно. Собрать контакты с 2GIS или Яндекс.Карт вручную — это дни и недели работы менеджера.
- Парсинг. Нужно уметь писать код или нанимать фрилансера. Часто в релевантных каталогах данные не обновляются, компании размещаются единоразово и потом висят там годами без обновлений.
- Покупка готовых баз. Часто это «кот в мешке». Базы устаревают быстрее, чем вы успеваете их купить. Компания прекратила деятельность полгода назад, а в таблице она все еще «жива» и сайт рабочий, но ведет на условное онлайн-казино.
- Классификаторы по ОКВЭД. Это отдельная боль. Компания может заниматься разработкой ПО, а по документам проходить как «Оптовая торговля прочими товарами». Искать клиентов строго по кодам деятельности — значит упускать половину рынка или звонить тем, кто вам не нужен.
Данные из налоговой:
Всего компаний с сайтами ~600.000 Действующих юридических лиц: ~8.000.000
Так что реальный факт — сегодня в существующих решениях используется лишь малая часть данных. Если даже взять данные из 2Gis и убрать дубликаты филиалов, то получится ~1.000.000 компаний с сайтами.
Решение: AI + российский бизнес
Я решил подойти к проблеме с другой стороны. Не смотреть на то, с какими данными компания зарегистрирована, а смотреть на то, чем она реально занимается.
И создал Строку — платформу поиска компаний в РФ, где данные структурируются / обогащаются с помощью искусственного интеллекта.
Идея простая: необязательно знать код ОКВЭД вашего клиента. Вам нужно просто написать, кого ищете. Потому что компания уже предоставила данные какую продукцию продает и какие услуги оказывает.
Как это работает
Мы проиндексировали почти весь Рунет и собрали большой массив данных из открытых источников, — у нас теперь максимум доступных компаний и организаций в РФ. Но эти данные бесполезны без структуры.
Что мы сделали? Вложив десятки миллиардов токенов и миллионы запросов — мы скормили их нейросетям, получив следующее:
- Классифицировали бизнес по реальной деятельности компаний — получили краткое описание.
- Потом снова классификация, но уже по ключевым словам — теперь у нас есть возможность фильтрации по ключам.
- Далее мы запустили реранжирование / обогащение данных с помощью различных моделей — получили сектора, векторные представления (чтобы поиск работал по смыслу)
- И многие другие данные
В итоге у нас получилась база на 2.400.000+ компаний, где более 80% имеют контактные данные, со всех регионов РФ.
Киллер-фича: поиск на естественном языке
Это то, ради чего всё затевалось. Чтобы можно было забыть про фильтры и галочки в ограниченном списке ОКВЭДов и сегментов. Вы делаете запрос так, как будто просто ищете нужные компании:
- «Венчурные фонды»
- «Выведи заводы металлоконструкций»
- «Салоны красоты эконом-класса»
Система понимает семантику запроса и выдает релевантный список. Это позволяет находить узкие сегменты, которые невозможно выцепить через стандартные классификаторы.
Что можно делать в Строке уже сейчас:
Альфа-версия поиска уже работает. Вот основные сценарии использования:
- Поиск релевантных компаний в B2B. Находите новые сегменты клиентов за минуты, выгружайте данные в удобном формате и загружайте их в свою CRM.
- Анализ рынка. Исследуйте конкурентов. Кто еще работает в вашей нише?
- Поиск поставщиков. Нужно найти, где закупать сырье? Введите запрос и получите список реальных производств.
Монетизация
Мы работаем по модели подписки, чтобы поддерживать актуальность данных и оплачивать мощности AI. Но мы стараемся держать тарифы доступными для малого бизнеса, потому что сами знаем, как дорого стоит привлечение клиента.
Планы
Важно учитывать, что сейчас — альфа-версия, у нас не реализовано много полезных вещей, не все работает идеально и есть некоторые недоработки, но мы активно работаем и в будущем можно ожидать:
- Улучшение точности данных. У нас есть грамматические ошибки, слишком короткие описания, неточности в названиях — это бесконечный процесс улучшения, над которым мы работаем.
- Актуализация данных. Сейчас данные достаточно свежие, но планируем добавить регулярную перепроверку данных ai-агентами и/или по запросу.
- Расширение функционала. Сейчас мы сделали базовый функционал, и хотим в будущем добавить чтобы весь цикл работы с данными был внутри Строки, то есть чтобы можно было не выгружать данные, а дорабатывать/обогащать их внутри платформы, добавляя новые колонки и используя AI для формирования новых срезов данных на основе нашего индекса.
- API для интеграции с CRM-системами и другими дата-провайдерами.
- И многое другое — мы сейчас используем лишь малую часть данных, которые у нас есть.
Заключение
Мы строим инструмент, который экономит время, чтобы вы могли сконцентрироваться на росте бизнеса, а не на рутине поиска.
Мне очень важна ваша обратная связь. Попробуйте найти своих клиентов или даже свою компанию в Строке. Насколько релевантна выдача? Чего не хватает?
Готов ответить на вопросы в комментариях!
Строка здесь: strokka.com
