Главное Авторские колонки Вакансии Вопросы
Выбор редакции:
84 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Компания Жижи внедрила голосовой ввод в свою платформу для ИИ-поиска

Компания ЖИЖИ, разработчик решений в области обработки естественного языка и интеллектуального анализа данных, сообщает о внедрении технологии голосового ввода в программный интерфейс своей платформы. Новый функционал доступен как в мобильном приложении, так и в десктопной версии продукта.
Мнение автора может не совпадать с мнением редакции

Источник изображения: Сгенерировано нейросетью Артифика

Технические аспекты решения

Система голосового ввода реализована по следующему принципу: аудиопоток с устройства пользователя фиксируется в виде звукового файла и передается на серверную инфраструктуру «ЖИЖИ». Там аудиоданные обрабатываются нейросетевой моделью, построенной на архитектуре encoder‑decoder.

Модель проводит ряд последовательных операций: преобразование аудиосигнала в спектрограмму, извлечение смысловых признаков речи и декодирование этих признаков в текстовую последовательность. Архитектура encoder‑decoder обеспечивает сопоставление акустических паттернов с лингвистическими единицами, что позволяет распознавать произносимый контент независимо от индивидуальных особенностей дикции пользователя.

Инженерная реализация цепочки обработки ориентирована на минимизацию задержек: от момента завершения записи до получения текстового транскрипта проходит время, не превышающее установленных для синхронного взаимодействия пороговых значений.

Практическое применение

Голосовой ввод расширяет сценарии использования платформы ЖИЖИ: пользователи получают возможность формулировать поисковые запросы и аналитические задачи устно, что актуально при работе в условиях ограниченной мобильности либо при необходимости оперативной фиксации мыслей. Функциональность идентична в мобильной и десктопной средах, что обеспечивает непрерывность пользовательского опыта при переходе между устройствами.


Реализация голосового ввода в интерфейсе платформы ЖИЖИ

«Распознавание речи является естественным дополнением к текстовому интерфейсу работы с информацией», — прокомментировал развитие продукта Григорий Антонов, технический директор и сооснователь компании ЖИЖИ. «Архитектура encoder‑decoder позволила нам построить надежное и быстрое решение, которое вписывается в существующую экосистему платформы без дополнительных требований к пользовательскому оборудованию».

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.