Главное Авторские колонки Вакансии Вопросы
Выбор редакции:
0 9 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Стив Джобс ошибался, когда называл пальцы самым удобным инструментом

Опыт создания помощников типа Siri провалился, потому что они мучительные и заложенные ограничения в способе взаимодействия со смартфоном идут вразрез с более естественными для человека способами выполнять то или иное действие.
Мнение автора может не совпадать с мнением редакции

Голосовое управление — способ взаимодействия с устройством при помощи голоса. В общем случае голосовое управление в совокупности с технологией распознавания речи предназначено для ввода управляющих команд — например, «какая завтра будет погода?», «выключи музыку», «включи свет», «прочти входящие сообщения» и т.д. Но благодаря технологии рекомендаций, контекстного распознавания речи, пользовательской модели функционал устройства значительно повышается. Добавляется совершенно новая качественная характеристика уровня взаимодействия гаджета с человеком.

На сегодняшний день реализация помощников в мобильных телефонах оставляет желать лучшего: для выполнения различных задач необходимы разные приложения (управление умными устройствами, поиск информации в интернете), не способны качественно поддерживать разговор на заданную тематику, взаимодействие с помощником протекает не естественным образом.

Почему мобильные помощники (имеется в виду помощники в смартфонах) никогда не станут трендом? Люди всем этим не будут пользоваться так и не попробовав. А вы скажете: “Почему? Ведь это так удобно сказать смартфону, что тебе надо и он выполнит и все это без необходимости напряженно натыкивать текст запроса пальцами.” И добавите неуверенно “вроде бы”.

Есть мнение, что Стив Джобс ошибался, когда называл пальцы самым удобным инструментом, данным человеку от природы для управления устройствами. Но это было во времена первого iPhone и таким образом хотел наглядно продемонстрировать преимущества управления пальцами в новом интерфейсе ios и достоинства нового емкостного экрана против стилуса и резистивного экрана у конкурентов. Но сейчас технологии шагнули дальше, все устройства оптимизированы под управление пальцами и это диктует свои ограничения, а характер и способ использования некоторого функционала и управления устройствами начал стремительно меняться.

Уже есть опыт создания помощников типа Siri на iPhone. Они все провалились, потому что они мучительные и заложенные ограничения в способе взаимодействия со смартфоном идут вразрез с привычными, более естественными для человека способами выполнять то или иное действие.

Вот простой пример. Если вы хотите зажечь лампочку, например, в умном доме через смартфон, вам необходимо порядка 18 секунд и от 6 до 16 движений пальца:

  • Достать телефон;
  • Включить телефон;
  • Разблокировать телефон;
  • Включить bluetooth;
  • Найти приложение;
  • Запустить приложение;
  • Дождаться соединения с лампой;
  • Выключить лампу.

Команда проекта Лекси провела небольшое исследование по использованию нескольких совершенно разных инструментов для решения примитивной задачи - выключения или включения света. И приложение в телефоне для управления светом является абсолютным аутсайдером среди других методов.

b_55af579318604.jpg

Во время исследования были использованы следующие способы управления светом:

  • “Сделай сам” - необходимо было встать и выключить свет традиционным способом;
  • Приложение на телефоне;
  • “Метод тапка” - попасть тапком по выключателю (2 попытки);
  • Голосовой помощник как отдельное устройство;
  • Пульт ДУ.

Самое большое ограничение в том, что нужно использовать пальцы, чтобы устройство поняло, что вы от него хотите. А это не удобно. Ведь основная идея голосового управления - разгрузка визуального канала взаимодействия с помощью голосового управления путем отказа от тактильно-визуального интерфейса.

У нас сформировалось «поколение больших пальцев». Под него сделаны все удобные кнопки, все удобные движения. Совершенно непонятно, зачем нужен экран, в который вы и так уже втыкаете, и при этом с ним ещё и разговариваете.

Таким образом мобильные помощники максимально усложняют взаимодействие с домашней “умной фауной”. Большинство таких приложений оказываются в том же пыльном углу. Скачивают их много, Siri вообще стоит на любом айфоне. Про Siri они таких данных не дают, но, по слухам, так же как и у всех остальных, кто делает этих помощников, время их жизни — это полтора-два дня, примерно. Дальше ими не пользуются.

Есть ситуации, когда человеку доступен только аудиоканал. Таких ситуаций можно придумать и смоделировать очень много. Например, это душ или автомобиль когда руки и глаза заняты. Вот тогда вы, на самом деле, почти не смотрите на экран, когда заняты не только руки, но и глаза, вы должны смотреть на дорогу, и вот тогда эти мобильные собеседники не работают вовсе. Аудиоканал – это и есть то, что должен захватывать собеседник, то есть в правильном способе использования он не должен иметь экрана. Экран не нужен. Если необходимо смотреть в экран — тогда проще нажать на тачскрин или мышкой работать и так далее. Проще и быстрее будет сказать вслух, что вы хотите найти в интернете или сменить трек в плеере.

В случае с носимыми гаджетами у голосового управления перспектив нет. Они могут играть лишь вспомогательную роль, когда условия таковы, что иного более быстрого и легкого способа для выполнения того или иного действия нет. Выполнение задач должно быть непринужденным, а не напоминать сложный, но прикольный квест, который выполняется пока еще экзотическим способом.

Управления всего в доме и в машине благодаря распознаванию голоса будет универсальным. Просто надо будет сказать, что вы хотите выключить свет или включить телевизор и не надо искать пульт или смартфон и на нем нажимать кнопки.

В настоящий момент в мире находится на финальной стадии разработки не больше десяти проектов, которые посвящены созданию искусственного интеллекта с полностью голосовым интерфейсом для управления умным домом, получения информации из интернета и поддержания диалога в заданной тематике. Сейчас уровня развития доступных технологий вполне достаточно для того, чтобы полностью перейти на управление голосом.

Следите за новостями проекта в социальных сетях: Вконтакте, Фейсбук.

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
AgriChain
AgriChain - комплексная онлайн система IT-решений для управления агробизнесом
Панченко Андрей
Стив никогда не ошибался ;)
Ответить
Виктор Рассоха
Есть у голосового управления один фатальный недостаток – ты не можешь что-то сделать тихо. Выключать свет голосовой командой выходя из детской спальни, только-только уложив малыша, стремное дело ;)
Ответить
Puzzle.ru — парсер ВКонтакте
Сервис поиска пользователей и сообществ для бизнеса в социальной сети ВКонтакте
Седов Артём
Вы правы! Недостаток есть. Тем не менее голосовой интерфейс в ряде случаем очень удобен.
Ответить
Виктор Рассоха
Да, наверное, но по-моему, голосовое управление сложнее кнопочек и требует больше времени. Я поясню:

Хорошо организованный интерфейс из кнопочек дает подсказку, что можно сделать. Для управления голосом нужно помнить команды и то, что ими контролируется:
"ОК, Лекси, Закрыть шторы" или "Занавески"? или "Занавески закрыть"?

"ОК, Лекси, прибавить громкость". А на чем Лекси прибавит громкость? На телевизоре или на CD плеере соседа в комнате? А насколько система прибавит, мне же надо совсем чуть-чуть. А вдруг прибавит слишком много? Так, как бы точнее сказать... "ОК, Лекси, прибавить громкость на телевизоре на пять".

- Па-а-ап, а как на телевизоре настроить мультики? Я ему говорю "Хочу мультики", а он не понимает!!!

:)
Ответить
Виктор Рассоха
Хорошая реализация должна как-то нивелировать эти проблемы. Типа как умный дом в сериале Эврика. Но это уже как-то жутковато может быть. :)
Ответить
Puzzle.ru — парсер ВКонтакте
Сервис поиска пользователей и сообществ для бизнеса в социальной сети ВКонтакте
Седов Артём
Для управления чем-либо с телефона необходимо пройти через 12 кругов ада. Порядка десятка движений пальцем!

С приведенными вами примерами конкретно Лекси хорошо справится. Он знает что такое и шторы, и занавеска, и шторка. Понимает разные вариации.

Что касается громкости, то в определенных ситуациях наше контекстное распознавание может не справится. Тогда он задаст уточняющий вопрос.

В любом случае на определенном этапе разработки контекст будет достаточно хорошо определяться для комфортного взаимодействия с роботом.
Ответить
Виктор Рассоха
"через 12 кругов ада" – ну это Вы утрируете, хотя я начал первый. :)

Вполне возможно, что это будет здорово, а я пока просто хочу "лошадь побыстрее". Успехов, буду с интересом следить.
Ответить
Puzzle.ru — парсер ВКонтакте
Сервис поиска пользователей и сообществ для бизнеса в социальной сети ВКонтакте
Седов Артём
Тогда нужен или отдельный пульт в кармане от каждого устройства, или делать все самому)
Ответить
Виктор Рассоха
Я думаю, что в исследовании, на основании которого сделана данная таблица заметно сильно предвзятое отношение. Посмотрим условия для приложения:
"Достать телефон;
Включить телефон;
Разблокировать телефон;
Включить bluetooth;
Найти приложение;
Запустить приложение;
Дождаться соединения с лампой;
Выключить лампу."

Давайте поставим голосовое управление в аналогичные условия, а не будем считать, что оно включено и настроено:
"Заказать в интернете блок распознавания голоса
Получить его на почте
...
Выключить лампу"

Полтора месяца? Да Вы издеваетесь! Я тапком быстрее попаду.

:)

Наиболее частое включение и выключение света происходит по пути мимо выключателя и отнимает около секунды. Стоит дешево, привычно и понятно.

Т.е. технологически это интересно, но есть ли проблема, которую решает технология, или исследование предвзято (не корысти ради, а только по причине увлеченности технологией)?
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.