Пьяный русский человек и его умная колонка

14 июня 2020

И вот, в угаре щемящей тоски, русский человек, сидя в одиночестве на покосившейся дачной веранде, воет нетрезвым голосом в умную колонку: «Алиса! Алиса! Поставь „Дым сигарет с ментолом“, Алиса! Дым сигарееееет, с ментолом. Пьяный угар качает, в глаза ты смотришь другому, Алиса, который тебя ласкает!» Потом, вероятно, включится «Беда» ДДТ, ну и рано или поздно дойдёт и до песни «Грустный дэнс» Artik & Asti и Артёма Качера. В отдельных случаях колонка включит ещё и «По ресторанам» Руслана Набиева, если от безнадёги и разрыва сердца захочется просто лечь и умереть прямо здесь.

Примерно такую картину я представил, когда в конце прошлого года узнал от сотрудников технологической компании, разрабатывающих голосовых помощников, что русский человек внезапно обнаружил в умных колонках идеального собутыльника для вечеров упоительной древнерусской тоски. Кто бы, в самом деле, мог подумать. Самиздат должен был разрабатывать совместно с этой компанией приложение, но, как пришла пандемия, все эти разговоры пришлось отложить на будущее, однако явление никуда не делось: в жизнь людей по всей планете приходят голосовые ассистенты, и это, как принято говорить в таких случаях, только начало.

Сама технология, ещё известная как системы речевого общения, появилась пару десятилетий назад и в последние годы стала чем-то повседневным. У Apple есть Siri, у Amazon — Alexa, Assistant от Google и Cortana от Microsoft, «Маруся» от Mail.ru Group, «Алиса» от «Яндекса» и «Олег» от «Тинькофф». В западных странах голосом уже можно управлять бытовой техникой: включить кофеварку, поменять режим кондиционирования или погасить свет. В России эти системы только начинают развиваться и пока служат скорее забавой: в прошлом году объём продаж таких колонок вырос в восемь раз и превысил 330 000 штук. В этом году мировой объём продаж, согласно прогнозу разработчика технологий разговорного искусственного интеллекта Just AI, превысит 1,15 миллиона проданных штук. Рынок совсем молодой, но вот общение с голосовыми помощниками через смартфон захватывает планету. В 2018 году компания Google объявила, что её голосовой помощник уже работает на миллиарде устройств. К 2023 году, говорится в исследовании Juniper Research, в мире утроится количество активированных голосовых помощников — до восьми миллиардов устройств. Колонки быстро меняют привычки хозяев: 39 % начинают реже включать радио, 34 % — реже пользоваться смартфоном, 30 % меньше внимания уделяют телевизору, 27 % — планшетам, 26 % — компьютерам, а 23 % — печатному тексту. Совсем скоро заказывать суши, переключать каналы и сериалы и совершать покупки в интернет-магазине с помощью голоса окончательно станет нормой.

Отлично. А зачем это нужно? (Ну, кроме вечеринок с Меладзе.)

Одна из главных сфер, где уже начали применять эти технологии, — забота о пожилых, уменьшение их социальной изоляции и поддержка здоровья. Население планеты стареет, люди живут всё дольше, детей рожают всё меньше, и потому уход за стариками становится одним из самых быстрорастущих секторов на рынке труда. Центр инноваций и благополучия научно-исследовательского подразделения некоммерческой компании Front Porch управляет домами престарелых и доступным жильём, и они установили колонку Echo c голосовым помощником Alexa в 400 квартирах пожилых людей и в связи с пандемией собирались установить ещё 1400. Вице-президент центра Дэвис Парк говорит, что с помощью колонок пожилые люди звонят друзьям, слушают аудиокниги, ставят напоминания выпить воды, могут попросить вызвать экстренную помощь, освещают комнаты до входа в них, чтобы избежать падений, регулируют термостат, не вставая. Но самое главное — это борьба с одиночеством стариков. «Социальная изоляция, вероятно, остаётся одним из самых губительных факторов для пожилых людей, поэтому сейчас, когда очень важно, чтобы они изолировались, мы должны предоставить инструменты, которые помогут им оставаться на связи», — говорит Парк. 

Как ещё можно использовать эти штуки в повседневной жизни? Вот, например, Григорий Бакунов, директор по распространению технологий «Яндекса», живёт с семьёй, колонками Alexa, Google Home, «Яндекс.Станцией» и собственным голосовым ассистентом. Alexa, которую Григорий называет тупой как пробка, включает свет и телевизор и управляет умным домом. С «Алисой» Бакунов любит говорить: просит справочную информацию, даже когда сидит за компьютером и пишет текст — скажем, делает аналитический материал про криптовалюты, спрашивает курс биткоина и просит пересчитать в доллары. Он разрабатывает своего помощника, собирает для него базу шуток и информации, чтобы всегда слышать новый и незнакомый ответ. Плюс весь дом у него завешан камерами, и, например, сидя в машине, Григорий может спросить у голосового ассистента: «Кто сейчас дома?» С помощью распознавания лиц помощник подскажет: двое знакомых и двое незнакомых людей. Главная проблема современных голосовых ассистентов, замечает Григорий, это, конечно же, сами люди: «Мы просто не привыкли к ним и не знаем, что с ними делать. Они слегка туповаты и отвечают зачастую не на те вопросы, которые мы задаём, но они существенно разумнее, чем то, как мы к ним обращаемся». 

Как и всякая молодая технология, голосовые ассистенты неидеальны — они не всегда понимают, что обращаются именно к ним, не могут различать людей по голосам. Различные исследования показывают, что пока люди относятся к умным колонкам скорее как к малолетним детям, но эта ситуация скоро изменится. У колонок скоро появится новая паралингвистическая система, которая позволит отвечать людям, даже если к колонке не обратились по имени, а сами ответы приблизятся к человеческой речи с помощью более естественного моделирования диалога. А потом эта штука научится понимать, что вы чувствуете, и тут вам уже не нужно будет даже просить включить песню «Тебя не любить невозможно» группы «Рок-Острова» — голосовой помощник сам всё поймёт лучше вас. 

Консалтинговая компания Accenture сообщила в своём докладе, что технологии искусственного интеллекта для распознавания человеческих эмоций вскоре «станут мощным инструментом, который заставит компании пересмотреть свои отношения с потребителями»: лучше понимая, что чувствует покупатель, можно будет успешнее продавать ему товары и услуги. Исследовательская компания Gartner прогнозирует, что через два года 10 % персональных устройств будут наделены технологиями, которые позволят распознавать эмоции, тогда как два года назад таких устройств было менее одного процента. Технологией интересуются стартапы, венчурные фонды и крупные корпорации. Совсем недавно британская компании Realeyes, применяющая искусственный интеллект для распознавания эмоций человека, заявила, что, по их данным, во время пандемии люди стали улыбаться на 32 % реже. Компания применяет свои технологии с разрешения пользователей на их смартфонах и ноутбуках, и среди клиентов компании уже есть Coca-Cola, eBay, Mars, Conde Nast и Publicis Groupe. Японская Fujitsu устанавливает сенсоры в магазинные манекены, чтобы распознавать эмоции покупателей и отправлять push-уведомления продавцам-консультантам. По данным The Financial Times, Amazon подала заявки на несколько патентов собственной технологии для распознавания человеческих эмоций по интонации голоса. Значит, скоро Alexa сможет разобраться, когда человек бесится и злится, ему всё осточертело или он вообще не понимает, что происходит в этом мире, и сможет либо включить подходящую ему песню, либо что-то продать.

Но пока этого не случилось, надо уяснить, что все колонки устроены одинаково: их микрофоны всё время слушают эфир, но только после произнесения кодового слова отправляют в облако звук для распознания речи. Вот тут можно почитать рассказ руководителя разработки умных устройств компании Mail.ru Group Бориса Кагановича о том, как устроена колонка «Капсула» и для кого они сделали специальную механическую кнопку для отключения микрофонов. А учёные и инженеры из Имперского колледжа Лондона и Университета Восточного Лондона полгода проводили исследование на Google Home Mini, Apple Homepod, Harman Kardon Invoke, Amazon Echo Dot и выяснили, что в среднем в течение пяти суток каждая из колонок активировалась не менее ста раз, хотя кодовое слово не было произнесено, записывали голоса и всё происходящее вокруг и передавали в облако. 

В прошлом году мы публиковали подробный текст журналистки Ирины Юзбековой, в котором она разбиралась, как с помощью голосовых помощников люди уже научились грабить и обижать друг друга. Там весьма впечатляющие подробности и прогнозы — ничего хорошего людей, кажется, не ждёт.

Но не будем забывать, что всё-таки этот мир прекрасен, и поэтому, конечно же, существует стартап Paranoid, производящий приспособление, больше похожее на браслет для домашнего ареста, которое подключается к умной колонке и не позволяет ей непроизвольно активироваться, слушать ваши разговоры, когда вы её не спрашиваете. Компания тоже любопытная. Они открыто пишут, что их главная задача — разбогатеть, возвращая людям приватность: «Время быть параноиком. Мы не относимся легкомысленно к самоуничтожению, жертвуя приватностью». Ну и чтобы вы окончательно не погрязли в унынии: вот тут учёные Лаборатории социальной робототехники Йельского университета провели эксперимент и выяснили, что собаки слушаются команд от человекообразного робота, но не от умной колонки.

В следующее воскресенье попробуем поговорить про такую обширную тему, как глобализация и её тёмные стороны, но тут так много всего, что я не знаю даже, за что взяться. Что вам было бы интересно узнать? Как вас коснулась глобализация, что вы в ней находите, какое видите у неё будущее и как вообще у вас дела? Я вас не сильно запугал всеми этими заметками о новых тевхнологиях? Всё не так страшно — ведь даже если остаться одному, всегда можно будет прорычать в темноте: «Алиса! Включи песню „Time“ Pink Floyd, я хочу просто лечь и забыться». 

Спасибо, и удачи!

Добавьте комментарий

comments powered by HyperComments
Нашли ошибку?
Текст