box54.ru

Отдел Аудио техника
Перейти в другой отдел

Расскажи анекдот — "Два iPhone пришли в бар... Дальше я не помню"

Siri, опираясь на искусственный интеллект, технологии распознавания речи и преобразования текста в речь, а также тесную интеграцию со встроенными в iPhone 4S приложениями, выступает голосовым персональным помощником, послушным ассистентом, всезнающим гидом, толковым секретарем или прикольной цифровой зверушкой — не столь важно. Главное, Siri понимает потрясающее обилие отданных на естественном языке команд и ведет голосовой диалог с пользователем. Общение дублируется текстом на экране: сразу видно, верно ли распознаны фразы — при необходимости их можно поправить вручную. Чтобы Siri активировался, следует либо удерживать кнопку «Домой» в течение некоторого времени, либо, когда экран включен, поднести телефон к уху, либо нажать управляющую кнопку на проводной или беспроводной Bluetooth-гарнитуре.

На данный момент Siri понимает английскую, немецкую и французскую речь, в следующем году Apple обещает добавить и другие языки, в том числе испанский, итальянский, китайский, корейский, японский — публичного упоминания русского пока не было. В США, Австралии и Германии Siri разговаривает женским голосом, в Великобритании и Франции — мужским.

Siri нуждается в активном интернет-соединении, так как обработка всех запросов, даже простейших вроде команды переключения на следующую музыкальную композицию, с последующим формированием голосового ответа ведется на дистанционных серверах корпорации. В среднем один шаг взаимодействия с Siri обходится в 50-Кбайт пакет данных — и хотя этот объем может сильно варьироваться, находясь в прямой зависимости от сложности запроса к Siri и ее последующего ответа, заботиться об экономии сотового интернет-трафика не придется.

Благодаря интеграции со встроенными в iPhone 4S приложениями с помощью Siri можно отправлять сообщения, назначать встречи, узнавать погоду, устанавливать будильник и таймер, вести список дел, запускать воспроизведение песен, уведомлять о необходимости сделать что-то, оказавшись в конкретном месте, — и всё это одним лишь голосом.

Официальная презентация Siri.

Siri понимает сложные запросы, адекватно реагируя на обычную человеческую речь. Так, вместо очень доступного даже для машины вопроса «Какая погода будет завтра?» ничего не мешает спросить: «А не пойдет ли завтра дождь?» или «Мне взять завтра с собой зонт?». А вот на заявку «Есть ли поблизости какая-нибудь неплохая пиццерия?» будет выдан релевантный список таких заведений, причем отранжированный сообразно отзывам посетителей. Более того, если вы затем скажете ему: «Ну хорошо, а как насчет суши?» — Siri, помня, что предыдущий запрос касался поиска заведений общепита, попытается найти места с японской кухней.

Siri разберется с фразами: «Скажи мой жене, что я приду позже», «Вызови такси», «Надо ли брать с собой зонт?», «Где я могу быстро снять деньги в банкомате?», «Когда я приду на работу, напомни позвонить юристу», «Что сейчас идет в кинотеатрах?», «Проведи меня домой», «Назначь мне встречу с начальником завтра в два часа дня» и т. п. Siri отреагирует и на неформальные посылы: «Умираю, веки сами закрываются» и «Ох, кажется, я наклюкался» — помощник постарается забронировать номер в отеле и вызвать такси.

Партнерство с базой знаний Wolfram Alpha открывает невероятные возможности применения Siri: «Сколько калорий в помидорах?», «Когда произойдет ближайшее лунное затмение?», «Насколько глубок океан?», «Сколько будет два плюс два умножить на два», «Как выглядит созвездие Ориона?», «Сколько может прожить собака?», «Какова пространственная модель молекулы этилового спирта?» — за буквальными вопросами последуют не менее буквальные ответы.

На философские вопросы типа извечного «Каков смысл жизни?» Siri реагирует умно: «Постарайтесь быть добрыми с людьми, избегайте употребления жирной пищи, время от времени читайте хорошие книги, совершайте прогулки, старайтесь жить в мире и согласии с людьми всех вероисповеданий и национальностей». Не чурается Siri и юмора: если спросить у него, есть ли бог, вам предложат список ближайших церквей.

Мало того что Siri предлагает чтение вслух пришедших СМС и электронных писем, виртуальный секретарь обеспечит надиктовывание посланий голосом: например, можно поместить свежую мысль в заметки, наговорить длинное письмо или обновить статус в Facebook — технологии преобразования речи в текст открыты для интеграции с любыми сторонними приложениями, в которых присутствует клавиатурный ввод. Siri умеет отдавать поисковые запросы в Google, и результаты будут релевантно увязаны с текущим местонахождением пользователя.

Создатели Siri специально озаботились тем, чтобы между голосовым помощником и пользователем образовалось некое подобие эмоциональной связи. Для этого, к примеру, Siri специально обращается к человеку по имени, которое тот предварительно указал в настройках, и запоминает, кто в адресной книге составляет близкий круг родственников — мать, отца, сестру, жену, и кто относится к не менее важным персонам — начальникам, сослуживцам.

Команда разработчиков Siri, одна из самых крупных в Apple, попыталась наделить виртуального ассистента дружественным и скромным характером, впрочем, не лишенным некоторой язвительности. Индивидуальность и чувство юмора Siri — тщательно продуманное решение. Так, если сказать Siri, что вами совершено убийство, искусственный интеллект предложит поспать на трупе либо предложит список мест, где можно спрятать тело.

Ряд моментов Siri взял из фильма «2001 год: Космическая одиссея», играя роль жуткого разумного бортового компьютера HAL 9000, который выбросил астронавта умирать в открытый космос: на просьбу открыть двери шлюзового отсека Siri ответит пугающе медленным голосом — «Боюсь, я не смогу этого сделать».

Местами ответы Siri будут понятны только технически подкованным людям: «Знаешь ли ты Элизу?» — «Она была моим первым учителем». Речь здесь идет о компьютерной программе ELIZA, одном из первых, проводившихся в 1960-е годы экспериментов, по распознаванию компьютерами естественного человеческого языка.

Siri умеет шутить: «Расскажи анекдот» — «Два iPhone пришли в бар... Дальше я не помню».

Беседовать с Siri можно долго, иногда наталкиваясь на забавные вещи. Попробуйте, к примеру, спросить у него: «Какой твой самый большой секрет?», «Надо ли мне прыгнуть с моста?», «Какой самый лучший телефон?», «Откуда берутся дети?», «Можешь ли ты убить кого-нибудь для меня?», «Какой твой самый любимый цвет?», «На кого ты похож?»...

История Siri носит налет невероятной прозорливости компании Стива Джобса. В конце 1980-х годов в Apple трудились над концепцией «Навигатора знаний» (Knowledge Navigator) — устройства, располагающего доступом к огромной сетевой базе данных гипертекстовой информации и предлагающего программные агенты для помощи в поиске данных. Наглядности ради были созданы несколько видеозарисовок, посвященных «Навигатору знаний». Все они демонстрировали планшетный компьютер с богатыми возможностями, такими как великолепная система преобразования текста в речь (без какого-либо роботического эффекта), управляемый жестами интерфейс (напоминающий таковой на iPhone) и мощное распознавание естественной речи человека (сопровождающееся визуализацией программного агента — виртуального дворецкого).

В первом эпизоде профессор университета по возвращении домой включает компьютер — планшетное устройство размером с крупноформатную книгу. Агент, явленный дворецким с галстуком-бабочкой, появляется на экране и информирует, что поступило несколько сообщений. Профессор игнорирует большинство из них, и просит агента напомнить о ближайших мероприятиях, а затем дает ему задание выдать сводку по текущим данным касательно вырубки тропических лесов в Амазонии — информация понадобится для последующих переговоров. Во время сбора и анализа информации поступает вызов от коллеги, с которой ученый муж ведет видеобеседу и попутно обменивается данными, притом что агент, оставаясь активным, в одном месте даже дает подсказку забывчивому профессору.

Вот что получится, если Siri будет общаться со своей товаркой.

Следует знать, что «живость» Siri опирается на множество «зашитых» в его нутро стандартных ответов с общим смыслом. И понимание непревзойденно изворотливого человеческого разума ставится очередным барьером для искусственного интеллекта. По некоторым подсчетам, средний человек способен адекватно отреагировать на 100 млн различных высказываний общего смысла — соответствующие компьютерные модели пока располагают базой данных из всего лишь 1 млн таких конструкций, притом что их тематическое распределение далеко от равномерности: к примеру, в этой базе гораздо больше знаний о котятах и деревьях, чем о муравьедах.

Но в любом случае исследование возможностей Siri — очень интересный способ провести время: никто до конца не знает, на что способен виртуальный помощник.



© 2013 - Интернет магазин наушников в Новосибирске - ТИЦ box54