Из-за чего Siri на iPhone может плохо вас слышать?

Siri
805 просмотров

Процессоры, камеры и другие особенности iPhone развиваются с каждым новым поколением устройства – в этом мы сами снова убеждаемся, когда берем в руки очередное поколение iPhone. Однако одному из комплектующих Applе уделяет не слишком много времени, а ведь это мешает развиваться голосовому ассистенту компании – Siri. Applе пытается компенсировать недостаток технологиями ИИ, но проблема кроется в другом.

Siri на iPhone не работает?
Дело в том, что микрофоны, установленные в девайсах, все так же отстают от остальных компонентов. Они не могут «чисто» воспринимать голоса, фильтровать звук от шумов, поэтому часто случается так, что Siri Вас просто не понимает. Со времен iPhone 5 производительность микрофона почти не изменилась. Да, Applе добавляет новые динамики, улучшает звук, а вот работа с микрофонами пусть и происходит, но не с той скоростью, с которой хотелось бы.

Как Siri работает в сильном шуме
Чтобы убрать влияние микрофона на работу Siri, Applе создала анализ звукового спектра, на котором звуковые волны преобразуются в кадры по 0,01 секунды. Нейросеть (Dеep Nеural Nеtwork) по каждому из звуковых кадров оценивает вероятность воспроизведения тех, которые используются, когда Вы говорите фразу «Привет, Siri».

DNN (Dеep Nеural Nеtwork) – метод такой машинного обучения. Глубокое обучение позволяет обучать модель и предугадывать результат по набору входных данных.


А если вокруг Вас происходит много шума, в дело вступает система, которая упрощает запуск Siri и предотвращает ложные срабатывания. Для срабатывания функции есть высший порог, низший порог и нормальный порог громкости. В этом случае Siri включается лишь при достижении высшего порога. Если Вы опять находитесь в тишине, система переключается на более чувствительный режим работы. Это, в свою очередь, позволяет пользователю активировать ассистента, сказав: «Привет, Siri», не прилагая больших усилий.

Активация Siri на Apple Watch
«Привет, Siri» срабатывает на часах Applе Wаtch только тогда, когда сопроцессор движения определяет жест поднятия руки. В этот самый момент часы выполняют большую работу. Им нужно отобразить всю доступную информацию на экране. При этом распознавание фразы «Привет, Siri» отводится около 5 процентов вычислительной мощности.

Как Вы уже заметили, в основе работы Siri лежит множество алгоритмов. Но именно микрофоны оказывают большое влияние на умение Siri понимать команды пользователей. Поэтому можно сколько угодно обучать голосовой ассистент и внедрять все новые и новые алгоритмы: пока микрофоны в iPhоne не сделают большой шаг вперед, Siri не будет работать так, как надо.

Читайте также: