Человек постоянно создаёт все новые способы, чтобы сделать свою жизнь комфортней и удобней. Это проявляется во всем — повседневности, быту, работе. Одним из последних инновационных решений стал голосовой ввод, который активно стали использовать пользователи по всему миру.
Что это такое?
Голосовой ввод — это своего рода замена стандартного ввода с клавиатуры. Данные принимаются с помощью микрофона устройства, преобразуются и отображаются в виде обычного текста.
Особенно актуальна эта технология для людей с ограниченными возможностями или тем, кому постоянно приходиться работать с большими объёмами текста. Как правило, это копирайтеры, писатели, переводчики.
Средства для голосового ввода
Для распознавания речи и преобразования её в текст, используется специальное программное обеспечение. А среди его лидеров можно отметить средства от интернет-гигантов Google и "Яндекс".
Голосовой ввод "Гугл" интегрирован практически во все продукты компании. Сюда входит поиск, браузер Google Chrome, операционная система "Андроид", Google Docs. Это очень удобно — научившись пользоваться голосовым вводом в одной технологии, можно с успехом применять его и в другой.
"Андроид"
Голосовой ввод в этой операционной системе доступен «из коробки» во многих версиях. Активировать его можно через меню настроек «Язык и клавиатура» или «Язык и ввод». После этого практически во всех местах, где имеется ввод текста, будь то набор SMS или же текстовый редактор, появится иконка микрофона. Нажатие на неё запустит процесс записи, по окончании которой системе потребуется некоторое время для распознавания и возвращения результата.
Стоит отметить, что данный функционал на некоторых последних версиях "Андроид" доступен и в режиме оффлайн. Правда, для этого придётся скачать небольшой архив для нужного языка.
Ещё один важный момент — если пользователя не устраивает штатный голосовой ввод, всегда можно установить сторонний.
Google Chrome и Google Docs
Голосовой ввод на компьютере доступен с помощью браузера Google Chrome. Так же, как и в ОС "Андроид", при посещении сайта "Гугл", в строке поиска можно увидеть иконку микрофона. Она позволяет записать звук и выполнить поиск необходимого объекта в сети, без ввода с клавиатуры.
Более расширенная версия используется в онлайн-сервисе документов Google Docs. Помимо набора текста, тут доступны функции перемещения по нему, форматирования, изменения таблиц. В общем, все, что можно сделать классическими средствами ввода — клавиатурой или мышкой.
"Яндекс"
"Яндекс" не обладает таким большим набором платформ, на которых можно было бы применять голосовой ввод. Поэтому пока он представлен в продуктах "Поиск", "Разговор" и "Переводчик". Также навигаторы от "Яндекс" умеют распознавать речь и разговаривать с пользователем.
"Поиск" можно встретить в "Яндекс Браузере". Здесь он встроен по умолчанию и действует аналогично Chrome. Основана технология на собственной разработке компании, которая также доступна и для коммерческих нужд в виде Speech.Kit. Подключив его к своему проекту, можно использовать неограниченное количество запросов для распознавания. Однако услуга эта платная.
Другие продукты
Помимо средств голосового ввода от интернет-гигантов, есть и другие свободные разработчики, активно развивающие и продвигающие представленную технологию. Какие-то реализованы в виде онлайн-сервисов (например, speechpad.ru, august4u.ru, bestfree.ru), а какие-то представляют собой полноценные приложения, с возможностью установки на компьютер (speechka, realspeaker).
Несмотря на то что ресурсов у свободных разработчиков немного меньше, их решения работают ничуть не хуже. А иногда и вовсе используют API "Гугл".
Преимущества и недостатки
Голосовой ввод на компьютере обладает своими существенными плюсами и минусами:
- Это несомненно удобно. Руки могут быть свободны во время работы, а также повышается скорость набора, а вместе с этим растёт и производительность.
- В мобильных версиях голосовых средств можно работать с устройством не отрываясь, например, от управления автомобилем.
- К тому же, программы голосового ввода позволяют отказаться от использования неудобной миниатюрной клавиатуры операционной системы, что несомненно влияет на качество и скорость ввода.
Из минусов можно отметить повышенные требования к качеству микрофона. Он должен быть наиболее чувствительным. А ещё сам алгоритм распознавания работает не всегда так, как хотелось бы. Посторонние шумы и помехи могут вызвать сбой, и, как следствие, ошибки в тексте. В любом случае, его придётся редактировать после набора. Так что диктовать текст нужно тщательно и чётко. А это увеличивает время набора.
В заключение
Технология голосового ввода постоянно совершенствуется. Все чаще можно встретить людей, которые разговаривают со своим смартфоном, часами или компьютером. Голосовой ввод активно применяется в проектировании и производстве умных домов и других смежных решений на основе взаимодействия устройств с пользователями.
Возможно, в дальнейшем технология придёт к более совершенному виду, когда начнёт распознавать речь с высоким уровнем точности, вне зависимости от шумов и помех.