Голос от Вилоу: Ввод текста голосом во всех приложениях

26

Стартап Вилоу, известный своей мощной технологией распознавания речи на macOS, теперь привносит свои возможности в iOS. Новое приложение позволяет пользователямdictate текст во всех их любимых приложениях, предлагая плавный альтернативный традиционному вводу текста. Этот шаг вперед представляет собой значительный прорыв в развитии AI-оснащенных инструментов для диктовки, выходя за рамки встреч и заметок в повседневное общение.

Как и Wispr Flow, клавиатура Вилоу транскрибирует произнесенные слова точно и интеллектуально форматирует текст на основе контекста. Пользователи могут даже настроить свой словарь и создавать отличительные стили письма для разных категорий приложений (рабочие электронные письма, неформальные сообщения и т. д.). Что выделяет Вилоу — это полнофункциональная клавиатура наряду с вводом голосом. Это позволяет пользователям быстро редактировать существующий текст без необходимости передиктовывать целые предложения, что делает ее более универсальным инструментом, чем конкуренты, например, Wispr Flow, которые предлагают только числовые клавиатуры.

Этот переход на мобильное устройство последовал за увлекательным путешествием для основателей Вилоу, Аллена Гуо и Лоуренса Ли. Изначально эти два предпринимателя бросили университет Стэнфорда с целью революционизировать программное обеспечение для помощи пожилым людям через решения в сфере здравоохранения, но затем переориентировались после того, как поняли более широкие возможности голосового AI в повседневном общении. Наблюдая за тем, как врачи используют голосовой набор во время консультаций с пациентами, они решили создать инструмент для диктовки для всех.

Гуо считает, что приложения для заметок перенасыщены, но огромная область неформального общения представляет собой неиспользованную нишу. Вилоу использует серию сложных моделей и тщательно настраивает свою текстовую пиплайн с целью обеспечения точного форматирования и персонализированного вывода на основе моделей Llama от Meta.

Запущенная весной 2025 года, Вилоу уже достигла впечатляющего роста, демонстрируя увеличение числа пользователей на 50% каждый месяц со дня своего дебюта. Такого рода значимые корпоративные клиенты, как Uber, Heidi Health и Zego, используют платформу для задач диктовки и применяют такие функции, как пользовательский словарь команды.

Успех компании привлек значительный интерес инвесторов, привлекая $4,5 миллиона от известных инвесторов, таких как Box Group, Y Combinator, Burst Capital и ангелов вроде Dharmesh Shah (HubSpot), Tomer London (Gusto), Alexis Ohanian (сооснователь Reddit) и Max Mullen (сооснователь Instacart).

Мюллен подчеркивает потенциал Вилоу, который выходит за рамки обычной диктовки. «Самые удивительные пользовательские интерфейсы в будущем будут голосовыми,» — предсказывает он, добавляя, что способность Вилоу точно имитировать индивидуальные стили письма превосходит традиционные системы диктовки. Он хвалит ее функцию настольного помощника “Hey Willow”, которая позволяет пользователям диктовать команды, например, составлять ответы на электронные письма своим собственным уникальным голосом.

Несмотря на конкуренцию со стороны таких именитых игроков, как Wispr Flow, Monologue, Aqua, Talktastic, Superwhisper и Betterdication, Вилоу продолжает совершенствовать свое предложение. В будущих планах — расширение до платформ Windows и Android, а также внедрение продвинутых функций персонализации для минимизации правок после диктовки. Компания находится на пороге того, чтобы стать главной силой в формировании будущего взаимодействия с технологией с помощью голоса.