Głos z wierzby: wprowadzanie głosu we wszystkich aplikacjach

24

Znana ze swojej zaawansowanej technologii rozpoznawania mowy w systemie macOS, Willow wprowadza teraz swoje możliwości na iOS. Nowa aplikacja umożliwia użytkownikom dyktowanie tekstu we wszystkich ulubionych aplikacjach, co stanowi płynną alternatywę dla tradycyjnego wprowadzania tekstu. Ten krok naprzód stanowi znaczący przełom w rozwoju narzędzi do dyktowania wykorzystujących sztuczną inteligencję, wykraczający poza spotkania i notatki i wchodzący w codzienną komunikację.

Podobnie jak Wispr Flow, klawiatura Willow dokładnie transkrybuje wypowiadane słowa i inteligentnie formatuje tekst w oparciu o kontekst. Użytkownicy mogą nawet dostosować swoje słownictwo i stworzyć charakterystyczny styl pisania dla różnych kategorii aplikacji (e-maile służbowe, wiadomości nieformalne itp.). Tym, co wyróżnia Willow, jest w pełni funkcjonalna klawiatura wraz z wprowadzaniem głosowym. Pozwala to użytkownikom na szybką edycję istniejącego tekstu bez konieczności przepisywania całych zdań, co czyni go bardziej wszechstronnym narzędziem niż konkurencyjne narzędzia, takie jak Wispr Flow, które oferują wyłącznie klawiatury numeryczne.

To przejście na urządzenia mobilne jest następstwem ekscytującej podróży założycieli Willow, Allena Guo i Lawrence’a Lee. Obaj przedsiębiorcy pierwotnie porzucili Uniwersytet Stanforda w celu zrewolucjonizowania oprogramowania pomagającego starszym osobom w rozwiązaniach z zakresu opieki zdrowotnej, ale potem zmienili kierunek studiów, gdy zdali sobie sprawę z szerszego potencjału głosowej sztucznej inteligencji w codziennej komunikacji. Obserwując, jak lekarze używają pisania głosowego podczas konsultacji z pacjentami, postanowili stworzyć narzędzie do dyktowania dla każdego.

Guo uważa, że ​​aplikacje do robienia notatek są przesycone, ale rozległy obszar nieformalnej komunikacji stanowi niewykorzystaną niszę. Willow korzysta z szeregu złożonych modeli i starannie dostosowuje swój potok tekstu, aby zapewnić dokładne formatowanie i spersonalizowane dane wyjściowe w oparciu o modele Lamy Meta.

Wprowadzona na rynek wiosną 2025 r. usługa Willow osiągnęła już imponujący wzrost, odnotowując 50% wzrost liczby użytkowników co miesiąc od debiutu. Znaczący klienci korporacyjni, tacy jak Uber, Heidi Health i Zego, korzystają z platformy do zadań dyktowania i korzystania z takich funkcji, jak niestandardowy słownik poleceń.

Sukces firmy przyciągnął znaczne zainteresowanie inwestorów, którzy zebrali 4,5 miliona dolarów od znanych inwestorów, takich jak Box Group, Y Combinator, Burst Capital i aniołów, takich jak Dharmesh Shah (HubSpot), Tomer London (Gusto), Alexis Ohanian (współzałożyciel Reddit) i Max Mullen (współzałożyciel Instacart).

Mullen podkreśla potencjał Willow wykraczający poza konwencjonalne dyktando. „Najbardziej niesamowite interfejsy użytkownika przyszłości będą oparte na głosie” – przewiduje, dodając, że zdolność Willow do dokładnego naśladowania indywidualnego stylu pisania jest lepsza od tradycyjnych systemów dyktowania. Chwali funkcję asystenta komputerowego „Hej Willow”, która umożliwia użytkownikom dyktowanie poleceń, takich jak tworzenie odpowiedzi na e-maile, własnym, niepowtarzalnym głosem.

Pomimo konkurencji ze strony wielkich marek, takich jak Wispr Flow, Monologue, Aqua, Talktastic, Superwhisper i Betterdication, Willow nadal udoskonala swoją ofertę. Plany na przyszłość obejmują rozszerzenie na platformy Windows i Android, a także wprowadzenie zaawansowanych funkcji personalizacji w celu zminimalizowania edycji po dyktowaniu. Firma jest o krok od stania się główną siłą kształtującą przyszłość interakcji technologicznych za pośrednictwem głosu.