Wprowadzanie tekstu głosem: 30 dni bez klawiatury

Jestem tym typem zrzęda, który powiesił sobie KeyCounter na laptopie „dla zabawy”. Po miesiącu używania Commander Flow otworzyłem go i spojrzałem na liczby — wciśnięcia spadły kilkukrotnie. I to przy tym, że nakład pracy mi wzrósł: przyjąłem dwóch nowych klientów i zacząłem prowadzić anglojęzycznego bloga.
„Recenzją technologiczną” tego nie nazwę. To raczej obserwacje człowieka, który pewnego dnia po prostu przestał zauważać, że w ogóle pisze.
Osiem kroków, których już nie robię
Za każdym razem, gdy musiałem napisać e-mail do klienta bez literówek, robiłem to:
Alt+Tab → Word → szkic → zaznacz → Ctrl+C → Alt+Tab → Gmail → Ctrl+V → poprawki
Teraz: stawiam kursor w Gmailu, trzymam skrót, mówię tak, jak myślę, zwalniam. Sekundę później w polu pojawia się spójny akapit bez „eee”, „no”, bez podwójnych spacji, z poprawną wielką literą i kropką na końcu. Akapit, który redagowałbym pięć minut, pojawia się gotowy.
„Nie piszę szybciej. Po prostu nie piszę.”
Co zauważyłem przez miesiąc
Notuję obserwacje od poniedziałku do piątku. Oto charakterystyczne zmiany:
- Maile do klientów: zauważalnie szybciej — to, na co kiedyś szła sporą część poranka, zamykam w jakieś dziesięć minut
- Korespondencja na Slacku/Telegramie: nie „zawieszam się” już w czatach na długo — krótkie wiadomości wychodzą w sekundy
- Notatki podczas rozmów: piszę tyle, ile wcześniej nie nadążałem
- Odpowiedzi na YouTube/Reddicie: wcześniej — nigdy. Teraz — ile chcę.
Sumarycznie odzyskuję wyczuwalny kawałek dnia — wcześniej pochłaniało go pisanie. Wziąłem go i stopniowo wkładam w mój główny projekt poboczny, który od lat odkładałem.
Gdzie to działa najlepiej (mój top 3)
Najmocniej zmieniły się długie maile — to, czego najbardziej w pracy nienawidziłem. Dyktuję jak tłumaczę koledze, głosem proszę o styl biznesowy i dostaję tekst, który mój księgowy ostatnio skomentował: „pan zaczął pisać jakoś poważniej, znalazł pan copywritera?”. Nie, ja po prostu mówię do mikrofonu.
Dalej idą wątki na Slacku po angielsku. Jestem rodzimym użytkownikiem polskiego i wcześniej każda wiadomość w międzynarodowym zespole kosztowała mnie wewnętrznego tłumaczenia. Teraz po prostu mówię po polsku, proszę o friendly-English — i półtorej sekundy później tekst leci na czat. Przez pół roku nikt z kolegów niczego nie podejrzewał.
Szczególny przypadek to notatki podczas rozmowy. Mam mikrofon na słuchawkach, między zdaniami rozmówcy przytrzymuję klawisz i szybko dyktuję: „umówieni na czwartek, budżet doprecyzować u Marii”. Tekst ląduje w Obsidianie już sformatowany, bez konieczności rozpraszania się przełączaniem do notatek.
Co mnie irytuje
Nie jest idealnie. Trzy rzeczy, które łapię okresowo:
Pierwsza próba po długim przestoju — czasem chybia. Jeśli nie dyktowałem przez kilka godzin, pierwsze naciśnięcie skrótu może „zgubić” początek frazy. W świeżym buildzie wyraźnie się poprawiło, ale sporadycznie wciąż się to zdarza. Rozwiązanie — powiedzieć jedno testowe słowo po powrocie do laptopa. Sekundowy rytuał.
Bardzo głośna kawiarnia. Detektor głosu dobrze tnie pauzy, ale jeśli przy sąsiednim stoliku ktoś głośno się śmieje — czasem wstawia zbędne „aha-aha” na początku. Przełączam się na push-to-talk i problem znika.
Pierwsze pobranie po instalacji. Aplikacja ściąga komponenty do pracy offline. Na wolnym internecie jest to zauważalne. Raz w życiu — do zniesienia.
Czego już nie robię
- Nie poprawiam literówek. Ich nie ma.
- Nie przełączam układu klawiatury. Mówię w dowolnym języku, proszę o polerowanie w dowolnym.
- Nie pamiętam, gdzie na klawiaturze jest „ż” (wcześniej chyba i tak go nie stawiałem).
- Nie otwieram serwisów online do parafrazowania. Wszystko lokalnie.
TL;DR dla tych, którzy doskrolowali tutaj
Commander Flow to nie „fajny gadżet dla geeków”. To odjęcie z twojego dnia jednej z najbardziej męczących czynności — pisania — bez utraty jakości tekstu. Po miesiącu moja klawiatura fizycznie pokryła się kurzem na rzędzie cyfr — wcześniej w to bym nie uwierzył.
Wady są, ale są w kategorii „zauważam je, bo zawodowo szukam bugów”. Dla zwykłego użytkownika są niewidoczne.
Gdyby miesiąc temu ktoś mi powiedział „za 30 dni będziesz pisać półtora razy więcej, a palce — półtora razy mniej”, nie uwierzyłbym. Ale teraz właśnie tak to działa.
Częste pytania o wprowadzanie tekstu głosem
Czym jest Commander Flow i do czego służy?
To aplikacja desktopowa dla Windows, która zamienia głos w gotowy tekst w dowolnym aktywnym polu — w poczcie, czacie, dokumencie, IDE. Rozpoznaje mowę, usuwa słowa-pasożyty, dodaje interpunkcję i wstawia rezultat tam, gdzie znajduje się kursor. Sprawdza się zarówno przy krótkich wiadomościach, jak i przy długich listach i notatkach.
Czy wprowadzanie głosem działa bez internetu?
Tak. Domyślnie całe przetwarzanie odbywa się lokalnie, na twoim komputerze: zarówno rozpoznawanie mowy, jak i polerowanie tekstu. Internet nie jest potrzebny ani do uruchomienia, ani do codziennej pracy. To kluczowa różnica względem usług chmurowych, takich jak wbudowane dyktowanie w przeglądarce.
Jaki jest domyślny skrót klawiszowy?
Caps Lock — najrzadziej używany klawisz na każdej klawiaturze. Naciskasz, mówisz, zwalniasz — tekst pojawia się w aktywnym polu. Jeśli Caps Lock jest niewygodny, każdy inny skrót można przypisać jednym kliknięciem w ustawieniach.
Czy nadaje się do języka polskiego?
Tak, język polski jest w pełni obsługiwany, łącznie z mieszaną mową polsko-angielską. W sumie rozpoznawanych jest 25 języków, a przełączanie między nimi odbywa się głosem lub w ustawieniach.
Jakie są wymagania sprzętowe?
Współczesny laptop z 8–16 GB RAM wystarczy w większości trybów. Karta graficzna nie jest wymagana, ale jeśli jest — aplikacja używa jej automatycznie. Na bardzo starych maszynach działa tryb „Lekki” o obniżonych wymaganiach.
Wypróbuj sam
Pobierz Commander Flow i przytrzymaj Caps Lock w dowolnej aplikacji. Rozpoznawanie działa lokalnie, bez chmury — darmowy okres próbny w cenie.


