Wprowadzanie tekstu głosem: 30 dni bez klawiatury

Wprowadzanie tekstu głosem na komputerze: zakurzona klawiatura i mikrofon studyjny

Jestem tym typem zrzęda, który powiesił sobie KeyCounter na laptopie „dla zabawy”. Po miesiącu używania Commander Flow otworzyłem go i spojrzałem na liczby — wciśnięcia spadły kilkukrotnie. I to przy tym, że nakład pracy mi wzrósł: przyjąłem dwóch nowych klientów i zacząłem prowadzić anglojęzycznego bloga.

„Recenzją technologiczną” tego nie nazwę. To raczej obserwacje człowieka, który pewnego dnia po prostu przestał zauważać, że w ogóle pisze.

Osiem kroków, których już nie robię

Za każdym razem, gdy musiałem napisać e-mail do klienta bez literówek, robiłem to:

Alt+Tab → Word → szkic → zaznacz → Ctrl+C → Alt+Tab → Gmail → Ctrl+V → poprawki

Teraz: stawiam kursor w Gmailu, trzymam skrót, mówię tak, jak myślę, zwalniam. Sekundę później w polu pojawia się spójny akapit bez „eee”, „no”, bez podwójnych spacji, z poprawną wielką literą i kropką na końcu. Akapit, który redagowałbym pięć minut, pojawia się gotowy.

„Nie piszę szybciej. Po prostu nie piszę.”

Co zauważyłem przez miesiąc

MOJE NACIŚNIĘCIA KLAWISZY W CIĄGU MIESIĄCA BYŁO zwykły poziom pisania JEST kilkukrotnie mniej — bez spadku ilości pracy
Ilość pracy się nie zmniejszyła — palce po prostu przestały stukać.

Notuję obserwacje od poniedziałku do piątku. Oto charakterystyczne zmiany:

  • Maile do klientów: zauważalnie szybciej — to, na co kiedyś szła sporą część poranka, zamykam w jakieś dziesięć minut
  • Korespondencja na Slacku/Telegramie: nie „zawieszam się” już w czatach na długo — krótkie wiadomości wychodzą w sekundy
  • Notatki podczas rozmów: piszę tyle, ile wcześniej nie nadążałem
  • Odpowiedzi na YouTube/Reddicie: wcześniej — nigdy. Teraz — ile chcę.

Sumarycznie odzyskuję wyczuwalny kawałek dnia — wcześniej pochłaniało go pisanie. Wziąłem go i stopniowo wkładam w mój główny projekt poboczny, który od lat odkładałem.

Gdzie to działa najlepiej (mój top 3)

głos Gmail · styl biznesowy Slack · friendly Obsidian · notatki Telegram · krótko JEDEN SKRÓT → DOWOLNA APLIKACJA
Ten sam głos — cztery różne style, bez przełączania okien.

Najmocniej zmieniły się długie maile — to, czego najbardziej w pracy nienawidziłem. Dyktuję jak tłumaczę koledze, głosem proszę o styl biznesowy i dostaję tekst, który mój księgowy ostatnio skomentował: „pan zaczął pisać jakoś poważniej, znalazł pan copywritera?”. Nie, ja po prostu mówię do mikrofonu.

Dalej idą wątki na Slacku po angielsku. Jestem rodzimym użytkownikiem polskiego i wcześniej każda wiadomość w międzynarodowym zespole kosztowała mnie wewnętrznego tłumaczenia. Teraz po prostu mówię po polsku, proszę o friendly-English — i półtorej sekundy później tekst leci na czat. Przez pół roku nikt z kolegów niczego nie podejrzewał.

Szczególny przypadek to notatki podczas rozmowy. Mam mikrofon na słuchawkach, między zdaniami rozmówcy przytrzymuję klawisz i szybko dyktuję: „umówieni na czwartek, budżet doprecyzować u Marii”. Tekst ląduje w Obsidianie już sformatowany, bez konieczności rozpraszania się przełączaniem do notatek.

Co mnie irytuje

Nie jest idealnie. Trzy rzeczy, które łapię okresowo:

Pierwsza próba po długim przestoju — czasem chybia. Jeśli nie dyktowałem przez kilka godzin, pierwsze naciśnięcie skrótu może „zgubić” początek frazy. W świeżym buildzie wyraźnie się poprawiło, ale sporadycznie wciąż się to zdarza. Rozwiązanie — powiedzieć jedno testowe słowo po powrocie do laptopa. Sekundowy rytuał.

Bardzo głośna kawiarnia. Detektor głosu dobrze tnie pauzy, ale jeśli przy sąsiednim stoliku ktoś głośno się śmieje — czasem wstawia zbędne „aha-aha” na początku. Przełączam się na push-to-talk i problem znika.

Pierwsze pobranie po instalacji. Aplikacja ściąga komponenty do pracy offline. Na wolnym internecie jest to zauważalne. Raz w życiu — do zniesienia.

Czego już nie robię

  • Nie poprawiam literówek. Ich nie ma.
  • Nie przełączam układu klawiatury. Mówię w dowolnym języku, proszę o polerowanie w dowolnym.
  • Nie pamiętam, gdzie na klawiaturze jest „ż” (wcześniej chyba i tak go nie stawiałem).
  • Nie otwieram serwisów online do parafrazowania. Wszystko lokalnie.

TL;DR dla tych, którzy doskrolowali tutaj

Commander Flow to nie „fajny gadżet dla geeków”. To odjęcie z twojego dnia jednej z najbardziej męczących czynności — pisania — bez utraty jakości tekstu. Po miesiącu moja klawiatura fizycznie pokryła się kurzem na rzędzie cyfr — wcześniej w to bym nie uwierzył.

Wady są, ale są w kategorii „zauważam je, bo zawodowo szukam bugów”. Dla zwykłego użytkownika są niewidoczne.

Gdyby miesiąc temu ktoś mi powiedział „za 30 dni będziesz pisać półtora razy więcej, a palce — półtora razy mniej”, nie uwierzyłbym. Ale teraz właśnie tak to działa.

Częste pytania o wprowadzanie tekstu głosem

Czym jest Commander Flow i do czego służy?

To aplikacja desktopowa dla Windows, która zamienia głos w gotowy tekst w dowolnym aktywnym polu — w poczcie, czacie, dokumencie, IDE. Rozpoznaje mowę, usuwa słowa-pasożyty, dodaje interpunkcję i wstawia rezultat tam, gdzie znajduje się kursor. Sprawdza się zarówno przy krótkich wiadomościach, jak i przy długich listach i notatkach.

Czy wprowadzanie głosem działa bez internetu?

Tak. Domyślnie całe przetwarzanie odbywa się lokalnie, na twoim komputerze: zarówno rozpoznawanie mowy, jak i polerowanie tekstu. Internet nie jest potrzebny ani do uruchomienia, ani do codziennej pracy. To kluczowa różnica względem usług chmurowych, takich jak wbudowane dyktowanie w przeglądarce.

Jaki jest domyślny skrót klawiszowy?

Caps Lock — najrzadziej używany klawisz na każdej klawiaturze. Naciskasz, mówisz, zwalniasz — tekst pojawia się w aktywnym polu. Jeśli Caps Lock jest niewygodny, każdy inny skrót można przypisać jednym kliknięciem w ustawieniach.

Czy nadaje się do języka polskiego?

Tak, język polski jest w pełni obsługiwany, łącznie z mieszaną mową polsko-angielską. W sumie rozpoznawanych jest 25 języków, a przełączanie między nimi odbywa się głosem lub w ustawieniach.

Jakie są wymagania sprzętowe?

Współczesny laptop z 8–16 GB RAM wystarczy w większości trybów. Karta graficzna nie jest wymagana, ale jeśli jest — aplikacja używa jej automatycznie. Na bardzo starych maszynach działa tryb „Lekki” o obniżonych wymaganiach.

Wypróbuj sam

Pobierz Commander Flow i przytrzymaj Caps Lock w dowolnej aplikacji. Rozpoznawanie działa lokalnie, bez chmury — darmowy okres próbny w cenie.

Pobierz za darmo

Podobne historie

Wszystkie artykuły