Hlasové zadávání textu: 30 dní bez klávesnice

Hlasové zadávání textu na počítači: zaprášená klávesnice a studiový mikrofon

Patřím k těm pedantům, kteří si „pro zajímavost“ pověsili na notebook KeyCounter. Po měsíci používání Commander Flow jsem ho otevřel a podíval se na čísla – stisků klesl několikanásobně. A to navzdory tomu, že množství práce u mě naopak narostlo: vzal jsem si dva nové klienty a začal vést anglicky psaný blog.

Tohle není „technologická recenze“. Spíš pozorování člověka, který si jednoho dne přestal všímat, že vůbec píše.

Osm kroků, které už nedělám

Pokaždé, když jsem potřeboval napsat klientovi e-mail bez překlepů, dělal jsem tohle:

Alt+Tab → Word → koncept → vybrat → Ctrl+C → Alt+Tab → Gmail → Ctrl+V → ještě jednou pročíst

Teď: dám kurzor do Gmailu, podržím zkratku, mluvím tak, jak myslím, pustím. Za vteřinu je v poli souvislý odstavec bez „ehm”, „jakože”, bez dvojitých mezer, se správným velkým písmenem na začátku a tečkou na konci. Odstavec, který bych jinak pět minut upravoval, tam je rovnou hotový.

„Nepíšu rychleji. Já prostě nepíšu.“

Co jsem si za měsíc všiml

MÉ STISKY KLÁVES ZA MĚSÍC DŘÍV obvyklý objem psaní TEĎ několikanásobně méně – beze ztráty produktivity
Objem práce neklesl – prsty jen přestaly bušit do kláves.

Pozoruju se od pondělí do pátku. Tady jsou typické posuny:

  • E-maily klientům: znatelně rychleji – to, co dřív zabralo dobrou půlku rána, dnes uzavřu za nějakých deset minut
  • Konverzace na Slacku a Telegramu: už v chatech „nezamrzávám“ – krátké zprávy odlétají za vteřiny
  • Poznámky během hovorů: píšu toho tolik, kolik jsem dřív nestíhal
  • Odpovědi na YouTube/Reddit: dřív nikdy. Teď tolik, kolik chci.

Dohromady mi denně vzniká citelný kus volného času – ten dřív padl na psaní. Vzal jsem si ho a postupně vrátil do svého hlavního pet projektu, který jsem roky odkládal.

Kde to funguje nejlíp (moje top 3)

hlas Gmail · obchodní styl Slack · friendly Obsidian · poznámky Telegram · krátká zpráva JEDNA ZKRATKA → JAKÁKOLI APLIKACE
Stejný hlas – čtyři různé styly, bez přepínání oken.

Nejvíc se změnily dlouhé e-maily – to, co jsem v práci nesnášel ze všeho nejvíc. Diktuju, jako bych vysvětloval kamarádovi, hlasem si vyžádám obchodní styl a dostanu text, který nedávno můj účetní okomentoval slovy „začínáte psát nějak solidněji, sehnal jste copywritera?“. Ne, jen mluvím do mikrofonu.

Hned za nimi jsou Slackové vlákna v angličtině. Můj rodný jazyk je čeština a dřív mě každá zpráva v mezinárodním týmu stála vnitřní překlad. Teď prostě mluvím česky, vyžádám si friendly English – a do chatu to za zhruba vteřinu a půl odlétá. Za půl roku to nikdo z kolegů nepoznal.

Speciální případ jsou poznámky během hovoru. Mám headset s mikrofonem, mezi větami protistrany podržím klávesu a rychle nadiktuji: „Domluveno na čtvrtek, rozpočet ověřit u Marie.“ Text padne přímo do Obsidianu už naformátovaný, aniž bych se odpoutával do poznámek.

Co mě štve

Není to dokonalé. Tři věci, které čas od času chytám:

První pokus po dlouhé pauze – občas mine. Když jsem nediktoval pár hodin, první stisk zkratky může „ztratit“ začátek věty. V čerstvém buildu se to znatelně zlepšilo, ale občas to ještě chytím. Řešení – po návratu k notebooku si říct jedno testovací slovo. Vteřinový rituál.

Hodně hlučná kavárna. Detekce hlasu pauzy ořezává dobře, ale když se u vedlejšího stolu hlasitě smějí, občas přidá zbytečné „uhm-uhm“ na začátek. Přepnu na push-to-talk a problém je pryč.

První stažení po instalaci. Aplikace si stahuje komponenty pro offline provoz. Na pomalém internetu je to znát. Jednou za život – snesitelné.

Co už nedělám

  • Neopravuju překlepy. Žádné nejsou.
  • Nepřepínám klávesnici. Mluvím v jakémkoli jazyce, polotuju do jakéhokoli.
  • Už si nepamatuju, kde je na klávesnici „ě“ (dřív jsem ho stejně asi nepsal).
  • Neotvírám online služby na přeformulování. Všechno běží lokálně.

TL;DR pro ty, kdo přescrolovali

Commander Flow není „cool hračka pro geeky“. Je to odečet jedné z nejúmornějších denních činností – psaní – beze ztráty kvality textu. Za měsíc se mi klávesnice fyzicky pokryla prachem na číselné řadě – tomu bych dřív nevěřil.

Mínusy existují, ale spadají do kategorie „všímám si jich proto, že profesionálně hledám chyby“. Pro běžného uživatele jsou neviditelné.

Kdyby mi před měsícem někdo řekl „za 30 dní budeš psát o polovinu víc a prsty budeš zaměstnávat o polovinu míň“, neuvěřil bych mu. Jenže přesně tak to funguje.

Časté otázky o hlasovém zadávání textu

Co je Commander Flow a k čemu slouží?

Je to desktopová aplikace pro Windows, která mění hlas v hotový text v jakémkoli aktivním poli – v poště, chatu, dokumentu, IDE. Rozpoznává řeč, odstraňuje slovní vatu, doplňuje interpunkci a vkládá výsledek tam, kde stojí kurzor. Hodí se na krátké zprávy i dlouhé dopisy a poznámky.

Funguje hlasové zadávání bez internetu?

Ano. Veškeré zpracování ve výchozím nastavení probíhá lokálně, na vašem počítači: rozpoznání řeči i finální úprava textu. Internet nepotřebujete ani ke spuštění, ani k běžné práci. To je klíčový rozdíl oproti cloudovým službám typu vestavěné diktování v prohlížeči.

Jaká je výchozí klávesová zkratka?

Caps Lock – nejméně používaná klávesa na každé klávesnici. Stiskněte, mluvte, pusťte – text se objeví v aktivním poli. Pokud vám Caps Lock nevyhovuje, jakoukoli jinou zkratku nastavíte jedním kliknutím v nastavení.

Hodí se i pro češtinu?

Ano, čeština je plně podporována včetně mísení s angličtinou. Celkově se rozpoznává 25 jazyků, přepínání mezi nimi probíhá hlasem nebo v nastavení.

Jaké jsou požadavky na hardware?

Současný notebook s 8–16 GB operační paměti pro většinu režimů stačí. Grafická karta není povinná, ale pokud ji máte, aplikace ji využije automaticky. Na opravdu starých strojích funguje „Lehký“ režim s nižšími nároky.

Vyzkoušejte to

Stáhněte si Commander Flow a podržte Caps Lock v jakékoli aplikaci. Rozpoznávání běží lokálně, bez cloudu — zkušební verze zdarma v ceně.

Stáhnout zdarma

Související příběhy

Všechny články