Röststyrning i Windows: 30 dagar utan tangentbord

Röststyrning vid datorn: dammigt tangentbord och studiomikrofon

Jag är pedanten som installerade en KeyCounter på datorn ”bara av nyfikenhet”. Efter en månad med Commander Flow öppnade jag den och tittade på siffrorna – mina tangenttryckningar har sjunkit flerfaldigt. Och det trots att arbetsbördan har vuxit: jag tog in två nya kunder och drog igång en engelskspråkig blogg.

Det här är ingen ”teknikrecension”. Snarare iakttagelser från någon som plötsligt slutat lägga märke till att han över huvud taget skriver.

Åtta steg jag inte längre tar

Varje gång jag behövde skriva ett e-postmeddelande till en kund utan stavfel, gjorde jag såhär:

Alt+Tab → Word → utkast → markera → Ctrl+C → Alt+Tab → Gmail → Ctrl+V → finputsa

Nu: jag sätter markören i Gmail, håller in snabbkommandot, pratar som jag tänker, släpper. En sekund senare står det ett sammanhängande stycke i fältet – utan “öh” och “liksom”, utan dubbla mellanslag, med korrekt versal i början och punkt i slutet. Ett stycke jag hade lagt fem minuter på att redigera dyker upp färdigt.

”Jag skriver inte snabbare. Jag skriver helt enkelt inte alls.”

Vad jag har lagt märke till på en månad

MINA TANGENTTRYCK PER MÅNAD FÖRE vanlig skrivvolym EFTER flerfaldigt mindre – utan att producera mindre
Arbetsbördan har inte minskat – fingrarna har bara slutat smattra.

Jag observerar mig själv från måndag till fredag. Här är de typiska skiftena:

  • Kundmejl: märkbart snabbare – det som tidigare slukade en god del av förmiddagen klarar jag av på tio minuter
  • Slack/Telegram-kommunikation: jag fastnar inte längre i chattar – korta meddelanden går iväg på sekunder
  • Anteckningar under samtal: jag hinner med så mycket som jag aldrig hann tidigare
  • Svar på YouTube/Reddit: förr aldrig. Nu så mycket jag vill.

I slutändan vinner jag tillbaka en ordentlig bit av min dag – tid som tidigare gick till att skriva. Den biten har jag tagit och stoppat tillbaka i mitt huvudprojekt, det jag skjutit framför mig i åratal.

Där det fungerar bäst (mina tre favoriter)

röst Gmail · affärsstil Slack · friendly Obsidian · anteckningar Telegram · kort ETT SNABBKOMMANDO → ALLA APPAR
Samma röst – fyra olika stilar, utan att byta fönster.

Det som förändrats mest är långa mejl – det jag hatade allra mest med jobbet. Jag dikterar som om jag förklarade för en vän, ber muntligt om affärsstil och får en text som min revisor härom dagen kommenterade med ”ni skriver liksom mer säkert nu, har ni anlitat en textförfattare?”. Nej, jag bara pratar i mikrofonen.

Direkt efter kommer Slack-trådarna på engelska. Jag är inte modersmålstalare, och förr kostade varje meddelande till det internationella teamet mig en inre översättning. I dag dikterar jag bara på mitt modersmål, ber om friendly English – och en och en halv sekund senare ligger meddelandet i chatten. På ett halvår har ingen kollega anat något.

Ett särskilt fall är anteckningar under videomöten. Jag har headset på och trycker kort på snabbkommandot mellan motpartens meningar: ”Möte torsdag bekräftat, budgeten kollas med Maria”. Texten landar färdigformaterad i Obsidian, utan att jag behöver byta till anteckningsappen.

Det som irriterar mig

Det är inte perfekt. Tre saker som jag fortfarande märker:

Första försöket efter en lång paus – missar ibland. Om jag inte dikterat på flera timmar kan det första snabbkommandotrycket ”tappa” början av meningen. I den senaste versionen är det märkbart bättre, men jag fångar det fortfarande då och då. Lösning: säg ett testord när du kommer tillbaka till datorn. En sekunds rutin.

Riktigt högljutt kafé. Röstdetektorn klipper bort pauser fint, men om någon skrattar högt vid bordet bredvid smyger sig ibland ett ”ehm-ehm” in i början. Jag växlar till push-to-talk – problemet löst.

Första nedladdningen efter installation. Appen laddar ner komponenterna för offlinekörning. På långsamt internet märks det. En gång i livet – fullt acceptabelt.

Det jag inte längre gör

  • Rättar stavfel. Det finns inga.
  • Byter tangentbordslayout. Jag pratar på vilket språk som helst, ber om putsning på vilket som helst.
  • Tänker på var å, ä, ö ligger på tangentbordet (jag är inte ens säker på att jag alltid satte dem rätt förut).
  • Öppnar molntjänster för att skriva om text. Allt kör lokalt.

TL;DR för dig som scrollade hit

Commander Flow är ingen ”cool grej för nördar”. Det är en av de tröttaste sysslorna i din dag – skrivandet – helt enkelt borttagen, utan att texten blir sämre. På en månad har mitt tangentbord blivit synligt dammigt på sifferraden – det hade jag själv inte trott.

Det finns svagheter, men de hör till kategorin ”jag märker dem för att jag letar buggar yrkesmässigt”. För vanliga användare är de osynliga.

Hade någon sagt till mig för en månad sedan: ”Om 30 dagar skriver du en och en halv gång så mycket och trycker på tangenter en och en halv gång så lite” – då hade jag inte trott det. Men nu är det precis så det fungerar.

Vanliga frågor om röststyrning

Vad är Commander Flow och vad används det till?

En skrivbordsapplikation för Windows som omvandlar tal till färdig text i vilket aktivt fält som helst – e-post, chatt, dokument, IDE. Den känner igen tal, plockar bort utfyllnadsord, sätter ut skiljetecken och klistrar in resultatet där markören står. Lika lämplig för korta meddelanden som för långa brev och anteckningar.

Fungerar röststyrningen utan internet?

Ja. Som standard sker hela bearbetningen lokalt på din dator: både taligenkänning och textputsning. Internet behövs varken för start eller i vardagen. Det är den centrala skillnaden mot molntjänster som webbläsarens inbyggda diktering.

Vilket snabbkommando är inställt som standard?

Caps Lock – den minst använda tangenten på vilket tangentbord som helst. Håll in, prata, släpp – texten dyker upp i det aktiva fältet. Om Caps Lock känns opraktiskt går det att ställa in vilken annan snabbkommandotangent som helst med ett klick i inställningarna.

Passar det för svenska?

Ja, svenska stöds fullt ut, även blandad svenska och engelska. Totalt känns 25 språk igen – byte sker antingen med rösten eller i inställningarna.

Vilka hårdvarukrav finns?

En modern bärbar dator med 8–16 GB RAM räcker för de flesta lägen. Grafikkort är inte ett krav, men används automatiskt om det finns. På äldre datorer fungerar det ”Lätta” läget med lägre krav.

Prova själv

Ladda ner Commander Flow och håll inne Caps Lock i valfri app. Igenkänningen körs lokalt, utan moln — gratis provperiod ingår.

Ladda ner gratis

Relaterade berättelser

Alla artiklar