Wprowadzanie głosem w Telegram, WhatsApp, Slack, Discord

Wprowadzanie głosem w Telegram, WhatsApp, Slack — smartfon i laptop z otwartymi czatami

Mam sześć komunikatorów. Telegram (osobiste i praca), WhatsApp (rodzina), Slack (aktualny klient), Discord (dwie społeczności), Signal (bezpieczne rozmowy) i niespodziewanie wracający ICQ (nie, żartuję, ale iMessage przez iCloud Web też liczę).

W każdym — własne konwencje, własne tempo, własny styl. Wcześniej traciłem siły umysłowe na przełączanie się między nimi. Teraz mam jeden skrót i jeden nawyk.

Jak wygląda mój korespondencyjny dzień

JEDEN JA · TRZY RÓŻNE GŁOSY Rano friendly mama na Telegramie „Dziękuję, mamo!” Dzień business klient na Slacku „Do środy zdążę” Wieczór minimal-edit znajomy na Discordzie „stary to ogień”
Ten sam skrót, różne komendy głosowe — rozpoznawalna „osobowość” w każdym kanale.

Na Telegramie pisze mama — o działce. Trzymam klawisz, mówię: „dzięki mamo, w sobotę przyjedziemy, biorę szaszłyki, całuję”. Komenda głosowa: „przyjaźnie, jak zwykle do żony”. W czacie pojawia się: „Dziękuję, mamo! W sobotę przyjedziemy. Biorę szaszłyki. Całuję”. Nikt nie robi taryfy ulgowej dlatego, że dyktowałem.

Parę minut później — Slack, klient o deadline. Ten sam klawisz, głos: „styl biznesowy, krótko”. Na Slacka leci: „Rozumiem. Do środy zdążę. W środę rano przyślę draft do review.” Żadnych „w sumie” i „no”. Żadnego dopasowywania.

A jeszcze minutę później — Discord, ekipa z gamedevu omawia shader. Ten sam klawisz, ale mówię: „zostaw jak powiedziałem, bez poprawek”. W czacie pojawia się: „stary to w ogóle ogień jak ten compute shader tak rozkręciłeś”. Dokładnie tak, jak westchnąłem.

„Trzy różne tony w trzech czatach pod rząd — bez przełączania układu, bez zmiany stanu, bez osobnych aplikacji do każdego tonu.”

Test: „zgadnij, do którego czatu właśnie pisałem”

Kiedyś dla eksperymentu poprosiłem żonę, żeby zgadła po moich wiadomościach, do kogo je piszę. Zgadła wszystkie. I nie była to magia — Commander Flow dostosowuje rejestr, długość, użycie emoji i formalność do komendy głosowej, którą właśnie wypowiedziałem.

Z mamą — krótkie zdania, wykrzykniki, ciepłe zwroty.
Z klientem — bez emocji, do faktów, jasne terminy, bez „w sumie”.
Ze znajomymi — słowa z żywej mowy, nie „poprawiane” do literackich.

Dlaczego to jest szczególnie ważne dla osób, dla których to nie pierwszy język

Opowiem o swojej rosyjskojęzycznej cioci, która wyemigrowała do Kanady i pracuje tam w HR. Pisze w pracy po angielsku, w domu po rosyjsku, z ukraińskimi koleżankami po ukraińsku. Wcześniej miała chmurowy tłumacz w jednej karcie i chmurowy edytor stylu w drugiej cały czas.

Postawiłem jej Commander Flow na 60-tkę. Dyktuje po rosyjsku, mówi „w business English” — i pisze do kolegów jak native speaker. Zmienia komendę na „przyjaźnie, po ukraińsku” — i pisze do koleżanek ciepłą wiadomość. Bez przełączania układu klawiatury. Bez kart. Bez „jak to lepiej powiedzieć po angielsku”.

W swoje 60 lat korzysta z voice-input lepiej niż wielu dwudziestolatków. Bo dla niej to nie „technologia dla technologii”, tylko rozwiązanie realnego obciążenia językowego.

Jak to sprawia, że „pisanie do czatu” staje się tanie

Po paru miesiącach zmienił mi się nawyk codzienny: zacząłem odpowiadać wszystkim po kolei. Wcześniej mogłem zignorować wiadomość, bo „długa odpowiedź to długo i mi się nie chce”. Teraz otwieram czat, mówię jedną frazę jak myślę, dostaję porządny tekst w parę sekund.

W moim notatniku pojawiła się reguła: „jeśli odpowiedź zajęłaby mniej niż 5 sekund — odpowiadaj od razu”. Wcześniej ta reguła nie działała, bo każda odpowiedź zajmowała minimum 30 sekund. Teraz działa.

Efekt: stałem się znacznie bardziej social. Poprawiły się moje relacje z mamą, regularnie odpisuję kolegom z klasy, którym wcześniej odpisywałem „zadzwonimy jak będę mógł”. Nie spodziewałem się takiego efektu ubocznego od technologii.

Gdzie miewam tarcia

W Discordzie czasem „połyka” początek głosowej komendy. Jeśli mam otwartego Discorda i w nim aktywny voice-channel, czasem konflikt o mikrofon. Rozwiązuje się przełączeniem mikrofonu w ustawieniach Discorda na push-to-talk. Raz ustawiłem — zapomniałem.

WhatsApp Web w przeglądarce czasem nie pozwala wkleić tekstu z powodu ich JS-przechwytywania. To nie problem Commander Flow, to problem WhatsAppa. Workaround — przełączyć strategię wstawiania na clipboard-paste dla konkretnego procesu. W ustawieniach jest allowlist po aplikacjach.

Jeśli dyktuję zbyt cicho w głośnym pokoju i proszę o „przyjaźnie” — model czasem „dośpiewuje” emocję. Mówię neutralnie, dostaję coś zbyt optymistycznego. To już o moją artykulację, nie o narzędzie. Rozwiązało się nawykiem mówienia trochę wyraźniej.

Czego nie spodziewałem się po technologii

Największą wartością Commander Flow w czatach jest zdjęcie psychologicznego kosztu komunikacji. Kiedy napisanie wiadomości jest niemal darmowe, jesteś dostępny dziesiątki razy częściej. To zmienia twój społeczny krajobraz.

Stałem się uważniejszy wobec ludzi. Nie dlatego, że wewnętrznie się zmieniłem, tylko dlatego, że między intencją „odpowiedzieć” a realną wiadomością zniknęły te dwie minuty, dla których wcześniej odkładałem na potem i zapominałem.

Dobre narzędzia chyba właśnie tak działają.

Wypróbuj sam

Pobierz Commander Flow i przytrzymaj Caps Lock w dowolnej aplikacji. Rozpoznawanie działa lokalnie, bez chmury — darmowy okres próbny w cenie.

Pobierz za darmo

Podobne historie

Wszystkie artykuły