Голосове введення тексту: 30 днів без клавіатури

Я той самий зануда, який почепив KeyCounter на ноутбук «заради інтересу». Через місяць використання Commander Flow я відкрив його та подивився на цифри — натискання впали в кілька разів. І це попри те, що обсяг роботи в мене зріс: я взяв двох нових клієнтів і почав вести англомовний блог.
«Технологічним оглядом» це не назвеш. Радше спостереження людини, яка одного разу перестала помічати, що вона взагалі друкує.
Вісім кроків, яких більше немає
Щоразу, коли мені потрібно було написати листа клієнту без помилок, я робив ось що:
Alt+Tab → Word → чернетка → виділити → Ctrl+C → Alt+Tab → Gmail → Ctrl+V → дочистити
Тепер: ставлю курсор у Gmail, тримаю хоткей, говорю як думаю, відпускаю. За секунду в полі — зв'язний абзац без «еее», «ну», без подвійних пробілів, з правильною великою літерою та крапкою в кінці. Параграф, який я б редагував хвилин п'ять, з'являється готовим.
«Я не друкую швидше. Я просто не друкую.»
Що я помітив за місяць
Я веду спостереження з понеділка по п'ятницю. Ось характерні зрушення:
- Листи клієнтам: помітно швидше — те, на що раніше йшла добра частина ранку, закриваю хвилин за десять
- Slack/Telegram листування: більше не «зависаю» у чатах надовго — короткі повідомлення йдуть за секунди
- Нотатки під час дзвінків: пишу стільки, скільки раніше не встигав
- Відповіді на YouTube/Reddit: раніше — ніколи. Тепер — скільки хочу.
Сумарно в мене вивільняється відчутний шматок дня — раніше він ішов на друк. Я взяв його та поступово повернув у свій головний пет-проєкт, який роками відкладав.
Де це працює найкраще (мій топ-3)
Найсильніше змінилися довгі листи — те, що я раніше ненавидів найбільше в роботі. Диктую, як пояснюю другові, голосом прошу діловий стиль і отримую текст, який мій бухгалтер нещодавно прокоментував: «Ви стали писати якось солідніше, знайшли копірайтера?». Ні, я просто говорю в мікрофон.
Далі йдуть Slack-треди англійською. Я носій української, і раніше кожне повідомлення в міжнародній команді коштувало мені внутрішнього перекладу. Зараз просто говорю українською, прошу friendly-English — і за півтори секунди текст іде в чат. За пів року ніхто з колег не запідозрив.
Особливий кейс — нотатки під час дзвінка. Я з мікрофоном на гарнітурі, між фразами співрозмовника затискаю клавішу та швидко надиктовую: «Домовилися на четвер, бюджет уточнити в Маші». Текст падає в Obsidian уже відформатованим, без потреби відволікатися на перемикання в нотатки.
Що мене дратує
Не ідеально. Три речі, які ловлю періодично:
Перша спроба після довгого простою — інколи промахується. Якщо я не диктував кілька годин, перше натискання хоткея може «загубити» початок фрази. У свіжому білді стало помітно краще, але зрідка ловлю досі. Розв'язок — сказати одне тестове слово після повернення за ноутбук. Секундний ритуал.
Дуже галаслива кав'ярня. Детектор голосу ріже паузи добре, але якщо за сусіднім столом гучно сміються — інколи додає зайве «угу-угу» на початку. Перемикаюся на push-to-talk і питання знімається.
Перше завантаження після інсталяції. Застосунок качає компоненти для офлайн-роботи. На повільному інтернеті це помітно. Один раз у житті — терпимо.
Що я більше не роблю
- Не виправляю друкарських помилок. Їх немає.
- Не перемикаю розкладку. Говорю будь-якою мовою, прошу полірування будь-якою.
- Не пам'ятаю, де ї на клавіатурі (раніше я її, здається, і не ставив).
- Не відкриваю онлайн-сервіси для перефразування. Усе локально.
TL;DR для тих, хто проскролив сюди
Commander Flow — це не «класна фішка для гіків». Це віднімання з вашого дня однієї з найвиснажливіших активностей — друку — без втрати якості тексту. За місяць моя клавіатура фізично вкрилася пилом на цифровому ряду — раніше я б такому не повірив.
Мінуси є, але вони в категорії «я їх помічаю, бо професійно шукаю баги». Для звичайного користувача вони невидимі.
Якби місяць тому мені сказали «через 30 днів ти писатимеш у півтора раза більше, а пальці — у півтора раза менше», я б не повірив. Але зараз саме так це й працює.
Часті питання про голосове введення тексту
Що таке Commander Flow і для чого він потрібен?
Це десктопний застосунок для Windows, який перетворює голос на готовий текст у будь-якому активному полі — пошті, чаті, документі, IDE. Розпізнає мову, прибирає слова-паразити, розставляє пунктуацію та вставляє результат туди, де стоїть курсор. Підходить як для коротких повідомлень, так і для довгих листів та нотаток.
Чи працює голосове введення без інтернету?
Так. За замовчуванням уся обробка йде локально, на вашому комп'ютері: і розпізнавання мови, і полірування тексту. Інтернет не потрібен ні для запуску, ні для повсякденної роботи. Це ключова відмінність від хмарних сервісів на кшталт вбудованого диктування браузера.
Який хоткей за замовчуванням?
Caps Lock — найрідше використовувана клавіша на будь-якій клавіатурі. Затиснули, говорите, відпустили — текст з'явився в активному полі. Якщо Caps Lock незручний, будь-який інший хоткей призначається одним кліком у налаштуваннях.
Чи підходить для української мови?
Так, українська мова повністю підтримується, включно зі змішаною українсько-англійською мовою. Загалом розпізнаються 25 мов, перемикання між ними — голосом або в налаштуваннях.
Які вимоги до заліза?
Сучасний ноутбук з 8–16 ГБ оперативної пам'яті достатньо для більшості режимів. Відеокарта не обов'язкова, але якщо є — застосунок використовує її автоматично. На зовсім старих машинах працює «Легкий» режим зі зниженими вимогами.
Спробуйте самі
Завантажте Commander Flow і затисніть Caps Lock у будь-якій програмі. Розпізнавання працює локально, без хмари — безкоштовний пробний період включено.


