Друкувати голосом: клавіатура вкрилася пилом

Сьогодні я знімав відео на телефон для дружини — показати, як у мене вдома облаштований робочий стіл. Поставив камеру під нахилом, провів пальцем по клавіші F і… зібрав на палець видимий шар пилу. На цифровому ряду пилу ще більше. На клавішах із символами ({, }, [, ]) — майже як на полиці за шафою.
Це і є фізичний ROI від Commander Flow.
Звідки стільки пилу
У мене механіка на коричневих свічах. До вересня я вибивав її раз на тиждень — струшував крихти, продував, протирав. Зараз? Не пам'ятаю, коли востаннє це робив.
Відповідь проста: я майже не друкую. Мій день виглядає так:
- 06:30 — кава, відкриваю Telegram, відповідаю всім голосом через хоткей
- 07:00 — Gmail, диктую 10 листів поспіль
- 09:00 — робочий дзвінок, нотатки голосом в Obsidian між фразами співрозмовників
- Протягом дня — Slack, Discord, GitHub issues, усе голосом
- Увечері — пости в LinkedIn, теж голосом
Реальний друк у мене залишився в трьох місцях: команди в терміналі, паролі (раз на день, та й то не завжди) та хоткеї. Усе інше — Commander Flow.
«Я перестав помічати, що в мене є клавіатура. Це поганий тест на пил і добрий тест на інструмент.»
Що мене вразило більше за пил
Тиша. Я працюю в орендованій квартирі, у нас тонкі стіни. Сусіди роками чули мою механіку — особливо Enter, я завжди бив по ньому сильніше. Зараз у квартирі зі звуків — тільки мій голос, неголосно, хвилин на 5–10 на годину сумарно. Сусідка знизу при зустрічі сказала «у вас щось змінилося, стало зовсім тихо». Я не став пояснювати про офлайн-LLM.
Я не «голосова людина», і в цьому фокус
До Commander Flow я ніколи не користувався голосовим введенням. Siri мене дратувала. Google Assistant — теж. У мене не було звички «говорити з пристроєм». Якби ви сказали мені у 2024-му, що я перейду на voice-input, я б посміявся.
Що перемкнуло?
Нічого не йде в хмару. Я працюю з конфіденційними документами клієнтів. Будь-який хмарний диктувальник був для мене неробочим варіантом просто через NDA. Commander Flow крутить Whisper та LLM локально — я можу диктувати зміст будь-якого договору і бути спокійним. Це знімає головний бар'єр.
Жодних «команд» — звичайне диктування. Тут не треба говорити «Окей Гугле, напиши лист». Затискаєш клавішу та говориш як думаєш — рівно те, що надрукував би пальцями. Без wake-word, без незручного ритуалу «я звертаюся до асистента».
Що мене поки чіпляє
Мене попросили писати чесно, не як промо. Гаразд.
Я не можу диктувати в громадському транспорті. Ну тобто можу, але люди дивляться. Це моя особиста соціальна проблема, не проблема софту, але факт залишається: на ноутбуці в кафе я диктую тихо у комір, і це виглядає дивно. Розв'язок — звикнути. Через місяць я перестав соромитися.
На дуже гучних дзвінках хоткей інколи не встигає захопити початок. Якщо я вже говорю з кимось телефоном і одночасно диктую в Slack — VAD ловить чужий голос. Це рідкісний сценарій, але він є. Команда працює над прив'язкою до конкретного пристрою введення.
Побічний ефект, на який ніхто не розраховував
Я почав говорити краще в житті. Не швидше, не голосніше — структурніше. Місяці щоденного диктування листів і постів натренували мене формулювати думку одним реченням. Дружина нещодавно пожартувала, що я «тепер говорю як пишу». Це було до того, як вона дізналася, що я більше не пишу.
Що залишилося від старої клавіатури
Та клавіатура з пилом — вона досі стоїть на столі. Я не прибрав її, не замінив, не перейшов на маленьку. Вона потрібна для команд, паролів, IDE. Просто з основного інструмента вона перетворилася на запасний.
Із самого застосунку зробили багато різного, але саме цей ефект — перетворення основного інструмента на запасний — виявився найнесподіванішим.
Спробуйте самі
Завантажте Commander Flow і затисніть Caps Lock у будь-якій програмі. Розпізнавання працює локально, без хмари — безкоштовний пробний період включено.


