IA local sem internet: hardware no máximo

IA local sem internet — portátil aberto com iluminação no processador e na memória

Tenho um portátil de 2022. Ryzen 7, 16 GB de RAM, gráfica integrada. Não é flagship. Antes do Commander Flow achava que para «IA a sério» precisaria de comprar um novo — com placa dedicada, 32 GB no mínimo, idealmente uma RTX 4090.

Um mês a usar o Commander Flow no portátil velho convenceu-me do contrário. Este software faz com o meu hardware aquilo que nunca tinha visto noutra aplicação de IA: pega no que existe e aproveita-o de forma óptima. Sem queixas de «pouca VRAM», sem «assina aqui para melhor performance».

Porque é que isto funciona

PIPELINE · TUDO LOCAL Atalho premido 🎙 Microfone eu falo Reconhecimento local Polimento LLM local Inserção em qualquer campo aquecimento do mic ao arrancar o polimento arranca em paralelo detecta o CPU, usa GPU se houver · 100% offline
Cada etapa optimizada para hardware comum, não para tope-de-gama.

Falei com a equipa e percebi que levam o hardware a sério. O que mais me impressionou: não puxam o utilizador para dentro da configuração. Todas as decisões que noutro software de IA são despejadas no utilizador como «escolha um runtime», aqui são tomadas pelo próprio produto.

O motor de reconhecimento de voz é deles, escolhido para CPU comum. Num portátil normal é várias vezes mais rápido do que as alternativas populares; o equilíbrio qualidade/velocidade está afinado para o hardware comum, não para os tope-de-gama de gaming. Depois há a auto-detecção: no meu portátil entra um modo, num CPU mais antigo entraria outro mais económico. Se houver GPU — é usada. Se não houver — corre tudo, calmamente, no processador. O mesmo binário, modos diferentes por dentro, nada a configurar.

Pormenor preferido — o aquecimento do microfone no arranque. Quando a aplicação abre, prepara já a captura de áudio para que o primeiro toque no atalho não gaste dezenas de milissegundos a inicializar. Ninguém vê isto. Mas quem usou antes assistentes de voz lentos sente a diferença logo no primeiro dia.

Outra coisa que considero subestimada: enquanto o motor reconhece a fala, o modelo de linguagem já se prepara em paralelo para a processar. Quando termina o reconhecimento — o polimento arranca sem nova pausa. É deste tipo de paralelismos pequenos que nasce a sensação de «reage de imediato».

«Boa engenharia é aquela que não se nota. Tudo simplesmente funciona depressa.»

O que consigo correr no portátil velho

No tray, num clique, escolhe-se o modo conforme o hardware:

  • Desligado — só ditado, sem polimento. Recursos mínimos, instantâneo.
  • Leve (~1 GB RAM) — polimento rápido, óptimo para ditado de todos os dias num portátil.
  • Médio (~2 GB RAM) — equilíbrio entre qualidade e velocidade.
  • Inteligente (~4 GB RAM) — por defeito. Melhor qualidade para a maioria das máquinas.
  • Polimento reforçado de entrada de voz (~1 GB RAM) — modo leve à parte que afina apenas o texto acabado de ditar.
  • Modo de prompting — o modelo maior, para trabalho sério com texto seleccionado e comandos de voz sobre ele.

Todos os modos — localmente, no meu hardware. Sem cloud. Sem latência de internet.

Para experimentar desliguei o Wi-Fi — e o Commander Flow continuou sem um único soluço. É mesmo offline.

No portátil tenho o «Inteligente» — aguenta. Quando estou em viagem e a bateria baixa, mudo para «Leve» num clique no tray. Quando preciso de retrabalhar a sério um pedaço grande seleccionado — mudo para «Modo de prompting», no desktop funciona perfeitamente.

Em que é melhor do que «IA na cloud»

IA EM CLOUD · vs · COMMANDER FLOW Cloud Commander Flow Latência ASR 300–800 ms 100–200 ms Latência do polimento 800–2000 ms 300–600 ms Sem internet ✗ não ✓ sim Fuga de dados possível impossível Preço subscrição / mês compra única Uso do hardware 0% 100%
Paguei por este portátil — porque é que tenho de alugar um servidor alheio?

Para comparar experimentei alguns ditadores cloud populares. Os números na tabela falam por si.

A última linha é a mais importante para mim em termos de filosofia. Paguei por este portátil, ele tem capacidade — porque é que tenho de alugar um servidor alheio quando já tenho o meu?

Onde o hardware se encolhe

Em máquinas muito antigas o modo «Leve» fica no limite. Funciona, mas o primeiro arranque demora bastante. Testei no portátil antigo da minha sogra — aceitável, mas não relâmpago. A equipa está a trabalhar em optimizações para hardware fraco.

Se houver outras aplicações pesadas a correr, a RAM passa a ser o gargalo. Quando tenho ao mesmo tempo browser, IDE e Commander Flow no «Inteligente» — o portátil às vezes engasga. Solução: passar para «Médio» ou «Leve» num clique no tray.

Carregamento inicial dos modelos. No primeiro arranque a aplicação descarrega componentes para funcionar offline. Em internet lenta nota-se. É só uma vez na vida — aceitável, mas convém saber.

O que percebi sobre as aplicações de IA modernas

A maioria das «aplicações de IA» em 2026 é apenas um wrapper sobre uma API cloud. Pagas a subscrição, és limitado em pedidos, os teus dados voam para datacenters alheios. É confortável — mas barato em termos de arquitectura. O programa em si não faz nada.

O Commander Flow é outra raça. É software de IA local que trata o meu computador como ferramenta de trabalho, e não como um terminal para enviar pedidos a uma GPU alheia.

É raro. É a direcção certa. É aquilo a que me apetece pagar (uma única vez, sem subscrição).

A quem vale a pena experimentar

Se tens um portátil com menos de cinco anos e 16+ GB de RAM — o Commander Flow vai espremer dele mais capacidade de IA do que esperas. Se tens hardware tope-de-gama — vai ainda mais depressa.

Em ambos os casos, usas o que já tens. Numa indústria onde a cloud vira subscrição para tudo, esta abordagem parece quase radical.

Perguntas frequentes sobre IA local e privacidade

Os meus dados saem para a cloud quando uso o Commander Flow?

Por defeito, não. Todo o reconhecimento de voz e o polimento de texto correm localmente, no seu dispositivo. Para a cloud não vai nada, a menos que ligue um modelo cloud nas definições e mude explicitamente para esse.

Quais são os requisitos de hardware para correr localmente?

Mínimo: processador moderno e 8 GB de RAM para o modo leve. Para o médio chegam 16 GB, para o mais potente — 16+ GB e, idealmente, GPU dedicada. A aplicação detecta o hardware e escolhe o modo óptimo.

É preciso GPU para correr a IA local?

Não é obrigatória. A aplicação corre em CPU. Se houver GPU — é usada automaticamente para acelerar. O mesmo binário, escolha dinâmica do modo conforme o hardware.

Funciona sem internet — por exemplo, num avião?

Sim. Depois da instalação inicial e do download dos componentes, a aplicação trabalha totalmente offline. Wi-Fi desligado ou inexistente — funciona sem atrasos e sem limites de pedidos.

É seguro ditar documentos confidenciais?

Sim, em modo local o conteúdo não sai do seu computador em nenhuma fase. Isto torna o Commander Flow adequado para documentos sob NDA, textos jurídicos, registos médicos e qualquer correspondência sensível.

Experimente

Baixe o Commander Flow e segure Caps Lock em qualquer aplicativo. O reconhecimento é local, sem nuvem — teste grátis incluso.

Baixar grátis

Histórias relacionadas

Todos os artigos