Lokale LLMs: Vergleich der Politur-Modi

Was ich an Commander Flow liebe: Es sperrt mich nicht in eine Konfiguration ein. Im Tray wähle ich mit einem Klick den Modus zur aktuellen Aufgabe – von leichter Politur im Akkubetrieb bis zum stärksten für ernsthafte Arbeit am markierten Text. In Consumer-KI-Apps eine Seltenheit.
Ich bin neugierig, also habe ich im April alle Modi mit echten Aufgaben durchgespielt. Hier mein Fazit: welcher wann.
Welche Modi es gibt
Im Tray sind es sechs. Ohne RAM-Zahlen und Tech-Details: einfach sechs Punkte auf der Skala „wie tief wird der Text bearbeitet". Von „gar nicht anfassen" (nur Diktat) bis „durch das größte Modell jagen, dichtes Ergebnis bekommen".
Ich habe jeden an realen Aufgaben getestet. Hier, was wofür passt.
Test 1: Politur eines normalen Diktats
Ich habe Dutzende Fragmente „wie lebendige Sprache" diktiert – mit Füllwörtern, Versprechern, Gedankenwechseln in der Mitte. Subjektiv geschaut: wie natürlich wischt der Modus Füllwörter, setzt Interpunktion und behält die Intonation.
- Leicht — schafft alles, was ich schnell und gewohnt sage. Manchmal ein Komma zu viel.
- Mittel — spürbarer Schritt nach vorn in „Menschlichkeit" der Politur. Gute Mitte für Laptops ohne GPU.
- Smart — beste Balance. Klingt, als hätte ich den Text sorgfältig geschrieben.
- Verstärkte Politur — nicht der „tiefste" Modus, aber der reaktionsschnellste. Gute Wahl, wenn man viele kleine Nachrichten diktiert.
Fazit hier: für Alltagsdiktate hat „Smart" am besten abgeschnitten, sofern die Hardware es trägt. Auf schwächeren Laptops arbeiten „Mittel" und „Leicht" qualitativ.
Test 2: Sprachbefehl über markiertem deutschsprachigem Text → Übersetzen und stilistisch umschreiben
Das schwerste Szenario: Ich diktiere auf Deutsch, markiere meinen Text und bitte per Stimme „ins Englische übersetzen, im Business-Stil". Der Modus muss übersetzen und stilistisch umschreiben, ohne Fakten zu verlieren.
- Leicht, Mittel — schaffen kurze Sätze. Bei längeren verlieren sie manchmal eine Idiom.
- Smart — zieht stabil Business-Stil in mehreren Sprachen. Meine Wahl für E-Mails.
- Prompting-Modus — der Beste bei komplexen Sprachbefehlen wie „förmlicher Stil, Anrede an eine Frau, ergänze einen Schlussabsatz mit Bestätigungsbitte". Wenn die Anweisung mehrschichtig ist – wechsle ich hierhin.
Test 3: Langer markierter Text (Doku ~1700 Wörter)
Belastung für die Kontextfähigkeit des Modells. Ich habe einen großen Doku-Block markiert und per Stimme gesagt „mache eine Zusammenfassung in fünf Punkten, hebe Zahlen hervor".
- Leicht — schafft es, übersieht aber gelegentlich Nuancen in „weiter entfernten" Absätzen.
- Mittel — übersieht stabil nichts.
- Smart — hält die Hierarchie des Wichtigen am besten.
- Prompting-Modus — bei sehr großen Auswahlen zieht er heraus, was leichtere Modi ignorieren. Lohnt sich, wenn die Zusammenfassung kritisch ist.
Test 4: Sprachbefehle über Code und Tech-Kommentaren
Hier bin ich anspruchsvoll. Ich will, dass technische Begriffe nicht umgeschrieben werden: kubectl bleibt kubectl, nicht „Kubernetes" usw.
Alle Modi lösen das ordentlich – Commander Flow nutzt intern das Begriffswörterbuch aus den Einstellungen, und jedes Modell hält sich daran. Auf „Smart" und im „Prompting-Modus" werden Kommentare sauberer und ordentlicher poliert, vor allem wenn der Kommentar gemischt ist (Deutsch + lateinische Bezeichner).
Wichtiger Architektur-Punkt: Commander Flow ist kein bloßer Wrapper um ein lokales Modell, es ist eine Stil- und Terminologie-Kontrollschicht darüber. Deshalb ist selbst der leichteste Modus deutlich besser als ein „nacktes" lokales Modell.
Was ich am Ende gewählt habe
Default: Smart. Beste Qualität bei vernünftigem RAM. Deckt das Meiste ab – Diktat, E-Mails, Chats, einfache Sprachbefehle über markiertem Text.
Wechsel zum Prompting-Modus: bei komplexen, mehrstufigen Sprachbefehlen über markiertem Text, langen Zusammenfassungen, feiner Stilistik. Hier arbeitet das größte Modell.
Wechsel zu Leicht: wenn ich unterwegs bin und auf dem Akku. Energieverbrauch sinkt, Qualität ist Basis – aber die Mail an Mama wird trotzdem ordentlich.
Verstärkte Politur – meine Wahl, wenn ich sitze und viele kurze Chat-Nachrichten diktiere. Reaktionsschnell und qualitativ.
Aus – für den Notfall, wenn ich nacktes Speech-to-Text ohne Bearbeitung brauche (z. B. Ideen-Dump in eine Datei).
Was das am Produkt verändert
Modi direkt im Tray ohne Neustart wechseln zu können – das ist enorme Freiheit. Ich passe das Werkzeug an die aktuelle Aufgabe in zwei Klicks an.
Commander Flow ist offenbar so gebaut, dass lokale Modelle laufend aktualisiert werden und der Nutzer nicht von dem abhängt, was beim Kauf neu war. Das Team zieht regelmäßig neue Architekturen in die Modi nach.
„Gute KI-Software altert langsamer als die Hardware. Commander Flow gehört dazu."
Worauf man achten sollte
Modus-Wechsel braucht Ladezeit. Von schwer auf leicht – fast sofort. Zurück – ein paar Sekunden zum Laden vom Datenträger. Selten nötig, aber wer „mal eben einen anderen probieren" will, muss kurz warten.
Speicherbedarf. Alle Modus-Komponenten zusammen brauchen einen ordentlichen Brocken Festplatte. Unbenutzte lassen sich aus den Einstellungen entfernen, aber bei der ersten Runde „mal schauen, was es gibt" wundert man sich.
Der stärkste Modus braucht ordentliche Hardware. Auf einem alten Laptop läuft der Prompting-Modus langsam. Bei schwacher Hardware muss man bei Smart oder darunter bleiben.
Wer das überhaupt braucht
Die meisten Nutzer wechseln nie Modi. Sie installieren Commander Flow, sehen, dass „Smart" toll läuft – und sind glücklich.
Aber wer tiefer schauen will – hier gibt es etwas zu graben, und es lohnt sich. Mein Setup steht, ich wechsle Modi nach Kontext – und das fühlt sich nach sehr reifer Produktarbeit an.
Ich gehe weiter im Smart-Modus arbeiten. Und schreibe den nächsten Artikel.
Selbst ausprobieren
Lade Commander Flow herunter und halte Caps Lock in einer beliebigen App gedrückt. Die Erkennung läuft lokal, ohne Cloud — kostenlose Testphase inklusive.


