Make Mini the default KittenTTS variant

Alex-Wengg · Alex-Wengg · commit 762a3dea1c07 · 2026-03-22T12:40:49.000-04:00
Add 'kitten' backend option that defaults to Mini (82M params) instead
of requiring explicit 'kitten-mini' flag. Users can still use
'kitten-nano' for the smaller 15M model.

Rationale:
- Mini has better quality (3.13x RTF vs 1.12x for Nano)
- Mini supports speed control, Nano does not
- 82M is still relatively small and runs well on Apple Silicon

Changes:
- Add 'kitten' and 'kittentts' backend options → .kittenTts(.mini)
- Update help text to show 'kitten (Mini 82M)' option
- KittenTtsManager already defaults to .mini in its initializer
diff --git a/Sources/FluidAudioCLI/Commands/TTSCommand.swift b/Sources/FluidAudioCLI/Commands/TTSCommand.swift
@@ -201,6 +201,8 @@ public struct TTS {
                         backend = .kokoro
                     case "pocket", "pockettts":
                         backend = .pocketTts
+                    case "kitten", "kittentts":
+                        backend = .kittenTts(.mini)  // Default to Mini (82M)
                     case "kitten-nano", "kittennano":
                         backend = .kittenTts(.nano)
                     case "kitten-mini", "kittenmini":
@@ -720,7 +722,7 @@ public struct TTS {
             Options:
               --output, -o         Output WAV path (default: output.wav)
               --voice, -v          Voice name (default: af_heart for Kokoro, alba for PocketTTS, expr-voice-3-f for KittenTTS)
-              --backend            TTS backend: kokoro (default), pocket, kitten-nano, kitten-mini
+              --backend            TTS backend: kokoro (default), pocket, kitten (Mini 82M), kitten-nano, kitten-mini
               --speed              Speech speed multiplier (KittenTTS Mini only, default: 1.0)
               --lexicon, -l        Custom pronunciation lexicon file (word=phonemes format, Kokoro only)
               --benchmark          Run a predefined benchmarking suite with multiple sentences