Transkriptions-Modelle
wispa kann mit lokalen Modellen auf deinem Gerät oder mit Cloud-Modellen über deinen eigenen API-Schlüssel transkribieren. Hier das ganze Aufgebot.
3 Min. Lesezeit
Das Modell ist das, was deine Stimme in Text verwandelt. wispa bietet zwei Arten: Modelle, die auf deinem Gerät laufen, und Cloud-Modelle, die du über deinen eigenen API-Schlüssel erreichst. Jeder Modus wählt eines aus.
Modelle auf dem Gerät
Whisper läuft lokal in Größen von Tiny bis Large, plus eine Turbo-Variante, du kannst also Geschwindigkeit gegen Genauigkeit tauschen. Parakeet läuft über Apple MLX und ist auf Apple-Silicon-Macs sehr schnell. Mit jedem lokalen Modell wird dein Audio auf deinem Computer transkribiert und verworfen, auf Wunsch offline.
Cloud-Modelle
OpenAI bietet whisper-1 sowie die neueren gpt-4o-transcribe und gpt-4o-mini-transcribe. Groq betreibt whisper-large-v3-turbo sehr schnell. Cloud-Modelle brauchen eine Internetverbindung und deinen eigenen API-Schlüssel, und dein Audio wird an diesen Anbieter gesendet.
| Modell | Wo es läuft | Am besten für |
|---|---|---|
| Whisper Tiny bis Base | Auf deinem Gerät | Schnell und leicht, für schwächere Rechner |
| Whisper Small bis Large | Auf deinem Gerät | Höhere Genauigkeit, komplett offline |
| Parakeet | Auf deinem Gerät (Apple Silicon) | Sehr schnelle Transkription auf dem Mac |
| OpenAI | Cloud, dein Schlüssel | Top-Genauigkeit ohne Download |
| Groq | Cloud, dein Schlüssel | Cloud-Transkription mit sehr geringer Latenz |
FAQ
Fragen und Antworten
Welches Modell ist der Standard?
Ein lokales Whisper-Base-Modell ist der empfohlene Start. Es lädt schnell und transkribiert auf den meisten Rechnern gut, ohne Audio irgendwohin zu senden.
Kann ich für verschiedene Aufgaben verschiedene Modelle nutzen?
Ja. Jeder Modus legt sein eigenes Modell fest, du könntest also ein schnelles lokales Modell für kurze Notizen und ein Cloud-Modell für lange, genauigkeitskritische Diktate nutzen.
Ist Parakeet unter Windows verfügbar?
Nein. Parakeet läuft über Apple MLX und ist nur auf Apple Silicon verfügbar. Unter Windows kannst du lokale Whisper-Modelle oder einen Cloud-Anbieter nutzen.