Pillar · Kosten und ROI
Was kostet ein KI-Telefonassistent — und wann amortisiert er sich?
Marktbandbreite für einen KI-Telefonassistenten mit Branchen-Vorlage im DACH-Mittelstand: 8.900–20.000 € einmalig (Pilot + Produktiv-Setup) plus 600–2.500 € pro Monat (Betrieb, je nach Anbieter und Volumen). Podschi startet beim Pilot ab 2.400 € und im Betrieb ab 990 €/Monat. Der Break-Even liegt für die meisten KMU zwischen Monat 4 und Monat 9.
Diese Seite zerlegt die Kosten-Struktur, zeigt den Vergleich zu Eigenbau und Callcenter, und stellt ein ROI-Modell vor, das Sie auf Ihren Betrieb anwenden können.
Definition
Total Cost of Ownership (TCO) eines KI-Telefonassistenten
Summe aus einmaligem Setup, monatlicher Betriebs-Pauschale, variablen Per-Minute-Kosten, internen Aufwänden (Schulung, Pflege) und Risiko-Aufschlägen (DSFA, Compliance-Audit) über die Nutzungsdauer.
Wie ist die Kosten-Struktur aufgebaut?
Drei Schichten — die Anteile verschieben sich mit dem Volumen.
Die Kosten eines KI-Telefonassistenten teilen sich in drei Blöcke:
- Einmalig (Setup): Stimm-Persona, Wissensbasis-Aufbau, Telefonie-Anbindung, Test mit echten Anrufen, Compliance-Doku.
- Monatlich pauschal (Betrieb): Plattform-Lizenz, Monitoring, Stimm-Pflege, Support, Sub-Processor-Verträge.
- Variabel (Per-Minute): STT-, LLM- und TTS-Kosten je Gesprächsminute. Bei hohen Volumen wichtiger Hebel.
Bei niedrigem Volumen (unter 1.000 Anrufe/Monat) dominiert die Monats-Pauschale. Bei hohem Volumen (über 5.000 Anrufe/Monat) wird die Per-Minute-Komponente zum größten Posten — dann lohnen sich Volume-Verträge.
Was kosten typische Anbieter im DACH-Raum?
Stand 2026, Public-Pricing wo verfügbar, Erfahrungswerte wo Anbieter Demo-only sind.
Public-Pricing ist im Voice-AI-Markt selten — die meisten Enterprise- Plattformen verkaufen ausschließlich über Demo. Was wir sehen:
Enterprise-Plattformen (z. B. Parloa, Cognigy)
Setup ab 25.000 €, Monatspaket ab 5.000 € — typischerweise für Konzerne und große Mittelständler ab 250 Mitarbeitern. Hochgradig anpassbar, dafür aufwendiger im Einkauf und Onboarding.
Branchen-Vorlagen-Anbieter (z. B. Podschi)
Festpreis-Modell mit drei Komponenten (vierwöchiger Pilot mit Erfolgs-Klausel, einmalige Produktiv-Einrichtung, monatlicher Betrieb mit sechs Monaten Mindestlaufzeit), individuell nach einem Erstgespräch kalkuliert. Der monatliche Betrieb beginnt typischerweise ab ca. 990 €. Zielgruppe: KMU mit 5–100 Mitarbeitern, die einen klaren Branchen-Use-Case haben.
Generische Voice-Plattformen für Self-Service (z. B. Vapi, Bland, Retell)
0,07–0,20 € pro Minute reine Infrastruktur, plus Eigenleistung für Persona, Wissensbasis, Telefonie-Setup, Compliance. Geeignet für Teams mit dediziertem Voice-Engineer.
Klassische externe Callcenter
In DACH üblich: 800–3.500 € pro Schicht und Monat (8 Stunden, ein Standort), je nach Qualifizierung und Sprach-Anforderung. 24/7-Betrieb braucht drei Schichten — 5.000–10.000 € monatlich allein für Personalkosten.
Wie rechnet sich der ROI?
Vier Hebel — und nur einer davon ist „Personal sparen“.
Der ROI eines KI-Telefonassistenten ergibt sich aus vier Hebeln, die in KMU unterschiedlich stark ziehen:
1. Vermiedener Umsatzverlust durch nicht angenommene Anrufe
Beispiel Hotel mit 18 Anrufen/Tag, 40 % buchungsrelevant, 22 % des Tages-Anrufvolumens in nicht-besetzten Zeiten (davon 80 % unbeantwortet), 230 € pro Buchung, Conversion-Faktor 4: rund 2.200 € pro Monat zusätzlicher Umsatz im mittleren Szenario, je nach Saison und Hausgröße zwischen 1.500 € und 5.300 €. Details in der Modellrechnung.
2. Personal-Entlastung an der Telefonzentrale
Bei 60 % automatisierter Erst-Annahme spart ein durchschnittliches Hotel an der Rezeption 1–2 Stunden pro Tag — das sind 600–1.200 € pro Monat zu Tarif-Lohn-Konditionen. Kein „Personal abbauen“, sondern freie Kapazität für Gäste vor Ort.
3. Reduktion von No-Shows durch Termin-Bestätigung
Bei Praxen und Beratungs-Terminen reduziert ein KI-Telefonassistent die No-Show-Quote oft um 30–50 % — mit klaren Auswirkungen auf die Stundensätze. Größenordnung: 3.000–8.000 € pro Monat in einer durchschnittlichen Facharzt-Praxis.
4. Höhere Conversion bei Lead-Anrufen
Antwortzeit ist im B2B-Vertrieb ein dominanter Conversion-Hebel: Die viel zitierte „Lead Response Management Study“ (Oldroyd / McElheran / Elkington, Harvard Business Review 2011) zeigt um ein Vielfaches höhere Kontakt- und Qualifizierungsraten, wenn ein Lead innerhalb der ersten Minuten erreicht wird — gegenüber Rückrufen nach 30 Minuten oder später.
Die fünf häufigsten Fehler in der TCO-Rechnung.
Was Anbieter und Käufer regelmäßig übersehen.
- Per-Minute-Kosten unterschätzt: Bei 3.000 Anrufen à 2 Min. sind das 6.000 Min. × 0,12–0,24 € = 720–1.440 €/Monat zusätzlich.
- Stimm-Pflege ignoriert: Ohne kontinuierliche Anpassung verliert der Agent in 6–9 Monaten messbar an Qualität.
- Telefonie-Integration vergessen: SIP-Trunk oder Provider-Wechsel kann 500–2.000 € einmalig zusätzlich kosten.
- Compliance-Aufwand zu klein: AVV, SCCs, Transfer Impact Assessment, DSFA — interne Aufwände von 20–40 Stunden realistisch.
- Eigenbau-Personalkosten nicht eingerechnet: Ein Voice-Engineer für 4 Monate zu vollen Personalkosten ist meist deutlich teurer als die fertige Branchen-Vorlage.
Eckdaten
Typische TCO-Bandbreiten im DACH-Mittelstand.
Setup mit Branchen-Vorlage (Pilot + Produktiv)
8.900–20.000 €
Setup ohne Vorlage (neue Branche)
18.000–60.000 €
Monatlich pauschal — Marktbandbreite
600–2.500 €
Monatlich pauschal — Podschi
ab 990 € (Paket „Basis“)
Per Gesprächsminute
0,12–0,24 €
Break-Even (typisch)
Monat 4–9
Förderquote (KMU)
30–50 %
Häufige Fragen
Antworten auf einen Blick.
Was kostet ein KI-Telefonassistent für ein KMU pro Monat?
Marktbandbreite für eine fertige Branchen-Vorlage: ca. 600–2.500 €/Monat — je nach Anrufaufkommen, Use-Case-Komplexität und Service. Die 600-€-Untergrenze ist Markt-Vergleichswert (kleinste Pakete generischer Anbieter); der Podschi-Betrieb beginnt bei 990 €/Monat (Paket „Basis“). Eigenbau-Stacks starten scheinbar bei 200–400 €/Monat reiner Infra, kosten aber 4–6 Monate Eigenleistung.
Wie hoch ist der einmalige Setup-Aufwand?
Podschi: Pilot ab 2.400 € einmalig (4 Wochen, Erfolgs-Klausel), Produktiv-Setup ab 6.500 €, Go-live (Pilot + Setup) typisch 8.900–20.000 € mit Branchen-Vorlage. Ohne fertige Vorlage (z. B. neue Branche): 18.000–60.000 €, weil die Vorlage erst entwickelt werden muss. Bei reinem Eigenbau: 30.000–80.000 € interne Personalkosten über 4–6 Monate.
Welche versteckten Kosten gibt es?
Sechs Posten werden in vielen Angeboten unterschlagen: (1) Telefonie-Anbindung an die bestehende Anlage, (2) Stimm-Pflege und kontinuierliche Optimierung, (3) Sub-Processor-Audits und Vertragspflege, (4) Mitarbeiter-Schulung, (5) Datenschutz-Folgenabschätzung wo nötig, (6) Reporting und Monitoring.
Wann amortisiert sich der KI-Telefonassistent?
Faustregel: Im Mittelstand liegt der Break-Even meist zwischen Monat 4 und Monat 9. Beispiel Hotel mit 18 Anrufen/Tag — davon 22 % in Zeiten ohne (volle) Rezeptionsbesetzung und davon 80 % unbeantwortet, 40 % buchungsrelevant, Conversion-Faktor 4: rund 10 zusätzlich gehobene Buchungen pro Monat à 230 € entsprechen ca. 2.200 € monatlich. Ein Beispiel-Monatsbetrag von ca. 990 € ist damit rechnerisch klar gedeckt. Vollständige Modellrechnung in der Studie „Anrufverluste in DACH-Hotels 2026“.
Sind Förderprogramme nutzbar?
Für KMU im DACH-Raum gibt es regelmäßig landes- und branchenspezifische Digitalisierungs-Förderungen (z. B. Bayern Digital, MID Digital NRW, aws Digitalisierung in Österreich, Innosuisse-Initiativen). Die Förderquote liegt typischerweise bei 30–50 %, einige Programme sind auf bestimmte Branchen oder Mitarbeiterzahlen beschränkt. Da Förderprogramme regelmäßig auslaufen oder neu aufgelegt werden, prüfen wir die aktuelle Verfügbarkeit gemeinsam im Erstgespräch.
Lohnt sich Eigenbau (DIY) vergleichbar mit einem Anbieter?
Selten. Die reine Infrastruktur ist günstig (VAPI + OpenAI + ElevenLabs zusammen ab ~300 €/Monat), aber die echte Arbeit liegt in Stimm-Pflege, Fallback-Logik, DSGVO-Doku, Telefonie-Integration und kontinuierlicher Optimierung. Wer keinen dedizierten ML-/Voice-Engineer hat, zahlt am Ende mehr — in interner Zeit, nicht in Lizenzgebühren.
ROI-Rechner
Rechnen Sie es selbst nach.
Vier Eingaben, transparente Annahmen. Methodik und Quellen in unserer Modellrechnung für DACH-Hotels.
- Verlorene Anrufe / Monat
- 119
- Davon mit KI-Agent gewonnen
- 83
- Zusätzliche Aufträge / Monat
- 21
- Zusatzumsatz / Monat
- 4.782 €
Netto nach Podschi-Basis (990 € / Monat)
3.792 €
Konservative Annahme: 70 % der außerhalb-Erreichbarkeit-Anrufe werden vom KI-Agenten erfasst und strukturiert weitergeleitet. Über-Volumen-Aufschläge, Setup-Kosten und Telefonie-Gebühren sind nicht enthalten; Details im Erstgespräch.