7 Minuten Lesezeit
26 Jun
26Jun

Künstliche Intelligenz betreut Kunden in der Telefon-Hotline? Für Daniel Keinrath war das mal ein "No Brainer", ist für ihn dann zur Herausforderung der Extraklasse geworden. Der Wiener hat mit seinem Partner und KI-Experten Matthias Gruber das österreichische Start-up fonio.ai gegründet. Sie setzen alles daran, den KI-gesteuerten virtuellen Telefonassistenten so menschlich wie möglich zu machen und so etwas wie Emotionalität einzuhauchen. Erst seit September 2024 auf dem Markt, ist das Wachstum atemberaubend. Über 1200 Nutzer hat fonio.ai schon nach zehn Monaten. Ende dieses Jahres sollen es 5000 sein. Aber es ist kein einfacher Markt. Viele Anbieter, auch aus der Start-up-Szene, tummeln sich da bereits.

München, 26. Juni 2025 - Von Rüdiger Köhn 

Daniel Keinrath ist genau der richtige, um die neueste Software für den KI-gesteuerten Telefonassistenten fonio.ai auf die Probe zu stellen - wenn es etwa um die korrekte Erfassung der Email-Adresse geht. Der Vorname: kein Problem. Aber Keinrath? Erfasst der virtuelle Assistent „Kein“, „Klein“, Kain“, „-rat“, „-rad“ oder tatsächlich „-rath“?

Im Mai hat das österreichische Start-up, das Keinrath, 25, und sein Partner Matthias Gruber, 28, im September 2024 auf den Markt gebracht haben, fonio 2.0 eingeführt - das bislang umfassendste Update einer gerade einmal zehn Monate alten Plattform für telefonische Kundenbetreuung, fixiert auf den deutschsprachigen Raum. Das System erkennt deutlich zuverlässiger die von einem Kunden in die Hotline gesprochene Mail-Adresse, vor allem ist es schneller geworden. Die Reaktionszeit (Latenz) ist von 1 bis 1,5 Sekunden auf weniger als 0,8 Sekunden reduziert worden. Möglichst noch in diesem Sommer soll sie auf das Optimum von 0,5 Sekunden verkürzt werden. 0,1 Sekunden können in einem Telefonat eine Ewigkeit sein.

Zwei, die unterschiedlicher nicht sein können

„Wenn das System eine Email nicht richtig erkennt, kannst du 95 Prozent der Kundendialoge kübeln“, sagt der gesprächige Keinrath mit unnachahmlichem Wiener Charme. Nun sei fonio.ai die erste Firma in der Welt, die auf deutsch Email-Adressen während der automatisiert betriebenen Kundentelefonaten verstehe. „Das sind so kleine Etappen, die wir feiern“, sagt er stolz.

               Daniel Keinrath                                                                                              Fotos fonio.ai

fonio.ai ist eine besondere Start-up-Story. Seit September vergangenen Jahres geht es hoch her, entfaltete sich eine so nicht erwartete Dynamik mit rasanten Wachstumsraten und einer enormen Kundenresonanz. Nach den jüngsten Unternehmensnagaben haben über 1200 Kunden in gerade einmal zehn Monaten die intelligente Hotline bereits abonniert, kämen nahezu wöchentlich Hundert hinzu. Und die Gründer Daniel Keinrath sowie Matthias Gruber können unterschiedlicher nicht sein. Daniel, der Wiener, der Typ Haudrauf, ausgelassen, locker, Party-Gänger, Socializer. Matthias, der Ruhige, der sich zurückgezogen auf dem Land in seinem Zimmer ganz KI und Algorithmen widmet. Beide haben sich erst vor zwei Jahren gefunden und im Spa-Bereich eines Hotel erste Pläne geschmiedet. Sie sind eine verschworene Gemeinschaft geworden und ergänzen sich perfekt. Wobei: Sie pflegen ein Start-up per „Fern-Ehe“, der eine in Wien, der andere auf dem Land. Seit der Gründung vor einem Jahr haben sie sich ganze zwei Mal persönlich gesehen.

Matthias Gruber, der Abitur gemacht, aber nicht studiert hat, ist ein extrem analytisch und lang vorausschauend denkender Mensch, der Nerd und Hardcore-Software-Entwickler. Er hat die Technologie des KI-Assistenten entwickelt, so nun auch fonio 2.0. Wie oft haben die Nutzer seit dem Start erkennen müssen, das in den automatisch erstellten Transkripten unmittelbar die Mail-Adresse falsch geschrieben worden ist. Gruber hat dafür ein zusätzliches Tool entworfen, das die Gesprächssituation erfasst, während des Kundendialogs im Hintergrund die Email-Adresse einem Rechen- und Prüfprozess unterzieht. „So schaffen wir es, dass in kurzer Zeit 90 bis 95 Prozent richtig erfasst werden - das ist ein Gamechanger.“ Es hat vier Monate gedauert, bis das ausgetüftelt worden ist.

Kunden aus dem Mittelstand

Rund 90 Prozent der mehr als 1200 Kunden kommen aus Deutschland, sind in der Regel kleine und mittelständische, auch neugegründete Unternehmen, die sich kein Call Center leisten können oder andere, teure Dienstleister nicht leisten wollen. Arztpraxen, Kanzleien, Steuerberater, Handwerker, Hotels, Hausverwalter, Immobilienmakler, kleine Gewerbebetriebe, Onlineshops, Autohäuser. Das System ist schnell in einer Stunde für individuelle Anwendungen sowie personalisiert aufgesetzt und installiert. Größter Kunde ist derzeit der Onlineshop Kaffeewelt, aber auch der Personaldienstleister Yakabuna, die virtuelle CRM-Kundendienst-Plattform moin.ai aus Hamburg gehören dazu. Telekom-Unternehmen und Assekuranzen zeigen sich interessiert.

               Daniel Keinrath mit Matthias Gruber

Berechnet wird nach dem Abo-Modell SaaS (Software-as-a-Service) zeitgenau nach der tatsächlichen Gesprächsdauer, gestaffelt nach Menge zwischen 0,25 und 0,35 Euro die Minute (verglichen mit 0,60 bis 0,85 Euro anderer Anbieter). Neben Mail-Adresse erfasst das System automatisch Bestellnummern oder Kundencodes, erkennt den Anrufer anhand der Telefonnummer mit seinen Grunddaten, versteht und übersetzt Ausdrücke wie „übernächsten Mittwoch um Dreiviertel fünf“ oder „16:45 Uhr“. Bei möglichen Terminvereinbarungen „um acht“ kann das System unterscheiden zwischen 8 Uhr morgens und 20 Uhr abends. Gängige Ausdrucksweisen werden kontextbezogen verarbeitet, kann das deutschsprachig geprägte fonio.ai derzeit auch in 27 Sprachen wechseln. Die Telefon-KI ruft Bestellnummern, Aufträge, Status von Geschäftsvorgängen ab, ist mit dem Internet verbunden, um Informationen während eines Dialogs per API-Requests anzufordern, seien es Produktdaten oder -handbücher, Öffnungszeiten, Preise oder verschiedene Websites. Zu den Grundelementen gehört, dass die KI auf die internen Kundenmanagementsysteme und die Kalender zugreift, was für Terminvereinbarungen notwendig ist. Das alles erfolgt in Echtzeit, wie auch die Transkript-Erstellung, die per Mail, Whatsapp oder SMS sofort verschickt werden.

Schon vier Monate nach Start hat fonio.ai über 300 Abonnenten gehabt. Was im ersten Moment wenig glaubhaft klingt, wird ein äußerst ambitioniertes Ziel angesichts des rasanten Wachstums der vergangenen Wochen tatsächlich greifbar: Keinrath und Gruber visieren bis Jahresende, 15 Monate nach Auftakt, 5000 Kunden an.

1200 echt zahlende Nutzer

Echt zahlende Nutzer wohlgemerkt, denen anfangs noch höhere Preise von bis zu 0,50 Euro die Minute berechnet worden sind. Bei diesen Tarifen könnte die KI-Hotline eine Arztpraxis inklusive Terminservice schätzungsweise zwischen 300 und 500 Euro kosten, in der Stunde 30 Euro, wobei tatsächlich ja nach den Erfahrungswerten nur zwischen 30 und 40 Minuten (also zwischen 15 bis 20 Euro) gesprochen wird. Da kann es bei konkurrierenden Anbietern durchaus doppelt so teuer werden.

Von kostenlosen Test- und Lockangeboten, um auf deutlich höhere Kundenzahlen zu kommen, hält der Gründer aus Wien nichts. Die nützen ihm wenig. Wenn diese nicht zahlten, könnten sie schnell wieder abspringen. Man würde womöglich basierend auf deren Nutzerverhalten ein Produkt weiter entwickeln, das an den tatsächlichen Bedürfnissen vorbeigehe. Zahlende Anwender hingegen würden wichtige, konstruktive Feedbacks geben. Dies sei eine Voraussetzung, um ein notwendiges Alleinstellungsmerkmal zu schaffen. Schließlich, sollte man meinen, könnte ein derartiges System leicht kopiert werden, zumal sich bereits viele Wettbewerber auf dem Markt für CRM-Dienstleistungen tummeln.

Ins Getümmel einer großen Konkurrenz

Wie die deutschen Telefonservices von starbuero, eBuero, Officehelden, Vitas AI, dem Berliner SynthflowAI (mittlerweile amerikanisch) oder Aaron.ai von Doctolib - oder Vapi.AI aus San Francisco und Retell AI aus der San Francisco Bay Area, zwei große etablierte Anbieter. OpenAI (ChatGPT) oder Google könnten ohne weiteres ähnliche Systeme aufsetzen. fonio.ai selbst nutzt schließlich viele Plattform-Grundelemente von ihnen, auf denen dann spezifische Anwendungen aufgesetzt und so zahlreiche Ebenen sowie Bausteine entwickelt werden. Daniel Keinrath gibt sich gelassen trotz eines starken Konkurrenzangebots. Entweder seien die anderen wesentlich teurer, würden deutlich längere Latenzzeiten haben oder befänden sich im Ausland (besonders in den USA), was wegen der Entfernung die Latenz beeinträchtige oder aber auch wegen der Datenschutzverordnung nicht unproblematisch sei.

              Matthias Gruber

Vielen Herausforderungen waren sich die Gründer bewusst. Schon bald kamen neue hinzu. „Man denkt, da wird ein Stimmenmodus und eine Telefonnummer festgelegt und auf geht´s.“ Denkste. In einem Telefonat müsse man erreichen, dass die KI so schnell antwortet und reagiert wie ein Mensch. Im besten Fall sollte es eine halbe Sekunde dauern, bis die Reaktion kommt. Die schnellsten Anbieter, führt Keinrath auf, lägen an guten Tagen bei einer Sekunde. Vapi AI beansprucht für sich 0,5 Sekunden, allerdings auf Englisch und in den USA. In schlechten Tagen könne die Latenz bei 1,5 Sekunden liegen, was zu einer merklichen und damit unangenehmen Verzögerung führt. Es gibt Firmen, da kann es im Kundendialog gar drei oder vier Sekunden dauern, wenn sie zum Beispiel mit einem Voice Modus und OpenAI arbeiten. Die Ansprüche bei einem Telefonassistenten sind extrem verglichen mit einem Chatbot, wo drei oder vier Sekunden normal sind, bis eine Antwort kommt.

Die KI-Stimme braucht Emotionalität

„Aber es geht schneller“, sagt Keinrath, wie er nun mit der neuesten Version zeigt und damit auf dem Weg zum Ziel von 0,5 Sekunden ist. „Daher glaube ich an unseren Erfolg“, wiegelt er kritische Fragen nach drohenden Nachahmern und einer starken Konkurrenz ab. Klar, das Geschäftsmodell sei ja im Grunde recht simpel. „Aber die Infrastruktur zu bauen, können nur wenige.“ Matthias Gruber sei einer von ihnen. Zu den nächsten Schritten gehört, dass während eine Dialogs auch umfassende PDF-Dateien geöffnet und gelesen werden können, etwa Handbücher oder Betriebsanleitungen. Das benötigt sehr viel Zeit, und wenn es drei Sekunden sind.

Die kurze Latenz hat oberste Priorität gehabt und war eine harte Nuss, damit der künstliche Telefonassistent so schnell wie ein Mensch ist und somit menschlich reagiert. Diese Herausforderung bestehe auch für die nächsten Monate noch, sagt Keinrath. Nach dem Start wurden die Gründer erst durch Gespräche mit Kunden in einer Sache sensibilisiert, die sie gar nicht auf dem Schirm hatten: die Stimme des Telefonroboters. Es gibt zwar eine Fülle von Grundmodellen an Stimmen, aus denen Nutzer eine wählen können. Das macht die Stimme aber nicht automatisch menschlich. „Man muss ihnen Emotionalität verleihen.“ Schon gar nicht darf es abgehackt wirken.

Gar nicht so einfach. Das Feedback hat gezeigt: Die Kunden wollen auch mal ein „äh“ oder „öh“ oder „aha“ oder kurze Sprechpausen eingebaut haben, um so Nachdenken zu suggerieren. Dazu müsse man aber auch erst wissen und lernen, wann die „ähs“ und „öhs“ in welchem Zusammenhang eingesetzt werden müssen, damit alles echt wirkt. Und eine gute, brillante Eröffnung eines Dialogs ist ohnedies ein Muss. „KI muss sich wie ein Mensch anhören, das gelingt uns mittlerweile halbwegs“, sagt Keinrath. „Wir hoffen, im dritten Quartal den richtigen Weg gefunden zu haben.“ Verschiedene Betonungen und Laute, unterschiedliche Verhalten auf eine Fülle von Gesprächssituationen müssen antrainiert und erlernt werden.

Gründer-Brainstorming im Spa

Eine riesige Idee, also die mit einem KI-gestützten Telefonassistenten, sei es ja eigentlich nicht gewesen, weil sie so naheliegend sei. „Und doch galt es als No Brainer, dass KI Anrufe entgegen nimmt, Fragen von Kunden beantwortet oder Probleme löst“, erinnert sich Keinrath. Das habe damals im deutschsprachigen Raum noch niemand so recht gekannt - auch wenn es heute schon etliche Anbieter gibt. Der junge Gründer war auf der Suche nach einer neuen Geschäftsidee, nachdem er 2020 im Alter von 20 Jahren schon erfolgreich die Wiener Eventagentur GetNano aufgebaut hatte und verkaufen wollte. Ihm ging das ganze durch den Kopf, hat mit englischsprachigen, amerikanischen Modellen „herumgespielt“ und befand: Das gehe ja alles ziemlich holperig. Keinrath bastelte an einem Konzept.

Nach drei Anläufen gelang es ihm, endlich Mitglied der Sigma Squared Society zu werden, ein internationales Netzwerk, das nur auf Einladung junge Firmengründer im Alter bis zu 26 Jahren aufnimmt. Über diesen exklusiven Klub hat er 2023 Matthias Gruber auf dem European Forum Alpbach in Tirol getroffen, sind die ersten Grundgedanken in langen Gesprächen im Spa-Bereich gereift.

Gruber, ein Phänomen in Sachen KI, hatte schon mit 14 Jahren in seinem Kinderzimmer Software-Produkte entwickelt und brachte mit einer Plattform für Bauernläden im Alter von 17 Jahren seinen ersten SaaS-Dienst auf den Markt, war mit seiner Finmatics externer Softwareentwickler und -berater, gründete 2022 die Firma Circly, bei der er nur ein Jahr blieb. Er arbeitete mehr als zwei Jahre für den Wiener Software-Entwickler Platomics, wo er ein Team von 100 Mitarbeitern in den Bereichen Produkt, Engineering und Design leitete, war 2021 Vize-Europameister im Wettbewerb Web Technologies der Organisation WorldSkills International.

Gegensätze ziehen sich an

Während Keinrath - mitten im Exit bei GetNano - nach der neuen Challenge suchte, wollte Gruber die hohen Drehzahlen der zurückliegenden Jahre erst einmal hinter sich lassen und ausspannen. „Wir hatten eine tolle Zeit im Spa verbracht“, lacht Keinrath, der von seinen Ambitionen erzählte, nachdem er merkte, dass auch Gruber gegenüber Neuem aufgeschlossen gewesen ist. Sie trafen sich öfters, testeten sich aus; sei ja schließlich wie in einer Ehe, ob auch alles passe. Sie waren an Wochenenden unterwegs, hätten viel Zeit zusammen verbracht, um alles zu „checken“. Gegensätze ziehen sich an: Keinrath Partygänger, der gerne viel redet und als Bachelor in Business Administration sowas wie der Wirtschaftsfuzzi ist; Gruber, der Nerd, eher zurückgezogen, tief in die Materie der IT versunken, „vom Kinderzimmer aus einer der besten Programmierer.“

Mitte 2023 erstmals getroffen, im Juni 2024 fonio.ai gelauncht, im September dann offiziell am Markt. Von da an maximale Beschleunigung von Null auf Hundert. „Uns verbindet das gemeinsame Gen, Unternehmen gründen zu wollen, das schweißt zusammen.“ Sie hätten einen „unglaublichen Respekt“ voreinander. „Es gibt uns eine emotionale Sicherheit, das ist enorm wichtig.“ Vollgas würden sie fahren, dennoch habe jeder seine Freiheiten, sei man unabhängig. Kein Ding, wenn Keinrath mal drei Wochen nach Bali fliegt. „Das kannte ich so bislang nicht.“ Da haben sich zwei gefunden, die können zusammenarbeiten, ohne in einem Büro zu sitzen - wie gesagt, seit Frühling 2024 nur zwei Mal persönlich gesehen.

Finanzierungen für fonio.ai benötigen sich nicht, auch wenn sie schon viele Anfragen bekommen hätten. Es läuft, nicht zuletzt dank des existierenden Cash-Polsters, das durch die SaaS-Einnahmen wächst. Für das Primärziel der 5000 Kunden, reicht es allemal. „Matthias und ich haben ein Mantra“, sagt Daniel Keinrath, „wir bauen eine rationale Firma auf, die wir selbst steuern, wir brauchen keine Investoren.“ Da steht Unabhängigkeit ganz oben. Erst einmal.

https://www.fonio.ai/

Kommentare
* Die E-Mail-Adresse wird nicht auf der Website veröffentlicht.