„Jak mały polski startup stał się wielomiliardowym głosem sztucznej inteligencji” – Forbes
W artykule „Forbesa” „How A Tiny Polish Startup Became The Multi-Billion-Dollar Voice Of AI” opisano fenomen firmy ElevenLabs założonej trzy lata temu w Wielkiej Brytanii przez Mateusza (Mati) Staniszewskiego i jego przyjaciela z liceum, inżyniera Google Piotra Dabkowskiego. Magazyn zwrócił uwagę, że „komputerowe głosy ElevenLabs są tak przekonujące, że mogłyby oszukać twoją własną matkę”. To – jak zaznacza „Forbes” – „zarówno błogosławieństwo, jak i przekleństwo” dla zaledwie czteroletniej firmy. Obaj współzałożyciele, wyróżnieni wcześniej na liście „Forbes 30 Under 30 Europe”, dziś są wyceniani na ponad miliard dolarów każdy. Na liście tej „Forbes” umieszcza 30 najzdolniejszych młodych biznesmenów, innowatorów i liderów w Europie poniżej 30. roku życia.
W artykule Staniszewski opowiada, że jednym z impulsów do stworzenia ElevenLabs była jego frustracja związana z polskim dubbingiem filmowym. „Zapytaj jakiegokolwiek Polaka, a powie ci, że to okropne” – mówi, nawiązując do tradycji jednego lektora czytającego wszystkie kwestie w monotonnym stylu. „Chyba był to taki komunistyczny sposób robienia taniej produkcji” – dodaje.
Pracując w firmie Palantir Technologies w Londynie, Staniszewski zaczął wspólnie ze swoim kolegą z warszawskiego liceum (XXXIII Liceum Ogólnokształcące Dwujęzyczne im. Mikołaja Kopernika w Warszawie) Piotrem Dąbkowskim eksperymentować ze sztuczną inteligencją (AI). Jeden z projektów – instruktor przemówień publicznych – okazał się na tyle obiecujący, że obaj postanowili odejść z pracy. W maju 2022 r. zrezygnowali z etatów i z własnych oszczędności rozpoczęli budowę ElevenLabs. Już pierwsze modele AI były znacznie bardziej naturalne niż robotyczne głosy Siri czy Alexy – potrafiły wyrażać emocje, radość, a nawet śmiech.
Przełom nastąpił w styczniu 2023 r., gdy ElevenLabs wprowadziło model potrafiący przeczytać dowolny tekst dowolnym głosem – także sklonowanym z użytkownika lub, jak zauważa „Forbes”, „co może budzić obawy – również głosem kogoś innego”. Popyt pojawił się natychmiast. Autorzy zaczęli masowo tworzyć audiobooki, twórcy YouTube tłumaczyli swoje materiały na inne języki, a aplikacje edukacyjne i medytacyjne włączyły technologię do swoich usług. Wkrótce podpisały umowy także duże wydawnictwa, m.in. HarperCollins i Bertelsmann.
W maju 2023 r. ElevenLabs pozyskało 19 mln dolarów od inwestorów, a łącznie zebrało już ponad 300 mln dolarów. W październiku 2024 r. firma osiągnęła wycenę 6,6 mld dolarów, co czyni ją jednym z najcenniejszych start-upów w Europie. Około połowa z jej 193 mln dolarów przychodów z ostatnich 12 miesięcy pochodzi od korporacji takich jak Cisco, Twilio i Adecco, które wykorzystują technologię firmy do obsługi klientów czy rekrutacji.
ElevenLabs wyróżnia się także tym, że – w przeciwieństwie do wielu firm AI – jest rentowna. Według szacunków magazynu, ElevenLabs wypracowało w ubiegłym roku 116 mln dol. zysku, przy czym marża wyniosła 60 procent
Przewagą ElevenLabs nad gigantami, takimi jak Google, Microsoft, Amazon i OpenAI, jest jakość. Modele są na tyle dobre, że firma może pobierać nawet trzykrotnie wyższe opłaty od amerykańskich konkurentów. Posiada też największą na świecie bibliotekę realistycznych głosów – ponad 10 tysięcy – m.in. Michaela Caine’a czy Matthew McConaugheya. Do tego jest bardziej niezawodna niż konkurencja.
Staniszewski i Dąbkowski nie zamierzają poprzestawać na głosie. Odpowiadając na potrzeby twórców, którzy szukali tanich, wolnych od tantiem podkładów muzycznych, w sierpniu wprowadzili generator muzyki. W przyszłym roku pojawią się awatary AI, które będą mogły zastąpić nagrania wideo w stylu Sora. Ich celem jest stworzenie jednej platformy, pozwalającej klientom korzystać ze wszystkich narzędzi AI w jednym miejscu. „Budujemy platformę, która pozwala tworzyć agentów głosowych i wdrażać ich bezproblemowo” – mówi Staniszewski w rozmowie z „Forbesem”.
Aby utrzymać tempo rozwoju, ElevenLabs rozbudowuje własne zasoby obliczeniowe. Firma zainwestowała już 50 mln dolarów w budowę farmy GPU w stanie Oregon. Staniszewski podsumowuje to jednoznacznie: „Jeśli chcemy zbudować firmę, która odmieni generację AI, potrzebujemy skali – i właśnie ją budujemy”.
Opracowała: Joanna Trzos
[email protected]









