Jak Frustracja Dubbingiem Doprowadziła do Rewolucji w AI Audio (Historia ElevenLabs)
f(x) Excel w Canva? Zmieniaj dane w ciekawe analizy bez znajomości zaawansowanych formuł
🔉Wolisz wersję audio? Nie możesz przeczytać teraz maila?
Przesłuchaj tutaj
Możesz nas słuchać także na Apple Podcast i Spotify.
🎯W DZISIEJSZYM WYDANIU
🎓 AI od zera do zrozumienia: Krótka historia ElevenLabs
🛠 AI w praktyce: Canva zakończy gehennę nauki formuł Excela?
🥡 AI na Wynos:
🤖 "Na końcu tej drogi nie ma człowieka"
💳 Sztuczna inteligencja zrobi zakupy. Visa wprowadza asystentów AI
🟢 Duolingo uważa, że poradzi sobie bez pracowników. Zastąpi ich AI
📰 Sztuczna inteligencja wspomoże PAP w tworzeniu materiałów multimedialnych
🚉 Przewidzą zachowanie pasażera. AI w służbie bezpieczeństwa
👨🏻🎓 Sztuczna inteligencja w szkole: Konieczność, nie opcjaj
⛑ Rewolucja w dziedzinie bhp - wpływ sztucznej inteligencji i cyfryzacji na organizację pracy
🌐 Sztuczna inteligencja: Dlaczego gospodarki wschodzące ufają jej bardziej niż rozwinięte
🇨🇳 Tajemnicze zgony naukowców. Zajmowali się sztuczną inteligencją
👥 Sztuczna inteligencja zamiast autorytetów i przyjaciół? Eksperci o podejściu generacji „Z”
📗 Agatha Christie "powraca", by uczyć pisania. Nietypowy pomysł BBC
😳 Facebook schronieniem dla dewiantów? Chatbot AI od Mety serwuje treści erotyczne głosem... postaci z Disneya.
📚 Rekomendowana Biblioteka:
Wywiady z Matim Staniszewskim (CEO ElevenLabs)
Korzystając z majówkowej atmosfery, zapraszam na materiał o nieco lżejszym kalibrze, ale gwarantuję - i tak sporo z niego wyniesiesz.
Czy pamiętacie ten jeden, charakterystyczny głos lektora, który czytał jednym tchem kwestie twardziela z filmu akcji, płaczącego dziecka i staruszki? Ta sztuczność, czasem zabawna, a czasem irytująca, to coś, do czego wielu z nas zdążyło przywyknąć.
Ale co, jeśli powiedziałbym Ci, że właśnie taka codzienna frustracja związana z nienaturalnym brzmieniem stała się iskrą zapalną dla stworzenia technologii wartej dziś miliardy dolarów?
Poznaj ElevenLabs (pewnie już o niej słyszałeś, ale może nie znasz historii założenia firmy), firmę założoną przez dwóch Polaków - Piotra Dąbkowskiego i Matiego Staniszewskiego. To przyjaciele jeszcze z ławki warszawskiego Liceum im. Mikołaja Kopernika w Warszawie, którzy postanowili rzucić wyzwanie temu, jak brzmi sztuczna inteligencja.
To krótka opowieść o tym, jak z osobistej frustracji i technologicznej zajawki powstała firma, która w ciągu zaledwie kilku lat stała się głośnym graczem w świecie AI audio, a jej narzędzia zaczynają wyznaczać nowe standardy w tworzeniu treści głosowych.
Geneza
Wszystko zaczęło się, jak to często bywa z dobrymi pomysłami, od osobistej irytacji. Dorastając w Polsce, Mati i Piotr namiętnie oglądali amerykańskie filmy. Był tylko jeden problem - ten wszechobecny, charakterystycznie monotonny głos lektora, który czytał wszystkie kwestie. Nieważne, czy na ekranie był twardziel ratujący świat, czy zapłakana bohaterka, głos pozostawał ten sam, pozbawiony emocji, skutecznie zagłuszając oryginalne dialogi i odbierając filmom sporą część ich klimatu. To doświadczenie, ta „głęboka osobista więź ze sprawą”, jak sami to określają, wryła im się w pamięć.
Ale ta młodzieńcza frustracja okazała się tylko wierzchołkiem góry lodowej. Kiedy lata później zaczęli przyglądać się dostępnym technologiom generowania mowy, tym samym, które napędzają naszych wirtualnych asystentów (Alexa, itp.) szybko zdali sobie sprawę, że problem leży znacznie głębiej. Istniejące rozwiązania, nawet te od największych technologicznych gigantów, brzmiały po prostu… sztucznie. Brakowało im tego „czegoś”, co sprawia, że ludzki głos jest żywy i angażujący.
I tu właśnie pojawił się ich moment „Aha!”. Zrozumieli, że aby stworzyć głos AI, który naprawdę brzmi jak ludzki, nie wystarczy tylko ulepszać istniejące metody. Trzeba było zacząć od zera, od fundamentalnych zasad ludzkiej mowy. Nie chodziło tylko o poprawne odczytanie słów, ale o uchwycenie całej tej niewidzialnej warstwy komunikacji: subtelnych zmian intonacji, które zdradzają emocje, naturalnych pauz w odpowiednich momentach, drobnych zawahań, a nawet śmiechu. Chcieli nauczyć AI mówić z duszą.
Na szczęście mieli do tego idealne połączenie kompetencji. Piotr, ze swoim imponującym doświadczeniem w dziedzinie sztucznej inteligencji, zdobytym na prestiżowych uczelniach (Oxford, Cambridge) i podczas pracy w Google, wniósł głęboką wiedzę techniczną. Mati, absolwent matematyki na Imperial College z doświadczeniem w strategii zdobytym w Palantir, dołożył analityczny umysł i zmysł biznesowy. Pasja spotkała know-how, a wizja stworzenia naprawdę ludzko brzmiącego AI zaczęła nabierać kształtów.
Technologia
No dobrze, ale jak oni właściwie sprawiają, że komputer mówi jak człowiek, a nie jak syntezator z lat 80.? Sercem ElevenLabs jest wyrafinowana sztuczna inteligencja, która dzięki technikom głębokiego uczenia potrafi nie tylko czytać tekst, ale i rozumieć jego kontekst. To kluczowa różnica! Ich modele analizują znaczenie słów i zdań, by dobrać odpowiednią intonację, tempo, a nawet subtelne emocje czy naturalnie brzmiące pauzy - wszystko to, co sprawia, że rozmowa brzmi autentycznie. Ale prawdziwy efekt „wow” i to, co wyróżnia ElevenLabs, to funkcje takie jak błyskawiczne klonowanie głosu.
, który współtworzy ten newsletter razem ze mną i Oskarem, przetestował technologię klonowania głosu od ElevenLabs. Przez jakiś czas to właśnie sztuczny głos Marcina czytał Ci ten newsletter. Sprawdź poniżej.Wystarczy kilka minut próbki audio, by ich AI nauczyło się naśladować praktycznie dowolny głos (tak, nawet Twój!). Idąc o krok dalej, stworzyli niedawno Voice Design, narzędzie pozwalające wykreować zupełnie nowy, unikalny głos od zera, jedynie na podstawie tekstowego opisu jego pożądanych cech. Chcesz głos brzmiący jak „starsza, mądra czarodziejka z ciepłym uśmiechem w głosie”? Proszę bardzo, AI od ElevenLabs może go dla Ciebie stworzyć.
Okej, ale ktoś tego używa?
Fascynująca technologia, powiesz, ale gdzie to wszystko właściwie trafia i kto z tego korzysta? Zastosowania ElevenLabs rozlewają się już po naprawdę wielu różnych dziedzinach. Korzystają z niej na potęgę twórcy treści - podcasterzy, autorzy audiobooków (firma współpracuje m.in. z gigantami jak HarperCollins czy Storytel) czy youtuberzy, generując profesjonalne nagrania głosowe szybciej i łatwiej niż kiedykolwiek.
Świat gier (np. znane studia jak Paradox Interactive czy Don't Nod) używa jej do ożywiania postaci i błyskawicznego tłumaczenia dialogów na dziesiątki języków.
Wielcy wydawcy jak The Washington Post, The New Yorker czy The Atlantic tworzą mówione wersje swoich artykułów, docierając do nowych odbiorców.
To także potencjalna rewolucja w dostępności, dająca głos osobom, które go straciły (firma prowadzi specjalny program Impact), i potężne narzędzie w edukacji. Do tego dochodzą coraz śmielsze zastosowania biznesowe, od inteligentnych asystentów głosowych po w części zautomatyzowaną obsługę klienta. Skala robi wrażenie. Nic dziwnego, że z narzędzi ElevenLabs, jak sami podają, korzystają już pracownicy w ponad 60% firm z prestiżowej listy Fortune 500.
Wizja
Ale ambicje twórców ElevenLabs sięgają znacznie dalej niż tylko dostarczanie imponujących narzędzi. Ich ostatecznym celem jest coś fundamentalnego: przełamanie globalnych barier językowych. Wyobrażają sobie przyszłość, w której każda treść, czy to książka, film, artykuł naukowy czy podcast, jest natychmiastowo dostępna w dowolnym języku, w naturalnie brzmiącym, dopasowanym głosie. Chcą stać się, jak sami mówią, „głosem cyfrowego świata” i wiodącym centrum badań nad inteligencją audio AI, sprawiając, że informacja i historie będą bardziej dostępne niż kiedykolwiek wcześniej. Jednocześnie, co ważne, zdają sobie sprawę z ogromnej odpowiedzialności. Potencjał nadużyć tej technologii, zwłaszcza w kontekście tworzenia przekonujących deepfake'ów, jest realny. Dlatego, jak zapewniają, duży nacisk kładą na bezpieczeństwo AI, rozwijając narzędzia (jak AI Speech Classifier) mające wykrywać i zapobiegać niewłaściwemu wykorzystaniu ich platformy, starając się równoważyć innowację z etyką.
Historia ElevenLabs pokazuje więc, jak odpowiedź na konkretny problem - w tym przypadku nienaturalne brzmienie AI może, przy odpowiedniej technologii i determinacji, przerodzić się w rozwiązanie o globalnym zasięgu i wpłynąć na całą branżę.
Oczywiście, jeśli jeszcze nie testowałeś/aś tego narzędzia, to zapraszam do sprawdzenia.
Najprostszym sposobem na test będzie pobranie ich aplikacji ElevenLabs Reader (link na iPhone, link na Androida), który tworzy audiobooka ze wszystkiego - nieważne czy to plik PDF czy strona internetowa.
🧮 Arkusze kalkulacyjne w AI Canva
Jeśli kochasz arkusze kalkulacyjne, znasz te wszystkie kombinacje formuł to jesteś… kozak, ale jednocześnie mam Cię za dziwaka/dziwaczkę. Przepraszam, że to piszę, ale kto lubi formuły Excela normalnym być nie może 😅 W dodatku ta wiedza przestaje być konkurencyjna 💁🏻♂️ bo od teraz nad obliczeniami, interpretacją danych oraz ich wizualizacją czuwać mogą AI narzędzia w Canva.
🔗 Magic Formulas❗️Kliknij na link, aby zobaczyć jak działa❗️Funkcja ta umożliwia wprowadzanie formuł za pomocą prostych poleceń tekstowych, co upraszcza tworzenie obliczeń, nawet dla osób bez doświadczenia w arkuszach kalkulacyjnych. Przykładowo, sumowanie wydatków czy obliczanie podatków staje się błyskawiczne
🔗 Magic Insights❗️AI analizuje dane w arkuszu i automatycznie wskazuje kluczowe wzorce, trendy lub wnioski, co przyspiesza proces analizy i ułatwia storytelling danych.
Na jedno zapytanie wykrozystamy 1 kredyt z 500 dostepnych.
Prezentacja funkcji podczas konferencji Canva:
Wizualne podejście do danych: Canva Sheets różnią się od klasycznych arkuszy, takich jak Excel, dzięki projektowaniu z myślą o estetyce. Umożliwiają łatwe łączenie danych z elementami wizualnymi, co pozwala tworzyć atrakcyjne raporty, prezentacje czy infografiki bezpośrednio z arkusza.
AI-powered Magic Charts: Funkcja Magic Charts automatycznie przekształca dane w dynamiczne, interaktywne wizualizacje, takie jak wykresy słupkowe, liniowe czy kołowe. Użytkownik wybiera dane, a AI sugeruje najlepsze formaty wizualne, które można dostosować do identyfikacji wizualnej marki. Wykresy można w jednym kliknięciu przenieść do prezentacji lub postów w mediach społecznościowych.
Magic Studio at Scale: Canva Sheets integrują się z Magic Studio, umożliwiając generowanie setek spersonalizowanych, markowych materiałów (np. kampanii marketingowych) na podstawie danych z arkusza, co jest szczególnie przydatne w dużych projektach.
Integracje zewnętrzne: Arkusze wspierają import danych z narzędzi takich jak Google Analytics, HubSpot czy Statista, co ułatwia pracę z zewnętrznymi źródłami danych.
Elastyczność i współpraca: Canva Sheets umożliwiają współpracę w czasie rzeczywistym, komentowanie i dostosowywanie układów za pomocą funkcji „drag-and-drop”. Arkusze można eksportować jako PDF, PNG, JPEG lub w formacie interaktywnym do prezentacji.
🔗 Tu obejrzysz krótki tutorial z Canva Sheets w całości
Canva jest narzędziem bezpłatnym w szerokim zakresie funkcji, ale aktualności AI, dostępne są dla subskrybentów planów miesięcznych lub rocznych.
Canva oferuje program Canva for Education, który zapewnia bezpłatny dostęp do zaawansowanej wersji platformy dla nauczycieli i uczniów szkół podstawowych i średnich, a także studentów szkół wyższych. Dzięki temu, nauczyciele mogą tworzyć ciekawe lekcje i ćwiczenia, a uczniowie mogą rozwijać swoje umiejętności w zakresie tworzenia projektów graficznych.
🔗 Canva dla nauczycieli, uczniów i studentów
🥡 AI na wynos
🤖 "Na końcu tej drogi nie ma człowieka" - czytaj
💳 Sztuczna inteligencja zrobi zakupy. Visa wprowadza asystentów AI - czytaj
🟢 Duolingo uważa, że poradzi sobie bez pracowników. Zastąpi ich AI - czytaj
📰 Sztuczna inteligencja wspomoże PAP w tworzeniu materiałów multimedialnych - czytaj
🚉 Przewidzą zachowanie pasażera. AI w służbie bezpieczeństwa - czytaj
👨🏻🎓 Sztuczna inteligencja w szkole: Konieczność, nie opcja - czytaj
⛑ Rewolucja w dziedzinie bhp - wpływ sztucznej inteligencji i cyfryzacji na organizację pracy - czytaj
🌐 Sztuczna inteligencja: Dlaczego gospodarki wschodzące ufają jej bardziej niż rozwinięte - czytaj
🇨🇳 Tajemnicze zgony naukowców. Zajmowali się sztuczną inteligencją - czytaj
👥 Sztuczna inteligencja zamiast autorytetów i przyjaciół? Eksperci o podejściu generacji „Z” - czytaj / słuchaj
📗 Agatha Christie "powraca", by uczyć pisania. Nietypowy pomysł BBC - czytaj
😳 Facebook schronieniem dla dewiantów? Chatbot AI od Mety serwuje treści erotyczne głosem... postaci z Disneya - czytaj
📬 Czytałeś/-aś wydanie z 30.04? Treść “NotebookLM z językiem polskim to hit” trafiła na Twój mail w minioną środę. Sprawdź skrzynkę.
Turing Post: Wywiad z Matim Staniszewskim
Lightspeed Venture Partners: Mati Staniszewski, przyszłość mediów
Jeśli jesteś tu pierwszy raz - dołącz za darmo, aby regularnie otrzymywać takie treści na swojego maila.
A jeśli już jesteś subskrybentem i dotarłeś tutaj, oceń treść.
Jeżeli chcesz słuchać treści newsletterów w formie audio, to subskrybuj nasz kanał youtube - gorąco zachęcamy!