Liczysz, że firmy AI zapłacą za kradzież treści? Ten wyrok sądu Cię zaskoczy. 🧑⚖️
🎬 Hollywoodzkie efekty specjalne za $19? YouTuber pokazuje, że to możliwe.
🔉Wolisz wersję audio? Nie możesz przeczytać teraz maila?
Przesłuchaj tutaj
Możesz nas słuchać także na Apple Podcast i Spotify.
🎯W DZISIEJSZYM WYDANIU
🎓 AI od zera do zrozumienia: Koniec praw autorskich, jakie znamy? ⚖️
🔬 AI w praktyce: Jak używać Wonder Studio dla początkujących - 🎬 AI Video School
🥡 AI na Wynos:
1 miliard na polską AI ściemą?
“Chiński ChatGPT”
Nowe demo Sora
Produkcję anime zlecisz AI
Chińsko-rosyjska dywersja na Bałtyku
AI miś pluszowy
ElevenLabs - jak to się zaczęło. Rozmowa z założycielami.
Wydarzenia AI, które warto wpisać w grudniowy kalendarz:
AI dla liderów
AI TASK FORCE Innovation Summit
📚 Rekomendowana Biblioteka:
Katherine Forrest - When Machines can be Judge, Jury, and Executioner: AI and Justice (wykład)
"The Copyright Wars: Three Centuries of Trans-Atlantic Battle" (książka)
Nadchodzą AI premiery książkowe
Koniec praw autorskich, jakie znamy?
Jestem stałym czytelnikiem Medium - platformy, którą szczerze polecam. Oczywiście, tak jak wszędzie, trzeba tam selektywnie traktować informacje, ale każdy zainteresowany technologią i sztuczną inteligencją znajdzie tam masę ciekawych artykułów od niezależnych twórców.
To właśnie tam natrafiłem na fascynujący artykuł Ignacio de Gregorio, który przybliżył mi przełomową sprawę sądową OpenAI. Ostatnio przez nawał spraw prywatnych jestem trochę odcięty od informacji, nie mam po prostu czasu śledzić wszystkiego na bieżąco, więc sprawa OpenAI vs Raw Story Media i AlterNet mnie ominęła. A okazuje się, że stanowi ona coś znacznie ważniejszego niż kolejny proces o prawa autorskie - może całkowicie zmienić sposób, w jaki myślimy o własności intelektualnej w erze AI. Dlatego jeżeli Ciebie też ominęła ta historia, zapraszam do lektury. 👇
O co poszło tym razem?
Raw Story Media i AlterNet, dwa znaczące portale informacyjne, pozwały OpenAI na podstawie ustawy Digital Millennium Copyright Act (DMCA). W skrócie, DMCA zabrania omijania zabezpieczeń stosowanych w celu ochrony praw autorskich. Wydawcy zarzucili OpenAI wykorzystanie "tysięcy" ich artykułów w zestawach treningowych ChatGPT (WebText, WebText2 i Common Crawl), przy jednoczesnym usunięciu informacji o prawach autorskich, w tym danych o autorach i tytułach.
Co ciekawe, OpenAI otwarcie przyznaje, że wykorzystuje chronione prawem treści do trenowania swoich modeli. Firma podpisała już umowy licencyjne z niektórymi większymi wydawcami i prowadzi rozmowy z kolejnymi podmiotami z branży informacyjnej. Dlaczego więc sędzia odrzuciła pozew?
Techniczne sedno sprawy
Odpowiedź leży w fascynującej naturze dużych modeli językowych (LLM). Kiedy mówimy o "uczeniu się" ChatGPT na artykułach, nie mówimy o prostym kopiowaniu tekstu. Model kompresuje wiedzę z całego internetu do abstrakcyjnych "cech", które później wykorzystuje do generowania odpowiedzi.
Anthropic, twórca modelu Claude, pokazał to na konkretnym przykładzie. W najnowszej wersji Claude 3 Sonnet zidentyfikowali coś, co nazwali "cechą mostu Golden Gate". To zestaw neuronów, które aktywują się zawsze, gdy model mówi o słynnym moście - niezależnie czy robi to po angielsku, japońsku czy rosyjsku, czy analizuje zdjęcia mostu. Co fascynujące, ta "cecha" nie jest powiązana z żadnym konkretnym źródłem wiedzy o moście - powstała jako abstrakcyjna reprezentacja wiedzy z potencjalnie setek różnych źródeł.
To fundamentalnie zmienia sposób, w jaki musimy myśleć o prawach autorskich w kontekście AI. Jak możemy mówić o naruszeniu praw do konkretnego tekstu, jeśli model nie przechowuje tekstów, tylko abstrakcyjne reprezentacje wiedzy?
Skala, która zmienia wszystko
Liczby w tej sprawie są oszałamiające. Najnowsze modele językowe trenowane są na zbiorach danych przekraczających 12,5 biliona słów. Dla porównania, wszystkie książki kiedykolwiek napisane zawierają około 100 bilionów słów. Co więcej, tempo przyrostu danych treningowych jest zawrotne - szacuje się, że w ciągu ostatnich sześciu miesięcy mogło się ono zwiększyć nawet o 60%.
W tak ogromnym oceanie danych, prawdopodobieństwo, że model dosłownie skopiuje czyjąś pracę, jest znikome. Co więcej, wraz z rosnącą ilością syntetycznych danych treningowych (czyli danych generowanych przez inne AI), rola pojedynczych źródeł będzie się stale zmniejszać.
Dlaczego to przełom?
Sędzia w swojej decyzji wskazała na trzy kluczowe elementy:
Same fakty nie podlegają ochronie prawno-autorskiej
Modele AI syntetyzują wiedzę, a nie kopiują treść
Zbiory danych są tak ogromne, że pojedyncze źródło ma minimalny wpływ na końcowy wynik
To fundamentalnie nowe podejście do kwestii praw autorskich w dobie AI. Do tej pory większość spraw koncentrowała się na tym, czy AI może wykorzystywać chronione treści. Teraz sędzia sugeruje, że samo pytanie może być źle postawione - bo AI nie tyle "wykorzystuje" treści, co "uczy się" z nich, podobnie jak człowiek.
Co dalej?
Ta decyzja otwiera fascynujące, ale i niepokojące perspektywy. Z jednej strony, daje firmom AI większą swobodę w rozwijaniu swoich modeli. Z drugiej - stawia trudne pytania o przyszłość branży medialnej i twórców treści.
Pojawiają się różne propozycje rozwiązań. Jedna to obowiązkowe cytowanie źródeł - ChatGPT już to robi w wersji z dostępem do internetu, choć nie jest to idealne rozwiązanie dla modeli działających offline. Inna to systemy kompensacji finansowej dla wydawców, bazujące nie na tradycyjnych prawach autorskich, ale na wartości, jaką ich treści wnoszą do rozwoju AI.
Ciekawe podejście proponuje też sama branża technologiczna. Anthropic pracuje nad technikami "mechanistycznej interpretacji" modeli, które mogłyby pomóc zrozumieć, jak konkretne źródła wpływają na wiedzę modelu. To mogłoby prowadzić do bardziej sprawiedliwego systemu wynagrodzeń dla twórców treści.
Moim zdaniem, stoimy przed klasycznym dylematem rozwoju technologicznego o czym pisałem już wielokrotnie w moich tekstach. Z jednej strony, ograniczanie dostępu AI do wysokiej jakości treści może hamować postęp technologii, która ma potencjał rewolucjonizować wiele aspektów naszego życia. Z drugiej - nie możemy ignorować praw i potrzeb twórców oryginalnych treści.
Paradoksalnie, ta decyzja sądu może przyspieszyć wypracowanie nowych modeli biznesowych w branży medialnej. Zamiast walczyć z AI, wydawcy mogą zacząć szukać sposobów na monetyzację swojego wkładu w rozwój tej technologii. Może to będzie system mikroopłat za wykorzystanie treści w treningu AI, może obowiązkowe partnerstwa między firmami AI a wydawcami, a może coś zupełnie innego, czego jeszcze nie wymyśliliśmy.
Jedno jest pewne - ta sprawa to nie koniec, a dopiero początek dyskusji o tym, jak pogodzić rozwój AI z ochroną własności intelektualnej. I choć dzisiaj może się wydawać, że sądy stają po stronie firm technologicznych, ostateczny kształt tych relacji wciąż jest do wypracowania.
🎬 Jak używać Wonder Studio dla początkujących (takich jak ja)" - AI Video School
Absolutnie fantastyczny tutorial pokazujący jak używać Wonder Studio - narzędzia do tworzenia efektów specjalnych z wykorzystaniem AI. Autor pokazuje jak przy pomocy iPhone'a i najtańszego planu ($19) stworzyć dwuminutowy film science fiction z siedmioma różnymi robotami! Bez drogiego sprzętu do motion capture, bez green screena, bez lat doświadczenia w VFX. To naprawdę pokazuje, jak AI demokratyzuje tworzenie contentu filmowego. (20 min, must-watch dla każdego zainteresowanego przyszłością produkcji wideo)
🥡 AI na Wynos
🇵🇱 1 miliard na sztuczną inteligencję WIELKĄ ŚCIEMĄ? - czytaj o skandalu
🇨🇳 “Chiński ChatGPT” poznaj DeepSeek. Ma być odpowiednikiem o1 od OpenAI. Sprawdzał go Jakub - czytaj
📹 Nowa prezentacja demo modelu Sora od OpenAI - obejrzyj wideo
📹 ViduAI. Zobacz jakie animacje tworzy np. anime - obejrzyj wideo
🔌 Chiński statek, rosyjski kapitan i przecięty kabel od internetu na Bałtyku, czyli jak Kreml poluje na infrastrukturę podmorską i mierzy czułe miejsce zachodnich gospodarek. Również w AI! - czytaj
🧸 AI miś reklamowany jako idealny prezent pod choinkę. Dostępny również w Polsce, czy jednak na pewno to najlepszy wybór? - obejrzyj
📰 ElevenLabs - jak to się zaczęło? Wywiad z Mateuszem Staniszewskim i Piotrem Dąbkowskim - warto przeczytać 💎
📆 AI dla liderów. W dniach 2-4 grudnia odbędzie się wydarzenie organizowane przez EY Academy of Business Polska, podczas którego kompleksowo omówiony zostanie temat efektywnej integracji rozwiązań AI w strukturach i strategiach organizacji - czytaj więcej o wydarzeniu
📅 Konferencja AI TASK FORCE Innovation Summit, odbędzie się 11 grudnia 2024 w Muzeum Sztuki Nowoczesnej w Warszawie - czytaj więcej o wydarzeniu
1. "Katherine Forrest - When Machines can be Judge, Jury, and Executioner: AI and Justice" Fascynujący wykład byłej sędzi Sądu Okręgowego USA, która specjalizuje się w kwestiach prawnych związanych z AI. (materiał dla entuzjastów i profesjonalistów prawa 🤓🎓)
"The Copyright Wars: Three Centuries of Trans-Atlantic Battle" - Peter Baldwin Fascynująca książka pokazująca jak na przestrzeni wieków zmieniało się podejście do praw autorskich. Szczególnie interesujące jest to, jak Stany Zjednoczone przeszły drogę od największego pirata do światowego policjanta praw autorskich. Daje to ciekawy kontekst do obecnej sytuacji z AI.
🔗 ebook i wersja papierowa (ENG)
Nadchodzą premiery książek AI. W nadchodzących dniach na półki trafią książki:
“Moje światy - sztuczne i realne. Jak narodziła się AI najnowszej generacji” - autorstwa Fei-Fei Li. PREMIERA JUŻ JUTRO! 22.11.2024*
*horyzont.ai jest partnerem medialnym podczas promocji tego wydawnictwa
“Osobliwość coraz bliżej. Kiedy połączymy się z AI.” - autorstwa Raya Kurzweila. PREMIERA 27 LISTOPADA!
Jeśli masz jakieś ekscytujące pomysły lub projekty, śmiało się z nami skontaktuj, odpowiadając na ten email lub śledząc nas na X: @JakubNorkiewicz @oskar_korszen