Autopromocja
Dziennik Gazeta Prawana logo
Prawo internetu i ochrony danych

Postęp – „tak”, wypaczenia – „nie”, czyli o trenowaniu modeli generatywnej AI

14 lutego 2024
Ten tekst przeczytasz w 4 minuty

Z wielkim zainteresowaniem przeczytałem wywiad z dr Zbigniewem Okoniem „Dziś zablokowanie AI dostępu do treści to fikcja”, DGP nr 21/2024. W rozmowie bardzo przejrzyście zaprezentowano historię prac nad dyrektywą o prawie autorskim z 2019 r. (DSM) czy mechanizm trenowania generatywnych systemów AI. Doktor Okoń przede wszystkim uznał jednak możliwość zastosowania art. 4 dyrektywy do trenowania generatywnych algorytmów, nawet jeśli dostrzegł pewne niedostatki tego przepisu. W wywiadzie zaznaczono także, że właśnie finalizowany projekt aktu o AI niejako post factum legalizuje oparcie trenowania generatywnych algorytmów na wyjątku TDM (Text and Data Mining).

Od samego początku miałem i mam potężne wątpliwości, czy art. 4 dyrektywy DSM może mieć zastosowanie do generatywnych modeli. Z pełnym przekonaniem twierdzę, że często postponowany argument o braku wyobraźni odnośnie do funkcjonowania tego rodzaju modeli w momencie pracy nad dyrektywą, jest zgodny z prawdą. Jest faktem, że ani sama dyrektywa, ani dokumenty jej towarzyszące słowem nie wspominają o modelach generatywnych. Sami bezpośredni uczestnicy prac nad dyrektywą (posłowie Parlamentu Europejskiego) zaświadczają, że nie była ona przedmiotem debaty. Przyjmuję do wiadomości, że na ostatniej prostej prac nad dyrektywą liczono się z eksplozją generatywnych zdolności maszyn. Trudno jednak byłoby założyć, że na podstawie mglistych wyobrażeń możliwe jest takie skonstruowanie przepisu, aby czynił on zadość interesom tych, którzy są uprawnieni do danych treningowych. Jeśli zatem – a to chyba pozostaje poza sporem – prawodawca nie mógł mieć jasności co do niezwykle inwazyjnego sposobu działania generatywnych modeli, nie mógł obejmować ich prawodawczym zamiarem. Tym bardziej że funkcjonują one jednak w inny, dwufazowy sposób, o czym mowa poniżej.

Choć w publicznej debacie zafunkcjonował przede wszystkim spór o historię prac nad dyrektywą DSM, nie jest to przecież jedyny argument. Funkcjonowanie tych modeli na obecnym etapie jest dwufazowe. Pierwszy etap, nazywany fazą input, obejmuje pozyskanie oraz wewnętrzne ustrukturyzowanie możliwie obszernych zasobów danych dla wyekstrahowania z nich zawartości informacyjnej. Wewnętrzne struktury modeli nie stanowią jakiegoś amalgamatu zminiaturyzowanych obrazków czy treści pozyskanych z sieci. Niczym sok z cytryny wyciskają one wiedzę na temat sposobu przedstawienia tego czy innego elementu i przyswajają ją. Dzięki tej umiejętności mogą one odtwarzać te kształty na drugim etapie (faza output). Gdyby przyjąć zastosowanie wyjątku TDM, mógłby objąć wyłącznie pierwszy etap (input), nie drugi – output. Tym samym doszłoby do sztucznej i do tej pory niespotykanej sytuacji, w której jeden niepodzielny proces w postaci funkcjonowania generatywnych modeli zostałby jedynie częściowo usprawiedliwiony dozwolonym użytkiem. W drugiej fazie (tj. gdyby output naruszał cudze prawa autorskie) już jednak nie.

Źródło: Dziennik Gazeta Prawna

Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone.

Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A. Kup licencję.