Přístup Applu ke generativní umělé inteligenci se snaží vyhnout problémům s autorskými právy

Umělá inteligence společnosti Apple může být jedinou legálně vyškolenou na trhu

Vzhledem k tomu, že oblast generativní umělé inteligence sužují autorská práva, Apple se snaží zachovat soukromí a zákonnost prostřednictvím inovativních školicích metod pro metody jazykového vzdělávání, a to vše při vyhýbání se kontroverzi.

V posledních letech zůstává otázka generativní umělé inteligence ve vztahu k autorskému právu poměrně důležitým a komplexním problémem. S rostoucí popularitou modelů výuky jazyků (LLM) a generativních aplikací umělé inteligence se problémy s autorskými právy stále hromadí bez jakéhokoli smysluplného řešení.

Problémy nastávají, když společnosti používají díla chráněná autorským právem při školení svého generativního softwaru umělé inteligence a když výstupy uvedeného softwaru umělé inteligence obsahují části děl pod ochranou autorských práv.

Kopírování celých děl chráněných autorským právem nebo používání významných částí takových děl pro školení generativního softwaru umělé inteligence je porušením autorských práv. Neexistuje žádná možnost „fair use“ pro školení AI, navzdory tomu, co společnosti, které školí modely, říkají nebo věří.

Generativní AI a soudní spory o porušení autorských práv

Na konci prosince 2023 byly OpenAI a Microsoft žalovány The New York Times za porušení autorských práv. V žalobě bylo tvrzeno, že tyto dvě společnosti trénovaly svůj generativní software AI pomocí milionů článků publikovaných společností The New York Times.

Nebylo to poprvé, co OpenAi čelila soudnímu sporu ohledně modelového tréninku. V září 2023 byla společnost také žalována několika významnými autory, mezi nimiž byli George RR Martin, Michael Connelly a Jonathan Franzen.

Historie generativní umělé inteligence a autorských práv sahá ještě dále, protože v červenci 2023 více než 15 000 autorů podepsalo otevřený dopis adresovaný několika významným společnostem, včetně Alphabet, OpenAI, Meta, Microsoft a dalším.

Dopis požadoval, aby autoři byli řádně oceněni a kompenzováni za jejich práci, která byla použita při školení generativních AI a modelů učení jazyků.

Další podobnou hromadnou žalobu na porušení autorských práv podali proti OpenAI autoři literatury faktu Nicholas Basbanes a Nicholas Gage. Žaloba byla podána v lednu 2024.

Koncem dubna 2024 byla podána další žaloba související s AI, tentokrát proti Amazonu. Žaloba tvrdí, že zaměstnanec Amazonu byl instruován, aby záměrně ignoroval a porušoval autorský zákon, aby Amazon mohl účinněji konkurovat konkurenčním produktům a službám.

V žalobě bývalá zaměstnankyně Amazonu tvrdí, že jí vedoucí ohledně školení AI porušujících autorská práva řekl, že „to dělají všichni ostatní“ – což naznačuje, že lidé z konkurenčních společností se vědomě zapojovali do porušování autorských práv.

A je celkem jasné, že jsou.

Obavy AI a vydavatelů ohledně reprodukce obsahu chráněného autorským právem

Je známo, že umělá inteligence reprodukuje obsah chráněný autorským právem při mnoha příležitostech a závažnost problému inspirovala společnosti k analýze frekvence, s jakou k tomu dochází.

Abychom lépe porozuměli rychlosti, jakou AI chatboti generují obsah chráněný autorským právem, rozhodla se společnost PatronusAI záležitost prozkoumat. Společnost, která hodnotí generativní modely umělé inteligence, porovnala čtyři hlavní modely umělé inteligence – ChatGPT-4 od OpenAi, Llama 2 od Meta, Mixtral od Mistral a Claude 2.1 od Anthropic.

Patronus AI zjistil, že míra, jakou umělá inteligence generovala obsah chráněný autorskými právy, se nakonec lišila v závislosti na modelu, ale míra generování obsahu chráněného autorskými právy byla vysoká. Společnost také vydala svůj vlastní nástroj, známý jako CopyrightCatcher, který by detekoval potenciální porušení autorských práv v LLM.

Zatímco vytváření obsahu chráněného autorskými právy má vážné důsledky, vydavatelé jsou rovněž znepokojeni používáním materiálů chráněných autorskými právy při školení modelů výuky jazyků.

Obrázek myši s průvodcem vygenerovaný aplikací Adobe Firefly. Rozhodně ne Mickey z Disneyho ‚Fantasie‘

V březnu 2024 The Wall Street Journal uvedli, že významní vydavatelé zkoumali použití svých děl chráněných autorským právem při školení generativních modelů umělé inteligence. Vydavatelé chtěli být placeni za použití jejich díla AI.

Vzhledem k počtu soudních sporů týkajících se generativní umělé inteligence a autorských práv a závažnosti obav vyjádřených vydavateli dává smysl, aby se společnost jako Apple snažila ze všech sil vyhnout jakýmkoli potenciálním právním problémům.

Jedinečný přístup společnosti Apple ke generativní umělé inteligenci, modelům výuky jazyků a problémům s autorskými právy

Jako způsob, jak se vyhnout podobným problémům s autorskými právy během školení vlastního generativního softwaru AI, Apple údajně licencoval díla hlavních zpravodajských publikací.

V prosinci 2023 bylo oznámeno, že Apple plánuje vyzkoušet a licencovat díla od Conde Nast – vydavatele Móda a New Yorker. Společnost také hovořila s IAC a NBC News ve snaze uzavřít dohodu v hodnotě přibližně 50 milionů $.

Zatímco Apple vyvinul svůj model výuky jazyků, interně známý jako Ajax, se základními funkcemi na zařízení, společnost zaujala jiný přístup k pokročilejším funkcím. Apple zvažoval licencování softwaru, jako je Google Gemini, pro složitější úkoly vyžadující připojení k internetu.

Využitím této strategie Apple jasně zamýšlel vyhnout se problémům s autorskými právy. S placenou licencí nebude Apple odpovědný za porušení autorských práv způsobené nebo spáchané softwarem, jako je Google Gemini.

Ve výzkumném dokumentu zveřejněném v březnu 2024 Apple odhalil, že k trénování svého interního LLM použil pečlivě připravenou směs obrázků, obrázkového textu a textového vstupu. Metoda, kterou Apple použil, umožnila lepší popisky obrázků, vícekrokové uvažování a zachování soukromí, to vše zároveň.

Příklad obrázku z generativního grafického nástroje AI společnosti Apple.

Zdroje z oboru nám řekly, že Ajax LLM společnosti Apple zachovává soukromí, protože pro základní analýzu textu nevyžaduje připojení k internetu. To znamená, že LLM na zařízení se nemůže připojit k databázi a identifikovat obsah chráněný autorským právem v režimu offline, ačkoli pokročilejší funkce, jako je generování textu, by takové kontroly a připojení pravděpodobně obsahovaly.

Ponecháme-li stranou hlášení a zdokumentované projekty, zábradlí a licencování jsou stejně bezpečné pouze tehdy, jsou-li vymáhány. Hovoří zdroje obeznámené s testovacím prostředím AI společnosti Apple AppleInsider odhalili, že existovala zdánlivě malá nebo žádná omezení, která by někomu zabránila v používání materiálu chráněného autorskými právy ve vstupu pro testovací prostředí na zařízení.

Náš zdroj neměl jasno o předpisech uvnitř společnosti Apple, které mají zabránit školení o porušování autorských práv. Výstup je však pravděpodobně více regulován, aby se zabránilo doslovné reprodukci materiálu chráněného autorským právem.

Apple by měl svou generativní technologii AI představit během WWDC, která začíná 10.

Zdroj: appleinsider.com