OpenAI, dezvoltatorul ChatGPT, știe că datele de înaltă calitate sunt importante în domeniul inteligenței artificiale. Iar editorii de știri dispun de cantități mari de date. „Ar fi imposibil să antrenezi modelele de inteligență artificială de vârf de astăzi fără a utiliza materiale protejate de drepturi de autor”, a declarat compania anul acesta într-o prezentare către Camera Lorzilor din Marea Britanie. Adăugând că limitarea opțiunilor sale la cărți și desene din domeniul public ar crea produse sub așteptări.
Laboratoarele de inteligență artificială construiesc modele lingvistice de mari dimensiuni. Adică, tehnologia care stă la baza unor instrumente precum chatbotul de vârf al OpenAI. Folosind trilioane de cuvinte preluate de pe internet, o resursă vitală pentru a furniza materiale. Care să permită LLM-urilor să înțeleagă solicitările bazate pe text și să prezică răspunsul corect la acestea.
Inteligența artificială schimbă regulile jocului
Acordul încheiat săptămâna aceasta între OpenAI și Financial Times subliniază nevoia companiei americane de materiale acceptabile. „Este clar în interesul utilizatorilor ca aceste produse să conțină surse de încredere” a spus John Ridding, directorul executiv al grupului FT. Laboratoarele de inteligență artificială devin din ce în ce mai dornice de texte fiabile, oportune și, mai ales, scrise de oameni. Pentru ca aceste răspunsuri să fie cât mai bune posibil, industria știrilor evaluează cum să reacționeze cel mai bine. În timp ce mulți intensifică lupta pentru a-și apăra teritoriul protejat de drepturi de autor, alții se angajează cu marii jucători de inteligență artificială. În scopul de a ajunge la un compromis și pentru a obține un potențial avantaj comercial.
Războiul dintre ziariști și OpenAI
The New York Times a dat prima lovitură majoră pentru apărare în decembrie. Dând în judecată OpenAI și Microsoft, cel mai mare investitor al companiei de AI, pentru încălcarea drepturilor de autor. În documentele depuse în instanță, ziarul a demonstrat că roboții de chat ai OpenAI ar putea fi determinați să recreeze, aproape textual, articole din arhiva sa.
În replică, OpenAI a susținut că „îndemnul” NYT a fost mai mult decât nerealist. Editorul a folosit „îndemnuri înșelătoare care încalcă în mod flagrant termenii de utilizare ai OpenAI… Adevărul, care va ieși la iveală pe parcursul acestui caz, este că Times a plătit pe cineva pentru a sparge produsele OpenAI”.
Procese în instanță
Războiul rece dintre NYT și OpenAI a început să mocnească de luni de zile înainte de lansarea procesului. În luna august, ziarul a blocat accesul la site-ul său web al OpenAI, care adună date pentru modelele sale. Au urmat The Guardian și BBC. Reuters și CNN au întreprins acțiuni pentru a împiedica compania să le citească materialele. O măsură care are o greutate juridică redusă, dar care îngreunează, în termeni practici, utilizarea știrilor ca date de instruire.
În lunile care au trecut de atunci, alții au lansat propriile procese. Editorii independenți Intercept, Raw Story și AlterNet au dat în judecată compania în februarie. În timp ce, în aprilie, fondul speculativ Alden Global Capital, care deține opt ziare americane, a lansat o serie de procese care vizează atât ChatGPT, cât și Copilot AI de la Microsoft. Vorbind în ianuarie, directorul executiv al OpenAI, Sam Altman, a părut să respingă relevanța NYT pentru produsele sale. „Orice sursă de instruire particulară, nu mișcă acul pentru noi atât de mult”, a spus el.
Acorduri încheiate între editorii de știri și OpenAI
Cu toate acestea, au fost încheiate înțelegeri cu editorii de știri care au observat o nouă sursă de venituri. În timp ce OpenAI, așa cum a declarat în legătură cu acordul încheiat săptămâna aceasta cu FT, dorește să „îmbogățească experiența ChatGPT cu jurnalism de clasă mondială în timp real”.
Acordul permite OpenAI să antreneze viitoarele modele pe conținutul FT. Oferind în același timp grupului de știri acces la tehnologia și expertiza dezvoltatorului de inteligență artificială pentru a construi instrumente pentru propria afacere. Utilizatorii ChatGPT vor primi, de asemenea, rezumate și citate din materialele FT, precum și linkuri către articole, ca răspuns la solicitări, acolo unde este cazul.
OpenAI a semnat deja acorduri de licențiere a conținutului cu agenția de știri americană Associated Press, cu ziarul francez Le Monde, cu proprietarul El País, Prisa Media, și cu compania germană Axel Springer, care publică tabloidul Bild. Un purtător de cuvânt al Guardian News & Media, editorul cotidianului The Guardian, a confirmat că nu are în prezent un acord cu OpenAI. Dar a adăugat că poartă în continuare discuții cu o serie de companii de top din domeniul inteligenței artificiale.
Echilibru incert al puterii
Acordurile evidențiază echilibrul incert al puterii între AI și mass-media. Pe de o parte, protecția incertă a drepturilor de autor și accesul ușor la materiale online au încurajat multe companii de AI. Pentru a-și asuma riscul cu date fără licență. Sperând că vor putea pretinde utilizarea corectă în orice bătălie juridică. Atunci când au nevoie să licențieze materiale, natura de marfă a multor reportaje încurajează o abordare de tipul „divide et impera”. Dacă este nevoie de o singură afacere pentru a menține un chatbot la curent cu cele mai recente știri, acest lucru oferă un puternic potențial de negociere.
Niamh Burns, analist senior la Enders Analysis, susține că OpenAI și FT împărtășesc suficiente stimulente pentru a semna un acord. Dar editorii și companiile de tehnologie aduc perspective diferite la masa negocierilor.
„Editorii spun că utilizarea conținutului lor pentru a instrui LLM-uri este împotriva termenilor lor de utilizare și că licențierea este esențială. OpenAI spune că nu încalcă drepturile de autor și încadrează acordurile ca fiind un sprijin voluntar pentru sectorul jurnalistic. Acordarea de licențe este încă o zonă gri. Dar aceste acorduri timpurii stabilesc unele precedente. Problema pentru editori este că nu avem nicio idee despre cum vor arăta produsele de inteligență artificială peste un an. S-ar putea să nu știe nici măcar ce să ceară” a explicat Burns, conform The Guardian .