OpenAI:n joidenkin tekoälymallien muistisäännöissä viitteitä tekijänoikeudella suojatusta sisällöstä, uusi tutkimus väittää

Uusi tutkimus ei ole varmasti ole tekoäly-yhtiö OpenAI:n mieleen.

07.04.2025

Washingtonin, Kööpenhaminan ja Stanfordin yliopistojen laatima tutkimus ei varmasti ole tekoäly-yhtiö OpenAI:n mieleen. Sen mukaan tutkijat ovat löytäneet mahdollisia viitteitä, että OpenAI olisi käyttänyt tekijänoikeudellisesti suojattua materiaalia ainakin joidenkin tekoälymalliensa koulutuksessa, TechCrunch raportoi.

Lue myös: ChatGPT:llä tehdyt Ghibli-kuvat kuohuttavat – mistä oikeastaan onkaan kyse?

Tutkimus on käyttänyt uudenlaista tapaa tunnistaa kerätystä datasta mallien oppimia muistisääntöjä. Tämä uusi tunnistusmetodi keskittyy ennen kaikkea sanoihin, joita käytetään epätavallisissa asiayhteyksissä. Koska tekoälymallit ovat pohjautuvat ennakointiin ja opittuihin kuvioihin, tiettyjen sanaparsien kautta ne voidaan yhdistää jo olemassa oleviin teoksiin ja materiaaleihin. Tutkijoiden mukaan OpenAI:n GPT-4:n ja GPT-3.5:n kaltaisista tekoälymalleista olisi tätä metodia käyttämällä löydetty viitteitä esimerkiksi suosituista kirjoista ja julkaistuista artikkeleista.

Lue myös: Tässäkö tulevaisuus? Microsoft julkaisi tekoälyllä tehdyn Quake II -demon

ChatGPT:stä tuttu OpenAI on pitkään vedonnut tekoälyjensä kouluttamiseen käyttämänsä materiaalin olevan niin sanotun Fair Use -pykälän alla, joka mahdollistaa rajoitetuissa määrin suojatun materiaalin käyttämisen. Yhtiö on käyttänyt tätä puolustuksenaan muun muassa oikeudessa, jossa sitä vastaan on vireillä useita tekijänoikeusrikkomushaasteita Yhdysvalloissa.

Tutkimukseen sekä sen johtopäätöksiin ja tuloksiin voi perehtyä tarkemmin täällä.

Lähde: TechRadar