Saksøker OpenAI over treningsmateriale til ChatGPT

OpenAi blir saksøkt for hvordan de samlet inn treningsdata for ChatGPT. — OpenAI kan ha begått massivt opphavsrettsbrudd når de skrapte nettet for innhold til å trene GhatGPT på. (Bilde: OpenAI.)

Selskapet blir dratt til retten for å svare på spørsmål om de brøt opphavsretten til milioner av mennesker da de «trente» ChatGPT på stoffet deres

Søksmålet «går til hjertet» av om hvorvidt de milliardene av ordene som ble sopt opp til ChatGPT ble samlet inn med tillatelse fra rettighetshaverne, altså de fleste som har skrevet på nettet i de siste ti-tyve årene.

Aldri tiltenkt slik bruk
— All denne informasjonen blir inntatt i en stor skala, mens den aldri var tiltenkt bruk i en stor språkmodell, sier Ryan Clarkson, fra advokatfirmaet Clarkson, som står bak søksmålet, til The Washington Post.

Rettsaken vil gå som et såkalt massseøksmål, som er åpent for at mange, svært mange, kan komme inn som med-saksøkere. Advokatfirmaet har allerede en gruppe saksøkere, men leter etter flere:

— Vi ønsker å representere ekte personer som har fått informasjonen sin stjålet og kommersielt utnyttet for å skape denne kraftige teknologien, sier Clarkson.

Det pågår allerede flere rettssaker mot bildegeneratorer som har samlet inn data fra kunstnere og bildebyråer uten tillatelse, og det er uavklart om hvem som eier rettighetene til bilder generert i deres «stil» fra disse.

Sier fra seg rettigheter til plattformene
Det er bare ett lite problem med denne innfallsvinkelen: De fleste som poster på sosiale medier, sier seg enig i å gi i nettverkene brede rettigheter til å bruke innholdet deres til nesten hva som helst.

Dersom OpenAI har inngått avtaler med sosiale eller blogg-plattformer om å «skrape» innholdet deres, kan innsamlingen faktisk være ok, rent juridisk sett.

— Det kommer til å bli veldig vanskelig for en vanlig sluttbruker å hevde at de har krav på betaling eller kompensasjon for bruken av dataen deres, sier Katherine Gardner, en IP-advokat hos Gunderson Dettmer, som har mange teknologiklienter, til Washington Post.

«Alle» språkmodellene skaper det åpne nettet
Det spørs så om OpenAI hadde tillatelse fra sosiale medier, eller om andre «eiere» av denne dataen hadde gitt tillatelse til oppsamlingen på forhånd.

Roboter fra både OpenAI og Google har lenge saumfart kilder som Wikipedia og Internet Archives for innhold, såvel som kommentarer og innhold på sosiale medier — så denne rettssaken kan true selve underlaget for hvordan språkmodellene henter inn data, og hvordan de fungerer.

Selv sier de at innholdet de bruker og lager kommer inn under “fair use”-klausulen i amerikansk opphavsrett, som sier at man kan bruke andres innhold så lenge det resulterende verket er vesentlig endret.

Les også: Bildebyrå saksøker kunstig intelligens.

Les mer: The Washington Post.

Saksøker OpenAI over treningsmateriale til ChatGPT

GPT-5.5 found on par with Mythos, with OpenAI to limit access to Cyber version

The Oscars move to protect human authorship in new rules targeting AI use

OpenAI confirms and explains GPT’s affinity for mentioning goblins

OpenAI debuts «pets» for Codex — and they are actually useful

The White House reportedly discussing vetting AI models ahead of release

The European Union starts process to open up Android to AI competitors