Wikipedia er blevet en af internettets vigtigste vidensbanker, men nu slår organisationen bag encyklopædien alarm.
Lige nu læser andre
Wikipedia er blevet en af internettets vigtigste vidensbanker, men nu slår organisationen bag encyklopædien alarm. Store techvirksomheder bruger i stigende grad Wikipedias indhold til at træne kunstig intelligens, og det skaber et pres, som ifølge Wikimedia Foundation er ved at blive uholdbart.
Problemet handler ikke kun om ophavsret, men om ressourcer, belastning og hvem der egentlig betaler prisen for AI-boomet.
AI presser infrastrukturen
Ifølge Wikimedia Foundation oplever Wikipedia en markant stigning i automatiseret trafik. Det skyldes især bots, der systematisk henter store mængder data til træning af AI-modeller. Trafikken slider på servere og øger omkostningerne, uden at det nødvendigvis gavner de frivillige fællesskaber, der driver Wikipedia.
Hvor almindelige brugere læser artikler, henter AI-systemer hele databaser i ét stræk. Det skaber en skæv belastning, som infrastrukturen ikke er bygget til.
Store navne nævnes direkte
Organisationen peger på, at nogle af verdens største teknologivirksomheder bruger Wikipedias indhold som en central del af deres AI-udvikling. Det gælder blandt andet virksomheder bag søgemaskiner, sociale medier og nye AI-assistenter, som alle er afhængige af store mængder kvalitetsdata.
Læs også
Samtidig understreger Wikimedia Foundation, at Wikipedia er gratis for brugerne – men ikke gratis at drive.
Frivilligt arbejde møder kommerciel AI
En stor del af kritikken handler om princippet. Wikipedia er bygget på frivilligt arbejde og donationer, mens AI-modellerne, der trænes på indholdet, ofte indgår i kommercielle produkter til milliarder af kroner.
Ifølge organisationen rejser det spørgsmål om fairness, når frivilligt skabt viden bruges til at opbygge lukkede systemer, uden at der gives noget tilbage.
Kan reglerne strammes?
Wikimedia Foundation overvejer nu forskellige tiltag for at beskytte både indhold og infrastruktur. Det kan blandt andet handle om begrænsninger på datatræk, nye aftaler eller tydeligere krav til virksomheder, der bruger indholdet i stor skala.
Debatten peger på et større spørgsmål: Hvordan skal åbne vidensprojekter overleve i en tid, hvor kunstig intelligens sluger data i et tempo, ingen havde forudset?
Læs også
kilder: The Verge