Elf redenen om verre te blijven van OpenAI en ChatGPT; En wat je wel zou willen.

OpenAI werkt volgens het silicon valley principe van “Move fast and break things”. Het doel is om de markt te veroveren en dat snel genoeg doen voordat rechters en beleidsmakers je terug fluiten. Dit geeft deze bedrijven, als ze eenmaal een monopoliepositie hebben bereikt, enorme macht. Rechtszaken worden voor miljarden afgekocht of geschikt en de politieke lobby is gigantisch.

(Microsoft Copilot gebruikt het taalmodel ChatGPT-4 van OpenAI. Onderstaande problemen hebben dus ook allemaal betrekking op MS Copilot)

OpenAI en ChatGPT:

1 hebben het hele internet gescraped, zonder ergens op te letten, dus de OpenAI
dataset bevat:
1.1 materiaal waar copyright op zit en/of achter paywalls vandaan is gescraped.
1.2 opensource licenties met attributievereisten.
1.3 werken met creative commons non-commercial & attribution licenties.
1.4 persoonsgegevens zonder toestemming van betrokkenen.
1.5 data van lage kwaliteit: alle complottheorieën, racistische uitlatingen, des- en misinformatie die op het internet zijn te vinden zitten in de dataset. Voorbeelden zijn 4chan- en 8chanfora en nazistische sites als Stormfront. Met de juiste prompts leveren OpenAI en ChatGPT leveren dergelijke informatie weer terug aan de gebruiker.

2 zijn niet transparant over data en algoritmen: Welke data gebruiken ze precies, hoe wordt die gewogen, hoe ziet het algoritme er uit en hoe is het getraind? Het is voor de gebruiker dus nauwelijks tot niet mogelijk de kwaliteit van de geleverde informatie te beoordelen.

3 is closed source. Hierdoor is het moeilijk om er onafhankelijk wetenschappelijk onderzoek naar te doen.

4 doen niet aan bronvermelding, wat beoordeling van de informatie eveneens bemoeilijkt

5 misbruiken onderbetaalde arbeid uit lage lonen landen om het algoritme verder te trainen. Zie: https://www.theguardian.com/technology/2023/aug/02/ai-chatbot-training-human-toll-content-moderator-meta-openai en https://time.com/6247678/openai-chatgpt-kenya-workers/

6 storten het internet vol met automatisch gegenereerde mis- en desinformatie en schadelijke content, aangezien de output deels is gebaseerd op de mis- en desinformatie en schadelijke content die zich in de database bevinden (zie punt 1.5). Zoeken en goede informatie vinden is daardoor veel moeilijker geworden. Dit is een zichzelf versterkend proces en dus een groeiend probleem naarmate er meer door ChatGPT en OpenAI gegenereerde content online komt. “Content marketeers” zetten ChatGPT en OPenAI op grote schaal in om click-bait en SEO-spam te genereren (Search Engine Optimalization, ofwel strategieën om een website hoger op de lijst van zoekresultaten te laten verschijnen).Zie https://www.businessinsider.com/seo-heist-ai-generative-artificial-intelligence-google-2023-12

7 vormen een onwenselijke machtsconcentratie. Er zijn slechts een paar partijen in de wereld die beschikken over zo veel data en computerkracht dat ze deze zeer inefficiënte manier van AI kunnen uitvoeren. Ook dit is een zichzelf versterkend proces: hoe meer data en computerkracht, hoe groter de machtspositie en hoe meer data, geld en verdere computerkracht dit wederom oplevert. De grote techbedrijven zijn vaak machtiger dan sommige nationale regeringen; dit terwijl er nooit een democratisch debat is geweest over de vraag of dit wel wenselijk is. Voorheen waren het publieke instellingen als universiteiten, meteorologische diensten of defensie die over de meeste computerkracht beschikten.

8 zijn ook voor scammers, spammers, phishers en trollenfabrieken krachtig gereedschap: phishing berichten zijn nog nooit zo goed geweest.

9 gebruiken jouw data. Alle data die in ChatGPT worden ingevoerd zijn door ChatGPT te gebruiken voor vrijwel elk doel. Terms of service zijn hierbij misleidend. Vrij vertaald: ‘Jouw data blijven van jou’ (maar wij mogen het ook gebruiken, voor alles).

10 produceren met de volste overtuiging geloofwaardig klinkende onzin. Bijvoorbeeld de laatste 10 cijfers van Pi, wetenschappelijke rapporten vol goed uitziende bronvermeldingen die niet bestaan (of op verzoek ook gewoon gegenereerd kunnen worden). En meer AI fouten die in het nieuws zijn geweest: https://tech.co/news/list-ai-failures-mistakes-errors
Zaken die op het internet breed zijn gedocumenteerd gaan meestal goed, maar als er gevraagd word naar zaken die nieuw zijn, tegen meest gedeelde opinie in gaan of onbekend zijn, komt er een onzin antwoord.

11 verbruiken astronomisch veel energie en koelwater, alsof de klimaatcrisis niet bestaat:
https://techhq.com/2023/03/data-center-energy-usage-chatgpt en nee, AI gaat dat niet oplossen: https://www.technologyreview.com/2024/09/28/1104588/sorry-ai-wont-fix-climate-change Wel worden oude kerncentrales weer uit de mottenballen gehaald om aan de AI-energie honger te voldoen: https://www.cnn.com/2024/09/20/energy/three-mile-island-microsoft-ai/index.html

Wat je dan wel zou willen:

Kunstmatige intelligentie zou opensource, uitlegbaar, reproduceerbaar en energiezuinig moeten zijn, gebaseerd op een eerlijke manier van data verzamelen en met respect voor mensenrechten. Zie een voorbeeld van een ethisch toetsingskader voor algoritmen opgesteld door de rekenkamer: https://www.rekenkamer.nl/onderwerpen/algoritmes-digitaal-toetsingskader/ethiek
Een dergelijk kader zou ook voor AI in onderzoek en onderwijs gemaakt kunnen worden.
Het initiatief https://gpt-nl.nl lijkt het beter te doen dan de op dataroof gebaseerde commerciële initiatieven uit Silicon Valley. Ook zijn gelukkig meer universiteiten bezig met ethiek en AI, bijvoorbeeld de UVA: https://www.uva.nl/binaries/content/assets/uva/nl/over-de-uva/over-de-uva/ai-in-het-onderwijs/ai-checklist-vu-uva-taskforce.pdf
Nu nog zorgen dat deze eerlijke alternatieven worden doorontwikkeld, worden onderwezen en breed geaccepteerd in het Nederlandse onderwijs plaats van de door Amerikaanse oligarchen bestuurde AI-algoritmen.

edit 2025-01-27 : opmerking over Microsoft Copilot toegevoegd.

This work is licensed under CC BY-NC-SA 4.0. To view a copy of this license, visit
https://creativecommons.org/licenses/by-nc-sa/4.0/

4 gedachten over “Elf redenen om verre te blijven van OpenAI en ChatGPT; En wat je wel zou willen.”

Geef een reactie