Online Integriteit: De Betrouwbaarheid en Nauwkeurigheid van AI-Detectoren in 2024

Slechts een paar jaar geleden kwam kunstmatige intelligentie (AI) in de mainstream terecht en werd het bijna direct de volgende grote ontwikkeling in de technologiewereld. Allerlei zoekmachines, online bronnen en optimalisatietechnologieën hebben bestaande AI-producten geïmplementeerd of hun eigen producten ontwikkeld, waarbij gebruikers snel leerden om zelf van de technologie te profiteren.

Knowhow Redactie Playboy 09 dec. 2024 | 08:52

Online Integriteit: De Betrouwbaarheid en Nauwkeurigheid van AI-Detectoren in 2024

AI is snel verbeterd. Hoe zit het met AI-detectoren?

Bij de eerste release hadden grote AI-tools zoals ChatGPT nog steeds moeite met onhandige grammatica, verbale fouten en andere duidelijke tekenen van door machines gegenereerd schrijven. Gedurende die paar maanden was AI een nieuwigheid in plaats van een legitieme bron, maar het verhaal is snel veranderd sinds de eerste iteraties van ChatGPT en andere AI-tools. Zoals het er nu voorstaat, zijn door AI gegenereerde tekst, evenals afbeeldingen, video en audio, moeilijk te onderscheiden van menselijk schrijven als gevolg van zorgvuldige training. Hoewel AI in 2024 zeker veel van zijn doelen heeft bereikt, zijn AI-detectoren nog steeds nauwkeurig?

De noodzaak van AI-detectie in online ruimtes

De opkomst van door AI gegenereerde tekst ging gepaard met de AI-detector, die diende als hulpmiddel voor menselijke lezers die nu moeite hebben om het verschil te zien tussen de tekst die door een machine is gegenereerd en echte menselijke tekst. Of u nu een artikel, een bericht op sociale media of een advertentie leest, u kunt er niet zeker van zijn dat het in 2024 wel of niet door AI is gegenereerd. Er is behoefte aan AI-detectie, maar niet al deze responsieve hulpmiddelen zijn betrouwbaar gebleken bij het online ontdekken van door AI gegenereerde tekst. Hoe dan ook, de verspreiding van door AI gegenereerde tekst heeft de ontwikkeling van deze bronnen noodzakelijk gemaakt.

Bijna 57% van alle webgebaseerde tekst is door AI gegenereerd of vertaald via een AI-algoritme. In een paar jaar tijd heeft AI de mens al ingehaald in de productie van content, en het vertoont niet bepaald tekenen van vertraging. Totdat er een verandering wordt doorgevoerd, zal door AI gegenereerde content blijven opduiken in online ruimtes, wat in het beste geval verwarring veroorzaakt en in het slechtste geval desinformatie verspreidt.

Hoe werkt een AI-detector?

Hoewel geen enkele AI-detector 100% nauwkeurig zal zijn bij het identificeren van door AI gegenereerde tekst, komt dat doordat geen enkele AI-generator menselijke spraak perfect kan nabootsen. AI-detectoren werken met dezelfde LLM-technologie (Large Language Model) als AI-tekstgeneratoren, een methode die vergelijkbaar is met het bestrijden van vuur met vuur. AI-tekstgeneratoren worden getraind met behulp van bestaand menselijk schrift om menselijke spraak na te bootsen, terwijl AI-detectoren worden getraind op zowel menselijk schrift als tekst geproduceerd door AI, waarbij beide soorten tekst worden vergeleken om de verschillen te detecteren die mensen nu moeilijk kunnen identificeren.

Het identificeren van AI: Verwarring en barsten

Door dit proces hebben onderzoekers geleerd dat er twee primaire manieren zijn om onderscheid te maken tussen door AI gegenereerde tekst en menselijk schrijven die een AI-detector kan identificeren. Deze twee factoren zijn perplexiteit en barstigheid, die beide identificeren wat de mens onderscheidt van de machine in termen van tekst.

Verwarring

Verwarring verwijst naar de moeilijkheid om de woordkeuze in een bepaalde tekst te begrijpen, of hoe voorspelbaar het schrijven is. Wanneer een AI tekst genereert, selecteert het simpelweg het volgende meest waarschijnlijke woord in een zin om uiteindelijk een prompt te vervullen. Als gevolg hiervan neigt door AI gegenereerde tekst naar voorspelbare, logische woordkeuze, wat resulteert in verhoogde helderheid terwijl de betrokkenheid wordt opgeofferd. Menselijke schrijvers hebben daarentegen de neiging om woorden te selecteren die misschien niet zo logisch of voorspelbaar zijn, zelfs tot het punt dat hun schrijven verwarrend wordt.

Het verschil tussen door AI gegenereerde tekst en menselijk schrijven als het gaat om perplexiteit is dat AI tekst genereert die voorspelbaarder, repetitief en duidelijker is, terwijl mensen onvoorspelbaardere tekst schrijven die minder repetitief en duidelijk is. Een menselijke schrijver weet dat een balans tussen helderheid en betrokkenheid essentieel is voor plezierig schrijven, maar de twee vormen van tekst kunnen worden onderscheiden door een schaal van lage tot hoge perplexiteit.

Barsten

Burstiness werkt op een vergelijkbaar niveau als perplexity, maar houdt rekening met zinsstructuur en grammatica in plaats van woordkeuze. AI-gegenereerde tekst zoekt naar consistentie en produceert zinnen van vergelijkbare lengte met consistente grammaticale structuren. Als gevolg hiervan kan het lezen van AI-gegenereerde tekst monotoon aanvoelen, zelfs als ideeën duidelijk worden gecommuniceerd. Menselijke schrijvers variëren van nature de lengte van hun zinnen om betrokkenheid te creëren die dichter bij spraakpatronen ligt, terwijl ze grammaticale regels manipuleren om ze aan te passen aan hun schrijfstijl. Het verschil is er een van lage en hoge burstiness.

Nauwkeurig en betrouwbaar, niet onfeilbaar

Nu ze hun vermogen om perplexiteit en burstiness te onderscheiden hebben verfijnd, zijn AI-detectoren in 2024 verrassend nauwkeurig geworden. Geen enkele tool is onfeilbaar en met elke release van een nieuw AI-model moeten AI-detectoren hun eigen modellen opnieuw trainen terwijl AI-generatoren aan de slag gaan met het volgende. Bestaande training heeft echter geleid tot consistente verbeteringen van detectietools. Veel tools kunnen bogen op hoge percentagenauwkeurigheidsclassificaties, waardoor AI-detectietools dienen als een effectief startpunt voor het identificeren van door AI gegenereerde tekst.

Academische integriteit in de onderwijssector

Gebaseerd op verbeteringen in de technologie van de AI-detector, kunnen velen profiteren van een groter bewustzijn van geschreven content. De voordelen van een AI-detector gelden met name voor de onderwijssector, waar zowel docenten als studenten moeite hebben om door AI gegenereerde teksten te identificeren. Toen AI voor het eerst werd uitgebracht, hadden docenten het voordeel dat ze de schrijfstijl van hun studenten kenden, waarbij drastische verbeteringen een belangrijke reden waren voor onderzoek. Nu is dit bijna onmogelijk geworden.

AI-detectoren vormen een goed startpunt voor het behoud van academische integriteit, waarbij studenten zelfs AI-detectortechnologie kunnen gebruiken om hun legitieme werk te controleren op zeldzame vals-positieve resultaten. Een AI-detector is niet het allerbelangrijkste, maar het is wel een manier om vooruit te komen voor zowel professoren als studenten.

Het voordeel van het online identificeren van door AI gegenereerde tekst

Hoewel de onderwijssector opvalt, kan iedereen profiteren van de nauwkeurigheid van een AI-detector in 2024. Met zoveel online content die het product is van een AI-generator, vindt u het misschien waardevol om te weten waar uw informatie vandaan komt. Hoewel het een machine kan zijn, is de informatie die door een AI wordt verstrekt niet altijd nauwkeurig. Nu AI online ruimtes blijft domineren, kunt u overwegen om een AI-detector te gebruiken om door AI gegenereerde tekst te identificeren in welke omstandigheid u zich ook bevindt.

Knowhow

Refinery89