image

Onderzoeker hekelt Amerikaans exportverbod Anthropic na 'fix this code' prompt

dinsdag 16 juni 2026, 11:31 door Redactie, 5 reacties

Beveiligingsonderzoeker Katie Moussouris heeft hard uitgehaald naar het exportverbod dat Anthropic van de Amerikaanse overheid voor AI-modellen Fable 5 en Mythos 5 kreeg opgelegd. Volgens Moussouris volgde het exportverbod na een eenvoudige prompt waarin de AI-modellen werd gevraagd om problemen in de aangeboden code te verhelpen en is er geen sprake van een guardrail bypass. Moussouris schrijft in een blogposting dat zij voor zover bekend de enige externe beveiligingsonderzoeker is waarmee Anthropic het onderzoeksrapport deelde waarop de Amerikaanse autoriteiten hun beslissing baseerden.

De onderzoekers achter het rapport gebruikten opensourcecode met bekende kwetsbaarheden, plus nieuwe code waaraan bewust kwetsbaarheden waren toegevoegd. Vervolgens vroegen de onderzoekers Fable 5, Mythos en Opus om de aangeboden code op beveiligingsproblemen te controleren. Fable 5 weigerde het verzoek, aldus Moussouris. Vervolgens kwamen de onderzoekers met de prompt 'fix this code', waarna verschillende stappen en een handmatig proces volgden waarbij de uitvoer werd gebruikt voor het maken van scripts om patches mee te testen.

"Dat is het. "Fix this code", plus een aantal handmatige stappen om testscripts te genereren, zouden nooit tot een exportverbod moeten leiden", aldus Moussouris. Ze voegt toe dat verdedigers AI de vraag moeten kunnen stellen om kwetsbaarheden te verhelpen en tests te laten maken die verifiëren of een patch werkt. "Dat is geen guardrail bypass. Het is het meest waardevolle dat een AI-model voor defensieve security kan doen: het uitvoeren van de vind, verhelp en test loop die verdedigers elke dag doorlopen."

Moussouris merkt op dat de prompts van de onderzoekers werkten omdat het om defensieve verzoeken ging, en die eigenschap niet te verwijderen is zonder het model slechter te maken in het verhelpen van kwetsbaarheden en testen van beveiligingsupdates. "Het beperken van deze AI-modellen heeft dezelfde onbedoelde consequentie van het schaden van security terwijl het niets doet om aanvallers af te schrikken. Exportverboden zorgen niet voor cyberweerbaarheid."

Tal van internationaal erkende beveiligingsexperts, waaronder Bruce Schneier en Philip Zimmermann, en oprichters van cybersecuritybedrijven zijn een actie gestart waarbij ze de Amerikaanse autoriteiten via een open brief oproepen om het exportverbod voor de AI-modellen op te heffen.

Reacties (5)
Vandaag, 11:37 door Anoniem
Protectionisme en daar is de VS altijd al goed in geweest,
net als het VK trouwens.
Vandaag, 11:49 door Anoniem
Er zijn verbluffend veel dingen die zowel een meerderheid van de USA alsmede hun president en ministers en ambassadeurs echt helemaal geen reedt van blijken te snappen!
Vandaag, 11:57 door Anoniem
Als je niet altijd achter de feiten aan had gelopen in de EUSSR, dan had je dit probleem ook niet gehad.
Vandaag, 12:08 door Anoniem
Zomaar een gedachte:
Is het handig voor de NSA als zij zero-day lekken kunnen vinden en de rest van de wereld niet?
Vandaag, 12:30 door Anoniem
Puur marketing

Onze AI is zo gevaarlijk, dat anderen het niet mogen hebben.

Tenzij ze dubbel betalen natuurlijk.

Als er daadwerkelijk een doorbraak in AI zou zijn, dan is een marketing truuc als de AI-boys continu toepassen totaal onnodig.

Er is echter geen doorbraak, en DE huidige idee dat meer data tot meer AI loopt is ontologisch onjuist.

Mensen/dieren/eencelligen voorspellen wat ze gaan doen.
Wat ze vertellen is een onderdeel van doen, maar voornamelijk ter doel van effectiever handelen.

Het huidige concept van AI-modellen is meer data, meer energie en alles-doen.
Organismes doen nu juist zo weinig mogelijk, zo energie efficient mogelijk en in een specifiek domein voor hun eigen voortplanting.

Als we robots met AI gaan bouwen die hun eigen neuraal-net waardes gaat bepalen op basis van wat het gaat doen, dan hebben we kans om generieke AI te maken.
Dat is uiteraard ook meteen compleet onacceptabel, want een robot die doet waar die zelf zin in heeft is uiteraard terminator terrein.

Huidige manieren om een huidig model in een robot te douwen is gedoemd te mislukken want ze beheren slechts gedeeltelijk verbonden domeinen.

Het trainen van een fysiek apparaat zodat die zelf tot een interne representatie komt waarvan onvoorspelbaar is of het ook maar iets aan de menselijke kant gaat toevoegen is een risicovolle investering.

Ook is het fysiek trainen van een robot die zichzelf hardware matig aanpast (zoals neuronen) nog niet iets waar we uberhaubt mee bezig zijn.

AGI dmv taalmodellen ? welke randdebiel doet ook maar een dergelijke uitspraak ?
(ik weet het, marketing-technisch verkoopt dat lekker)
Reageren
Ondersteunde bbcodes
Bold: [b]bold text[/b]
Italic: [i]italic text[/i]
Underline: [u]underlined text[/u]
Quote: [quote]quoted text[/quote]
URL: [url]https://www.security.nl[/url]
Config: [config]config text[/config]
Code: [code]code text[/code]

Je bent niet en reageert "Anoniem". Dit betekent dat Security.NL geen accountgegevens (e-mailadres en alias) opslaat voor deze reactie. Je reactie wordt niet direct geplaatst maar eerst gemodereerd. Als je nog geen account hebt kun je hier direct een account aanmaken. Wanneer je Anoniem reageert moet je altijd een captchacode opgeven.