image

Anonieme programmeurs aan programmacode te herkennen

zondag 1 maart 2015, 15:30 door Redactie, 5 reacties

Wetenschappers hebben een manier ontwikkeld waarmee het mogelijk is om anonieme programmeurs aan de hand van hun programmacode te identificeren, waarmee bijvoorbeeld cybercriminelen kunnen worden bestreden. De onderzoekers kijken hiervoor naar karakteristieke eigenschappen in de code.

"Net zoals schrijvers en artiesten heeft elke programmeur een eigen unieke stijl", zegt Aylin Caliskan-Islam, een promovendus aan de Universiteit van Drexel. Ze ontwikkelde het systeem en schreef er een technisch rapport over. "Ons proces verzamelt de belangrijkste karakteristieken van iemands programmeerstijl, wat de eerste stap is in het identificeren van anonieme auteurs, het vinden van cybercriminelen en het afwikkelen van vragen over intellectueel eigendom."

Caliskan-Islam stelt dat er al goede tools zijn die natuurlijke taal kunnen verwerken om anonieme auteurs aan hun schrijfstijl te identificeren. Aan de hand daarvan vroeg ze zich af of het mogelijk was een soortgelijk systeem voor programmeurs te ontwikkelen. De sleutel volgens de onderzoekster is het onderzoeken van meerdere facetten van de code, waar deze eigenschappen bij elkaar komen en een uniek patroon vormen dat alleen in de code van een specifieke programmeur wordt aangetroffen.

Onderzoek

Voor haar onderzoek verzamelde Caliskan-Islam het werk van programmeurs die de afgelopen 6 jaar aan de "Google Code Jam-wedstrijden" meededen. Dit leverde uiteindelijk 20.000 verschillende programmeerkenmerken op. Het programma van de onderzoekster wist dit tot 137 kenmerken te beperken, die vervolgens konden worden gebruikt voor het maken van digitale vingerafdrukken van de programmeurs. Uiteindelijk werd deze verzameling afgezet tegen verschillende oplossingen die de programmeurs voor de Google-wedstrijden hadden geprogrammeerd.

Aan de hand hiervan wisten de onderzoekers de pogrammeurs met een 95% nauwkeurigheid aan hun programmeerstijl te identificeren. Volgens Caliskan-Islam kan haar oplossing helpen bij het vinden van cybercriminelen of forensisch onderzoek, maar ook het beslechten van discussies over wie de oorspronkelijke auteur van een stuk software is. De onderzoekers zijn nu bezig om de analysesoftware verder uit te breiden, zodat die straks code in elke programmeertaal kan herkennen.

Reacties (5)
01-03-2015, 15:52 door Eric-Jan H te D
Niet gek in een wereld die bepaald wordt door een formele taal, methodes en voorgeschreven bedrijfsstandaarden. Maar daar hebben hackers natuurlijk minder last van dan professionele programmeurs. Het ongeëvenaarde copy-catgedrag in het hackerswereldje is natuurlijk wel een extra complicerende factor.
01-03-2015, 16:15 door mcb
En hoe gaat dat dan met code-snippets die iedereen van elkaar kopieert?
Voor kleinere scripts (van bijv. minder dan 100 regels) gaat het denk ik niet werken.
01-03-2015, 16:51 door golem - Bijgewerkt: 01-03-2015, 16:51
Is dit nieuws ?
Ik denk dat ik vrijwel dezelfde berichten minimaal al 5 keer heb gezien de afgelopen jaren.
01-03-2015, 18:00 door Anoniem
Dat is oud nieuws.
01-03-2015, 18:17 door Anoniem
Het is net als met het "God Particle". Joost mag het weten, maar als 30 Nerds zeggen dat je het gevonden hebt dan is het zo. En dat mag ook wat kosten. Niemand vraagt naar een bewijs waar ook iemand wat aan heeft. COOOL...
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.