image

NFI ontwikkelt zoekmachine voor digitaal politieonderzoek

dinsdag 13 oktober 2015, 12:18 door Redactie, 6 reacties

Het Nederlands Forensisch Instituut (NFI) heeft een nieuwe forensische zoekmachine ontwikkeld zodat de politie sneller en efficiënter digitaal bewijsmateriaal kan doorzoeken. Vandaag zal Hansken, zoals de nieuwe zoekmachine wordt genoemd, landelijk bij de Nationale Politie worden uitgerold.

Volgens het NFI verdubbelt elke vijftien maanden het gemiddeld aantal digitale sporen dat onderzoekers in strafzaken aantreffen. Om deze groeiende hoeveelheden data snel en makkelijk doorzoekbaar te blijven maken is de afgelopen twee jaar Hansken ontwikkeld. Door de zoekmachine maakt het niet uit of rechercheurs een aantal laptops of een heel serverpark moeten doorspitten. Alle in beslag genomen gegevens worden in Hansken gekopieerd. Vervolgens identificeert de software zoveel mogelijk sporen.

Door zijn opbouw is Hansken net als een zoekmachine in staat een enorme hoeveelheid data te herkennen en doorzoekbaar te maken. Dat is nodig want de gemiddelde hoeveelheid data die bijvoorbeeld in kinderpornozaken wordt aangetroffen, is gelijk aan een file van vijf kilometer vrachtwagens, volgeladen met dubbelzijdig bedrukt papier. Rechercheurs kunnen de aangetroffen sporen vanachter hun eigen computer 24 uur per dag analyseren. Het is de bedoeling dat uiteindelijk alle tactisch en digitaal rechercheurs Hansken kunnen inzetten voor het doorzoeken van de verzamelde data.

Opvolger van Xiraf

Hansken is de opvolger van Xiraf; de softwaretool die in 2006 als researchproject begon en in 2010 aan de Nationale Politie werd geleverd. Xiraf was de eerste forensische softwaretoepassing die het verwerken van in beslag genomen data automatiseerde. Maar wat Xiraf in 24 uur kon, doet Hansken in 30 minuten. Met Xiraf werd het voor tactisch rechercheurs mogelijk om zelf de digitale sporen veilig te stellen.

Voorheen waren de digitaal rechercheurs belast met het zoeken naar bewijs, terwijl de tactisch rechercheurs met hun zaakkennis gerichter kunnen zoeken naar sporen die relevant zijn voor hun zaak. De digitaal rechercheurs kregen door Xiraf meer tijd om de bewijswaarde van een spoor vast te stellen en nieuwe onderzoeksmethoden te ontwikkelen.

Partners

De Nationale Politie is de eerste de partner in de veiligheidsketen die met Hansken gaat werken. De verwachting is dat ook andere partners volgen. Ook in buitenlandse zaken zal de forensische zoekmachine van het NFI ingezet kunnen worden. Volgens het NFI zouden inmiddels meerdere landen interesse in Hansken hebben getoond. De naam Hansken is afkomstig van een olifant die in de 17e eeuw in Nederland rondtoerde en in 1637 werd geschetst door Rembrandt van Rijn.

Reacties (6)
13-10-2015, 12:43 door Anoniem
Olifant ? Het zal dan wel op Hadoop gebaseerd zijn, Hadoop-Scan, en vervolgens in het Nederlands.
13-10-2015, 13:04 door Anoniem
Als men het heeft over vijf kilometer vrachtwagens aan dubbelgedrukte a4-tjes, hebben we het dan over de platte data die je probeert af te drukken van zelfs archieven, of de overgebleven data als je het indexeert op 'datatype'?

Ik geloof het eerste, en dat is alleen het directe gevolg van de huidige sleepnettechnieken... in plaats van Hansken te ontwikkelen had men beter dus de procedure voor bewijsvergaring an-sich onder de loep kunnen nemen... en dan heb je onderwijl de securityproblemen van bewijsmateriaal dat mogelijk uit kan lekken...
13-10-2015, 13:16 door Anoniem
Dat is nodig want de gemiddelde hoeveelheid data die bijvoorbeeld in kinderpornozaken wordt aangetroffen, is gelijk aan een file van vijf kilometer vrachtwagens, volgeladen met dubbelzijdig bedrukt papier.
Maak maar weer vergelijkingen die voor de gewone man onmogelijk groot klinken maar die eigenlijk niks voorstellen. Zo houd je het volk wel onder de duim!

Alle in beslag genomen gegevens worden in Hansken gekopieerd. Vervolgens identificeert de software zoveel mogelijk sporen.
En wat gebeurd er met deze gegevens wanneer iemand onschuldig blijkt, of erger: dat deze onterecht in beslag zijn genomen? Over 5 jaar krijgen we het volgende 'schandaal' dat deze gegevens nooit er uit worden gehaald uit gemakzucht of "omdat het toch waardevolle informatie bleek voor nieuwe strafzaken".

De verwachting is dat ook andere partners volgen.
*kuch* Belastingdienst *kuch*

Verder klinkt het gewoon als elk ander big data database, handig maar niet veel bijzonders.
13-10-2015, 13:33 door PietdeVries - Bijgewerkt: 13-10-2015, 13:39
Ik heb die 5 km even nagerekend...

Op een A4tje past ruwweg 7 kbyte. Dat is als je een jpg omzet in ascii en dan uitprint. Er gaan 500 vel in een pak, 2,5 kg per pak en 50 ton in een wagen van 20 meter. Dan kom je op ongeveer 7 kbyte x 500 x 20.000 = 70 GB per vrachtwagen. 50 vrachtwagens in een kilometer = 3,5 TB; 5 kilometer vrachtwagen is dan 17 TB aan informatie. Dat past ongeprint makkelijk in een rugzak.

Is die vergelijking met 5 km vrachtwagens vol papier relevant?!? Nee - natuurlijk niet! Welke idioot print er nou jpg's uit als platte tekst? Een beetje KP verzamelaar print per A4-tje een plaatje (voor zijn archief), zodat er 1000 plaatjes op een 500-pak A4 gaan. Daarvan passen er dus 20.000 in een vrachtwagen = 20 miljoen plaatjes. Dan heb je een aardige verzameling... 5 Kilometer van die vrachtwagens (250 stuks dus) levert je 5 miljard plaatjes. Kijk - en dan heb je het ergens over.
13-10-2015, 13:43 door Anoniem
@PietdeVries: Mooi rekenwerk :D


Rechercheurs kunnen de aangetroffen sporen vanachter hun eigen computer 24 uur per dag analyseren.

Doomscenario: Thuis met een PC die niet geupdated is, viri/trojans heeft, met WI-FI aan. Of een handige buurjongen (of criminelen) met Reaver, Metasploit en Wireshark die gezellig mee in loggen in het politie systeem.

Of ben ik nu een beetje te paranoide geworden??
13-10-2015, 14:00 door Anoniem
Door PietdeVries: Ik heb die 5 km even nagerekend...

Op een A4tje past ruwweg 7 kbyte. Dat is als je een jpg omzet in ascii en dan uitprint. Er gaan 500 vel in een pak, 2,5 kg per pak en 50 ton in een wagen van 20 meter. Dan kom je op ongeveer 7 kbyte x 500 x 20.000 = 70 GB per vrachtwagen. 50 vrachtwagens in een kilometer = 3,5 TB; 5 kilometer vrachtwagen is dan 17 TB aan informatie. Dat past ongeprint makkelijk in een rugzak.

Is die vergelijking met 5 km vrachtwagens vol papier relevant?!? Nee - natuurlijk niet! Welke idioot print er nou jpg's uit als platte tekst? Een beetje KP verzamelaar print per A4-tje een plaatje (voor zijn archief), zodat er 1000 plaatjes op een 500-pak A4 gaan. Daarvan passen er dus 20.000 in een vrachtwagen = 20 miljoen plaatjes. Dan heb je een aardige verzameling... 5 Kilometer van die vrachtwagens (250 stuks dus) levert je 5 miljard plaatjes. Kijk - en dan heb je het ergens over.

Enkelzijdig of dubbelzijdig? Ik hoop het laatste, dat scheelt weer bomen ...

Overigens vind ik het goed dat ze efficiënter kunnen werken. Scheelt weer tijd en (belasting)geld
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.