image

Zoekrobot Belastingdienst wereldwijd succes

donderdag 25 januari 2007, 16:06 door Redactie, 12 reacties

De zoekrobot die de Nederlandse belastingdienst in 2004 op het internet losliet is een wereldwijd succes. Het programma, met de codenaam "Xenon", wordt met hulp van de Amsterdamse datamijners Sentient Machine Research inmiddels door Oostenrijk, Denemarken, Engeland en Canada gebruikt voor het opsporen van belastingfraudeurs, en Zweden volgt dit jaar.

Xenon is in principe een webspider, net als de bots van Google en Yahoo, en downloadt websites en de websites die gelinkt worden. Op deze manier heeft men de beschikking over een gigantische database van materiaal en blijft de oorspronkelijke structuur intact. Het is niet bekend op wat voor manier Xenon heeft bijgedragen in het bestrijden van belastingfraude.

Om detectie te voorkomen worden interessante pagina's zeer langzaam geindexeerd, zodat ze niet in de serverlogs opvallen. Als wat voor user-agent Xenon zich voordoet wil Sentient niet onthullen, maar waarschijnlijk kan dit door de onderzoekende partij worden ingesteld. De Amerikaanse belastingdienst maakt geen gebruik van Xenon, en wilde ook niet bevestigen of ontkennen dat het webspiders voor haar onderzoek gebruikt. (Wired)

Met dank aan Pieter voor het melden van dit nieuws

Reacties (12)
25-01-2007, 16:20 door Anoniem
Goed om te weten.... even een nofollow in al mijn pagina's
opnemen.
25-01-2007, 16:45 door [Account Verwijderd]
[Verwijderd]
25-01-2007, 17:07 door Anoniem
Door Anoniem
Goed om te weten.... even een nofollow in al mijn pagina's
opnemen.
Natuurlijk, de belastingdienst laat zich geheel tegenhouden
door niet bindende restrictie configuraties die website
bouwers in hun pagina's inbouwen.
Wie niet wil dat die bots pagina's indexeren zal zich toch
echt moeten wenden tot restrictie configuraties voor de
webservers zodat die zelf geen paginas aan bots toe te spelen.
25-01-2007, 18:04 door G-Force
Het begon al tientallen jaren geleden. Telefoonboeken bij de
Belastingdienst waarin niet de namen van mensen alfabetisch en lexicografisch waren te vinden, maar telefoonnummers gesorteert op nummer. Wie dus een advertentie plaatste met alleen een telefoonnummer erop was zo in een mun van tijd door de Belastingdienst gevonden. Maar ontwikkelingen staan ook daar niet stil en is gecomplementeerd met een spider die zoekt op het internet.

Misschien dat de leuze van de Belastingdienst veranderd moet worden in: leuker kunnen we het niet maken, maar wel slimmer
25-01-2007, 18:56 door Anoniem
Om detectie te voorkomen worden interessante pagina's zeer
langzaam geindexeerd, zodat ze niet in de serverlogs opvallen. Als wat
voor user-agent Xenon zich voordoet wil Sentient niet onthullen, maar
waarschijnlijk kan dit door de onderzoekende partij worden ingesteld.

Dit mag (dacht ik) niet volgens de NL wetgeving.

Het is namelijk verboden (ook voor overheden tenzij er GERICHT en
INDIVIDUEEL onderzoek word gedaan) om je online ID te 'vervalsen' .
26-01-2007, 00:38 door Grudge
http://www.convera.com/solutions/government/Default.aspx
Ik ben bij Convera terecht gekomen na een onderzoek van diverse spiders die mijn Blog de afgelopen jaren hebben 'bezocht' .

http://www.convera.com/partners/profile/KnowledgeConcepts.aspx
http://www.knowledge-concepts.com/customers/customers.html

Blog log - 22>24 jan. 2007:
Eens kijken of er 'verborgen' pagina's zijn voor mobiele communicatie......

/mob/index.wml 2 -
/wap 2 -
/mobile/home.xhtml 2 -
/wap/default.xhtml 2 -
/wml/home.wml 2 -
/wap/home.xhtml 2 -
/xhtml/index.xhtml 2 -
/mob 2 -
/mobile/index.wml 2 -
/xhtml/home.xhtml 2 -
/mobile/default.xhtml 2 -
/wml/default.wml 2 -
/default.xhtml 2 -
/mob/index.xhtml 2 -
/mobile 2 -
/wap/index.wml 2 -
/index.xhtml 2 -
/wap/default.wml 2 -
/index.wml 2 -
/mob/home.xhtml 2 -
/xhtml/default.xhtml 2 -
/wml/index.wml 2 -
/home.xhtml 2 -
/mob/default.wml 2 -
/mobile/home.wml 2 -
/xhtml 2 -
/default.wml 2 -
/wap/home.wml 2 -
/home.wml 2 -
/mobile/default.wml 2 -
/wml 2 -
/mob/default.tjep 1 -
/mob/ 1 -
/xhtml/home.wml 1 -
/wap/index.tjep 1 -
/xhtml/index.wml 1 -
/wap/ 1 -
/wap/default.tjep 1 -
/mob/default.xhtml 1 -
/index.tjep 1 -
/mobile/index.tjep 1 -
/mob/index.tjep 1 -
/wml/index.tjep 1 -
/wml/home.xhtml 1 -
/mobile/ 1 -
/wml/ 1 -
/mobile/home.tjep 1 -
/wapbuddy/index.php 1 -
/mob/home.tjep 1 -
/xhtml/default.wml 1 -
/mobile/default.tjep 1 -
/default.tjep 1 -
/wap/home.tjep 1 -
/xhtml/ 1 -
/mobile/index.xhtml 1 -
/xhtml/home.tjep 1 -
/home.tjep 1 -
/mob/home.wml 1 -
/wml/default.xhtml 1 -
/wml/default.tjep 1 -
/wml/index.xhtml 1 -
/xhtml/index.tjep 1 -
/wap/index.xhtml 1 -
/wml/home.tjep 1 -
/xhtml/default.tjep 1 -

De koffie staat klaar.
26-01-2007, 10:40 door Zarco.nl
Door Anoniem
Om detectie te voorkomen worden interessante
pagina's zeer
langzaam geindexeerd, zodat ze niet in de serverlogs
opvallen. Als wat
voor user-agent Xenon zich voordoet wil Sentient niet
onthullen, maar
waarschijnlijk kan dit door de onderzoekende partij worden
ingesteld.

Dit mag (dacht ik) niet volgens de NL wetgeving.

Het is namelijk verboden (ook voor overheden tenzij er
GERICHT en
INDIVIDUEEL onderzoek word gedaan) om je online ID te
'vervalsen' .
User-agent geeft aan wat voor software je gebruikt, maar
staat niet gelijk aan identificatie. Dan zou het ook
verboden zijn op een logo van Ford op een Opel te plakken.
26-01-2007, 14:45 door Grudge
Ik vraag me wel af hoe controleerbaar het verzamelde
'bewijs' is.
26-01-2007, 15:25 door Anoniem
Door TT
Ik vraag me wel af hoe controleerbaar het verzamelde
'bewijs' is.

Dat is niet relevant. Voor de belastingdienst is een redelijk vermoeden
voldoende. Degene die de aanslag krijgt, moet zelf het tegendeel bewijzen.
28-01-2007, 03:00 door Grudge
Door Anoniem
Door TT
Ik vraag me wel af hoe controleerbaar het verzamelde
'bewijs' is.

Dat is niet relevant. Voor de belastingdienst is een
redelijk vermoeden
voldoende. Degene die de aanslag krijgt, moet zelf het
tegendeel bewijzen.

Niet helemaal, het klopt dat er een 'omgekeerde' bewijs-last
bestaat bij de BD maar die heeft dan (alleen) betrekking op
de aanslag/naheffing.
De regels 'veranderen' zodra er een strafrechtelijk
onderzoek en vervolging zal worden ingezet tegen een
mogelijke verdachte.
28-01-2007, 22:12 door Anoniem
Door TT
Ik vraag me wel af hoe controleerbaar het verzamelde
'bewijs' is.

het is dan ook geen bewijs lijkt mij, maar een hint om es
wat beter naar de geflagde bedrijven/mensen te gaan kijken.
15-05-2007, 20:49 door Anoniem
precies ,

als je veel bezittingen hebt en die van de hand doet op bijv
marktplaats , ben je niet een handelaar , maar gewoon een
prive persoon , betaalt de belasting dienst dan ook mee aan
je verlies ?
want als je de goederen nieuw gekocht hebt maak je gebruikt
altijd verlies
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.