image

Google koopt reCAPTCHA in strijd tegen spammers

donderdag 17 september 2009, 11:26 door Redactie, 5 reacties

Om spammers en bots op afstand te houden heeft Google reCAPTCHA overgenomen, waarmee het tevens oude boeken van de ondergang redt. Het "spamfilter" verscheen in 2007 en laat gebruikers ingescande woorden van oude boeken overtypen. De CAPTCHA wordt inmiddels op meer dan 100.000 websites gebruikt.

ReCAPTCHA werd ontwikkeld door een onderzoeksteam uit Pittsburgh dat zich bezighoudt met het digitaliseren van oude boeken en manuscripten. Het gebruikt Optical Character Recognition (OCR) software om de gescande afbeeldingen in tekst om te zetten. De OCR software kan echter één op de tien woorden vanwege de slechte kwaliteit van het document niet lezen.

De enige betrouwbare manier om ze te decoderen is een mens ze te laten lezen, een gigantische taak, omdat er maandelijks duizenden pagina's worden verwerkt. Om dit probleem op te lossen gebruikt men de woorden die de OCR software niet kan lezen als CAPTCHA's. "Daarom zijn we zo blij om reCAPTCHA binnen het Google team te verwelkomen", zegt Will Cathcart, Google product manager. "Het verbeteren van de beschikbaarheid en toegankelijkheid van alle informatie op het internet is echt belangrijk voor ons. Daarom kijken we ernaar uit om deze technologie met het reCAPTCHA team verder te ontwikkelen."

Reacties (5)
17-09-2009, 13:20 door Anoniem
Hopelijk verbeteren ze dan ook de bereikbaarheid.
Ik heb nu al twee een storing meegemaakt.
17-09-2009, 14:57 door Anoniem
Hoe kan je nou iets oplossen dat het systeem niet kan verifieren?
17-09-2009, 16:07 door Anoniem
Daarom geven ze ook altijd twee woorden die je moet overtypen. Van 1 weten ze het antwoord al, de andere nog niet.
17-09-2009, 16:17 door martijno
Door Anoniem: Hoe kan je nou iets oplossen dat het systeem niet kan verifieren?

Zie http://recaptcha.net/learnmore.html en lees "But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle?"
17-09-2009, 16:38 door Necrowizard
Ik vindt dat reCAPTCHA altijd wel grappig; als ik twee van die woorden krijg, probeer ik meestal te raden welk woord computer zelf geregeerd heeft, en welk de OCR niet kon lezen...

Dan type ik dat woord waarvan ik denk dat de OCR het niet kon lezen altijd expres fout, om te zien of ik het goed had :P (meestal wel trouwens)
Reageren

Deze posting is gelocked. Reageren is niet meer mogelijk.