Captchas werden auf vielen Webseiten eingesetzt, um Spammer daran zu hindern automatisiert Einträge zu hinterlassen. Dazu wird dem Besucher eine Aufgabe gestellt, die von den Programmen die diese Einträge eintragen, nicht gelöst werden können. Dies können z.B. verzerrte Buchstaben, Wörter oder auch einfache Rechenaufgaben sein.
Findige Wissenschaftler hatten nun die Idee, die Zeit die ein Besucher für das Lösen des Captchas verwendet sinnvoll einzusetzen. Dazu werden digitale Texte aus eingescannten Büchern eingeblendet, bei denen die automatische Texterkennung versagt hat. Um sicherzustellen, dass der Mensch das Wort richtig erkannt hat, wird ein zweites, bereits bekanntes Wort, nebenangestellt. Wenn der Besucher das bekannte Wort erkannt hat, wird davon ausgegangen, dass auch das andere richtig ist. Außerdem werden die Wörter mehreren Benutzern vorgelegt um Fehler bei der Erkennung auszuschliessen.
Durch das Lösen dieser Captchas werden die Bücher des “Internet Archive” digitalisiert, die im Rahmen der Open Contant Alliance große Buchbestände digitalisiert um sie online durchsuchbar zu machen.
Für die Einbindung in die eigene Homepage wurde ein entsprechender Webdienst eingereichtet. Für die Einbindung in Wordpress gibt es ein Plugin, welches vom phpblogger ins deutsche übersetzt wurde.
[via golem.de]
Teile und genieße
Diese Icons verzweigen auf soziale Netzwerke bei denen Nutzer neue Inhalte finden und mit anderen teilen können.