Captcha hilft beim Digitalisieren von Büchern: reCaptcha

Captchas werden auf vielen Webseiten eingesetzt, um Spammer daran zu hindern automatisiert Einträge zu hinterlassen. Dazu wird dem Besucher eine Aufgabe gestellt, die von den Programmen die diese Einträge eintragen, nicht gelöst werden können. Dies können z.B. verzerrte Buchstaben, Wörter oder auch einfache Rechenaufgaben sein.

Findige Wissenschaftler hatten nun die Idee, die Zeit die ein Besucher für das Lösen des Captchas verwendet sinnvoll einzusetzen. Dazu werden digitale Texte aus eingescannten Büchern eingeblendet, bei denen die automatische Texterkennung versagt hat. Um sicherzustellen, dass der Mensch das Wort richtig erkannt hat, wird ein zweites, bereits bekanntes Wort, nebenangestellt. Wenn der Besucher das bekannte Wort erkannt hat, wird davon ausgegangen, dass auch das andere richtig ist. Außerdem werden die Wörter mehreren Benutzern vorgelegt um Fehler bei der Erkennung auszuschliessen.

Durch das Lösen dieser Captchas werden die Bücher des “Internet Archive” digitalisiert, die im Rahmen der Open Contant Alliance große Buchbestände digitalisiert um sie online durchsuchbar zu machen.

Für die Einbindung in die eigene Homepage wurde ein entsprechender Webdienst eingereichtet. Für die Einbindung in Wordpress gibt es ein Plugin, welches vom phpblogger ins deutsche übersetzt wurde.
[via golem.de]


Teile und genieße
Diese Icons verzweigen auf soziale Netzwerke bei denen Nutzer neue Inhalte finden und mit anderen teilen können.

  • Digg
  • del.icio.us
  • Technorati
  • MisterWong
  • Netscape
  • blogmarks
  • Ma.gnolia
  • Reddit
  • StumbleUpon
  • YahooMyWeb

3 Kommentare zu “Captcha hilft beim Digitalisieren von Büchern: reCaptcha”

  1. Bastian

    Danke für die Info. Sehr interessant.
    Bastian

  2. Andy

    reCAPTCHAs hilft uns zwar Bücher zu digitalisieren, jedoch bieten sie NICHT viel MEHR Sicherheit als normale CAPTCHAS. Also eine bessere Spamschutz-Methode ist reCAPTCHA nicht.
    ODer sehe ich das falsch?

    Jedenfalls lassen diese reCaptchas genauso wie Captchas sowohl von Maschinen als auch von Menschen umgehen…

    MFG
    Andy

  3. Sascha

    Ich denke Du siehst das vollkommen richtig. reCaptcha bietet nicht mehr oder weniger Sicherheit als andere Captcha Systeme.
    Der positive Aspekt an reCaptcha ist, dass die menschliche Energie die in das Lösen der Aufgaben gesteckt wird nicht ungenutzt verpufft, sondern Nutzbar gemacht wird.

    Grüße
    Sascha

Einen Kommentar schreiben: