Navigation

Was ist reCAPTCHA und wie funktionierts

Christian Faller  24. Oktober 2012  3 Kommentare  3 Minuten zu lesen  Internet und Social Web, Technologie

Wahnsinn, manche Sachen macht man jeden Tag und begreift sie gar nicht. Gerade letzte Woche erst hatte ich bei reCAPTCHAS einen großen „Ahaaa-Moment“. Die meisten unserer Leser wissen vermutlich längst was es damit auf sich hat. Dieser Artikel ist für diejenigen, die es noch nicht wissen.

Was ist Captcha?

Captcha Codes kennen wir alle. Diese Sicherheitsabfragen, wenn man sich irgendwo für Accounts anmeldet oder z.B. bei Facebook eine Message an 30 Leute auf einmal senden will.

Das sieht dann so aus (hust):

Der Hintergrund ist hierbei, Mensch von Maschine zu unterscheiden. Psychologisch gruppieren Menschen Farben, Linien und Muster nämlich gemäß ihrer Lebenserfahrung und dem erworbenen Wissen manchmal nicht nach logischen Grundsätzen. Deswegen steigt die Maschine hier aus – zumindest bislang noch. Weil Computer aber bereits sehr nahe am Menschen dran sind, sind die Captcha Codes manchmal so schwer zu lesen, dass selbst wir es nicht mehr erkennen können.

Was ist reCAPTCHA?

reCAPTCHA ist ein ähnliches Prinzip, nur mit einem großen Nutzen für die Menschheit. Laut Google werden nämlich jeden Tag um die 200 Millionen Captachas gelöst. Das ist eine Menge Holz. Dabei entstehen ca. 150.000 menschliche Arbeitsstunden, die rein den Bach runter gehen. reCAPTCHAS nutzen diese Zeit, um etwas sinnvolles zu tun: Bücher zu digitalisieren.

Das geht so:

  1. Ein Buch aus der Pre-Digital-Ära wird eingescannt
  2. Mittels sogenannter „Optical Character Recognition“ (OCR) wird der Text erkannt und aus einem Bild in „echten“ Text verwandelt
  3. Das Problem ist, dass das alles ungenau ist, und oft Kauderwelsch oder fehlerhafte Worte herauskommen

    Quelle: google.com/recaptcha

  4. reCAPTCHAS nehmen jedes Wort, welches beim Scan nicht korrekt erkannt wurde und setzen es in einen reCAPTCHA Code ein
  5. User, die die Sicherheitsabfrage auf Websites machen, lesen dann das Wort und digitalisieren es damit unbewusst für die Allgemeinheit

Quelle: google.com/recaptcha

Aber was, wenn ein User ein Captcha-Wort falsch liest?

Deswegen gibt es immer zwei Worte. Für eines von beiden ist die Lösung bereits bekannt. Wenn ein User also dieses richtig erkennt, nimmt das Programm an, dass er auch das neue Wort korrekt erkannt hat. Um die Sicherheit zusätzlich zu erhöhen bekommen mehrere Personen ein Wort, bevor es abgesegnet ist. Derzeit werden mit dieser Methode tausende alter Bücher und Zeitungsausgaben digitalisiert. Google Books nutzt maßgeblich dieses System.

Was Ihr tun könnt

Wenn Ihr findet, dass das eine super Sache ist, dann nutzt reCAPTCHAS auf Euren eigenen Seiten. Hier könnt Ihr Informationen dazu finden: Get reCAPTCHA

Also, Captchas lösen statt RTL schauen!

Christian Faller

Christian Faller

Christian Faller ist Geschäftsführer bei deepr, einer Stuttgarter Werbeagentur und leitet den Digitalbereich bei Yaez. Wenn er nicht an digitalen Marketingstrategien feilt, verfolgt er sein Lebensziel, jedes Land der Welt zu bereisen. Er hat in Singapur, Frankreich, Amerika und Südafrika gelebt und gearbeitet.