Literatur statt Nonsense
28. Mai 2007, 13:18 | 0 KommentareUS-Forscher wollen Internet-Nutzer unter dem Motto "Stop Spam. Read Books." mit Hilfe so genannter CAPTCHAs, die auf zahlreichen Websites zur Authentifizierung von Usern zum Einsatz kommen, zur Hilfe bei der Digitalisierung von Büchern bewegen.
CAPTCHAs [Completely Automated Public Turing test to tell Computers and Humans Apart], die auf der Verschleierung von Buchstaben in Bildern basieren, kommen auf zahlreichen Websites zum Einsatz, um Computer von Menschen zu unterscheiden.
Mit Hilfer der "Vollautomatisierten öffentlichen Turing-Tests", soll sichergestellt werden, dass nur Menschen bestimmte Dienste nutzen können und etwa Manipulationen und Spam von programmierten Bots bei Online-Umfragen, in Foren und beim Registrieren von E-Mail-Adressen ausgeschlossen werden.
"Stop Spam. Read Books."
Das Projekt reCAPTCHA an der Carnegie Mellon Universität in Pittsburgh [US-Bundesstaat Pennsylvania] will CAPTCHAs nun bei der Digitalisierung von Büchern zum Einsatz bringen, berichtete die "Washington Post".
Dabei setzen die Wissenschaftler unter dem Motto "Stop Spam. Read Books." auf die Mithilfe der Internet-Nutzer.
Rund 60 Millionen der Nonsense- Buchstabenkombinationen werden weltweit jeden Tag entziffert und eingetippt, schätzt Luis von Ahn, der Leiter des Forschungsteams, der vor sieben Jahren auch an der Entwicklung der CAPTCHAs mitgewirkt hat.
Mangelhafte Erfassung
Nach Meinung der Forscher kann diese Zeit auch sinnvoll genutzt werden. Zwar geht die Digitalisierung von Büchern heute weitgehend automatisiert vonstatten. Die dabei verwendeten Technologien stoßen jedoch vor allem bei älteren Büchern und Schriften auf Probleme.
Ausgebleichtes oder beschädigtes Papier kann etwa beim Einscannen mit OCR-Technologien [Optical Character Recognition] nur ungenügend erfasst und nicht entziffert werden. In diesen Fällen sei die manuelle Eingabe der Buchstaben der einzige Weg um die Bücher vollständig zu digitalisieren, sagte der Forscher.
Zusammenarbeit mit dem Internet Archive
Hier kommen die CAPTCHAs ins Spiel. Digitalisierte Files, die vom Computer nicht gelesen werden können, werden von Ahn vom Internet Archive zugeliefert, das derzeit rund 12.000 Bücher pro Monat digitalisiert.
Sie landen auf dem Server des Forschungsprojekts und werden in einzelne CATCHAs unterteilt, damit sie bei Authentifizierungsprozessen im Netz zum Einsatz kommen können.
Wie funktioniert es?
Jedes Wort, das von OCR-Technologien nicht entziffert werden kan, kommt gemeinsam mit einem anderen Wort, das bereits entziffert wurde, in Form eines CAPTCHAs zum Einsatz.
So kann der Authentifizierungsprozess über das CAPTCHA kann stattfinden, gleichzeitig liefert jeder Nutzer einen Entzifferungsvorschlag für das neue Wort.
"Vorbildliches Projekt"
Die Korrekturarbeiten der Internet-Nutzer tragen auch dazu bei, dass die digitalisierten Texte auch auf kleineren, mobilen Endgeräten gut gelesen werden können, meinte Brewster Kahle vom Internet Archive gegenüber der "Washington Post". ReCAPTCHA sei ein vorbildliches Projekt, dass die Resourcen tausender Internet-User nutze.
"Crowdsourcing"
Ähnlich wie reCAPTCHA versuchen auch zahlreiche andere Projekte, Initiativen und auch Unternehmen sich die Intelligenz und Kreativität der vernetzten Massen nutzbar zu machen.
Jeff Howe, vom US-Technologiemagazin "Wired", hatte im Zusammenhang damit im vergangenen Jahr den Begriff "Crowdsourcing" geprägt.
Der Neologismus setzt sich aus den Wörtern Crowd [Menschenmenge] und Outsourcing zusammen, und bezeichnet die Auslagerung von Aufgabenbereichen aus Unternehmen und Institutionen an interessierte Amateure und Spezialisten über das Internet.
Kurze URL:
Ähnliche News:
Die Literatur bringt uns die Erleuchtung und Corona ist doch geplant?
Fetlang: Neue Programmiersprache liest sich wie Bondage-Literatur
Mobilebooks - Literatur erobert das Handy
Fetlang: Neue Programmiersprache liest sich wie Bondage-Literatur
Mobilebooks - Literatur erobert das Handy
Weitere News:
22 Millionen Nutzer: Europol zerschlägt großes illegales Streamingnetzwerk
Leak: Rockstar-Programmierer deutet die PC-Version von GTA 6 an
Musk schimpft über Tarnkappenjäger F-35, will stattdessen billige Drohnen
"Stalker 2": Entwickler versprechen schnelle Behebung schwerer Bugs
Whistleblower beschreiben Umweltsünden in Gigafactory Texas
Nächste Nintendo-Konsole könnte schon im Jänner enthüllt werden
Russische Versorgungsmodul brachte "toxischen Geruch" auf die ISS
Superdünnes iPhone 17 wird ein Flop, sagt Apple-Experte Gurman
Neue Beschichtung macht Chinas Stealth-Fighter völlig "unsichtbar"
SAIC kündigt Feststoffakku mit 400 Wh/kg für E-Autos an
Leak: Rockstar-Programmierer deutet die PC-Version von GTA 6 an
Musk schimpft über Tarnkappenjäger F-35, will stattdessen billige Drohnen
"Stalker 2": Entwickler versprechen schnelle Behebung schwerer Bugs
Whistleblower beschreiben Umweltsünden in Gigafactory Texas
Nächste Nintendo-Konsole könnte schon im Jänner enthüllt werden
Russische Versorgungsmodul brachte "toxischen Geruch" auf die ISS
Superdünnes iPhone 17 wird ein Flop, sagt Apple-Experte Gurman
Neue Beschichtung macht Chinas Stealth-Fighter völlig "unsichtbar"
SAIC kündigt Feststoffakku mit 400 Wh/kg für E-Autos an
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(0)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar abgestimmt...
;-)
© by Ress Design Group, 2001 - 2024