Como quizás han podido comprobar, agregué un sistema de filtrado de comentarios basura (aunque ya tenía uno, akismet). Me pareció interesante porque este sistema en particular cumple una doble función: por un lado evita la mayoría de los robots que reparten spam de comentarios y por otro lado cada humano que escribe el texto que aparece distorsionado en la imagen ayuda a un proyecto notable.

Las dos palabras (o fragmentos) que aparecen para efectuar el “test para diferenciar humanos de computadores de Turing completamente automatizado” (CAPTCHA por sus iniciales en inglés) son parte de un proyecto de OCR que lleva a cabo el School of Computer Science de la Carnegie Mellon University. Decidieron que sería interesante aprovechar los más de 60 millones de CAPTCHA’S que se solucionan cada día para acceder a distintos servicios de una manera útil, en este caso, ayudar a los computadores a identificar palabras de libros antiguos que están digitalizando. El par de palabras consiste en una ya conocida para el computador y otra que no logró reconocer. Cada vez que alguien entra el par de imágenes aporta con su grano de arena al proyecto. En este momento el trabajo conseguido ayuda al proyecto de Internet Archive.

Este tipo de iniciativas es una más de los esfuerzos de colaboración distribuída que han aparecido en los últimos años y que dan para varios post, que trataré d ir agregando de a poco (a pesar del tono más bien práctico/didáctico del blog).

Al parecer hoy uno de los (pocos) fieles lectores tuvo problemas con el sistema así que les agradecería que me comentaran su experiencia.

Saludos.

2 Responses to “reCAPTCHA”

Bacan… le van a enseñar a los computadores a leer el texto de verificación… para que alguien invente un virus maldito que llene de spam todo…

en todo caso me parece un proyecvto notable… y ciertamente los resultados serán muy útiles

Como te comentaba ayer, ya han inventado “robots” que se dedican a descifar CAPTCHAS y cuando estos son de mala calidad efectivamente son hackeables. Pero la prueba de que en general se necesita un humano es la siguiente: spammers profesionales y otro tipo de malandras han creado sitios porno que en vez de cobrarte por ver las fotos te piden que llenes un CAPTCHA que es robado de otro sitio -por ejemplo blogspot.com- y guardan la combinación imagen/traducción humana para automatizar el proceso de creación de cuentas o spam. Lo que significa que hasta ahora los computadores tienen muchos problemas para leer texto con anomalías. En particular en reCAPTCHA se dan el trabajo de distorsionar aleatoriamente cada imagen que te presentan, y de no usar dos veces la misma combinación de textos para evitar los ya mencionados bots, entre otra serie de detalles que pueden leer en su sitio

Something to say?