reCAPTCHA evita el SPAM y ayuda a la digitalización de libros
Un CAPTCHA es un sistema que se implementa en las páginas web para identificar que la persona que rellena un formulario (por ejemplo, de registro en el sitio) no está usando un robot para hacer múltiples peticiones y abusar del servicio. Se trata por lo general de pedir al usuario que introduzca unos datos (una suma, los caracteres que aparecen distorsionados en una imagen, etc) que permitan discernir que es una persona real quién lo rellena, y no una máquina. Así se evita el spam, entre otras cosas.
![]()
Hay más información sobre el funcionamiento intero de reCAPTCHA en su artículo en Wikipedia.
Algunas de estas imágenes en las que aparecen caracteres distorsionados no son demasiado efectivas porque existen unos programas, llamados OCR, por las siglas de la frase en inglés «optical character recognition» («reconocimiento óptico de caracteres»), que permite romper estas protecciones. Pero: ¿qué pasaria si pusiésemos en las webs imágenes que de antemano sabemos que no pueden reconocer los OCR? Este tipo de programas, además de este uso malicioso, tienen otro: digitalizar libros. Un propósito perfectamente legítimo.
reCAPTCHA es un sistema que los webmasters pueden implementar en sus webs por medio del cual harán aparecer a sus usuarios un captcha en el que se verán dos palabras. Dos palabras que no se elegirán al azar, sino que procederán de libros que se han intentado digitalizar, pero que se han quedado a medias porque el OCR no ha sido 100% efectivo. Las palabras que se muestran en reCAPTCHA son precisamente esas que los OCR no han podido reconocer. A medida que los usuarios vayan introduciendo las palabras que aparecen para validar el CAPTCHA, estaran ayudando a terminar el proceso de digitalización de libros.
La idea es estar seguros de que los OCR de los usuarios malintencionados no será efectivo, a la vez que se aprovecha la molestia que supone al usuario tener que validar un CAPTCHA.

laura dijo
16 de September del 2008 a las 9:50
Estimados amigos, buenos días:
Les remito este email con motivo a pedir información sobre la prestación de sus servicios, estaba interesada en saber si teneís sede en otra ciudad, cuanto sería el coste por digitalización de libros, revistas y otros documentos y cual sería el procedimiento de gestión documental utilizado.
Muchas gracias. Un cordial saludo
Blumex dijo
17 de September del 2008 a las 20:35
laura: fíjate que no somos nosotros los que digitalizamos sino que nos limitamos a hacernos eco de la iniciativa reCAPTCHA. Espero que la aclaración te haya sido de utilidad. Un saludo.