Reconocimiento óptico de caracteres
De Wikipedia, la enciclopedia libre
El software de reconocimiento óptico de caracteres, abreviado habitualmente como OCR (Optical character recognition), extrae de una imagen los caracteres que componen un texto para almacenarlos en un formato con el cual puedan interactuar programas de edición de texto.
Mientras que en una imagen los caracteres se describen indicando cada uno de los puntos que los forman, al convertirlos a un formato de texto (por ejemplo ASCII o Unicode), pasan a estar descritos por un solo número, por lo que se produce una reducción significativa del espacio en memoria que ocupan.
A partir de ahí el texto es reconocido como texto, de modo que se pueden buscar en él cadenas de caracteres, exportar el texto a un editor de textos, o a otras aplicaciones, etc.
Actualmente, junto con el texto, se registra también el formato con el que ha sido escrito.
Una variante es el OMR (optical mark recognition) que se utiliza para reconocimiento de marcas. Un ejemplo sería la corrección automática de exámenes de tipo test, en los que la respuesta correcta se rodea con un círculo.
Tabla de contenidos |
[editar] Véase también
- Gestures del Mozilla
- Reconocimiento de escritura
- Reconocimiento de imágenes
- Reconocimiento de voz
- Reconocimiento de matrículas
- Sintetizador de voz
- Trazador de imágenes para convertir de imagen a gráfico vectorial
[editar] Programas OCR Libres
- Kooka
- GOCR
- ocrad
- ocre
[editar] Programas commerciales
http://www.abbyy.com (programas SDK, leer formularios, documentos semi-estructurados y mas)