Reconocimiento Optico De Caracteres

Páginas: 6 (1415 palabras) Publicado: 6 de octubre de 2011
Guía 1 IV Parcial Laboratorio
Reconocimiento óptico de caracteres
El Reconocimiento Óptico de Caracteres (OCR), así como el reconocimiento de texto, en general son aplicaciones dirigidas a la digitalización de textos. Identifican automáticamente símbolos o caracteres que pertenecen a un determinado alfabeto, a partir de una imagen para almacenarla en forma de datos con los que podremosinteractuar mediante un programa de edición de texto o similar.
En los últimos años la digitalización de la información (textos, imágenes, sonido, etc ) ha devenido un punto de interés para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar laintroducción de caracteres evitando la entrada por teclado, implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicios.
Problemas con el Reconocimiento Óptico de Caracteres
El proceso básico que se lleva a cabo en el Reconocimiento Óptico de Caracteres es convertir el texto que aparece enuna imagen en un archivo de texto que podrá ser editado y utilizado como tal por cualquier otro programa o aplicación que lo necesite.
Partiendo de una imagen perfecta, es decir, una imagen con sólo dos niveles de gris, el reconocimiento de estos caracteres se realizará básicamente comparándolos con unos patrones o plantillas que contienen todos los posibles caracteres. Ahora bien, las imágenesreales no son perfectas, por lo tanto el Reconocimiento Óptico de Caracteres se encuentra con varios problemas:
* El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la imagen original.
* La resolución de estos dispositivos puede introducir ruido en la imagen, afectando los píxeles que han de ser procesados.
* La distancia que separa a unoscaracteres de otros, al no ser siempre la misma, puede producir errores de reconocimiento.
* La conexión de dos o más caracteres por píxeles comunes también puede producir errores.
Esquema básico de un algoritmo de Reconocimiento Óptico de Caracteres
Todos los algoritmos de Reconocimiento Óptico de Caracteres tienen la finalidad de poder diferenciar un texto de una imagen cualquiera. Parahacerlo se basan en 4 etapas: Binarización, Fragmentación o segmentación de la imagen, Adelgazamiento de los componentes y Comparación con patrones.
] Binarización
La mayor parte de algoritmos de OCR parten como base de una imagen binaria (dos colores) por lo tanto es conveniente convertir una imagen de escala de grises, o una de color, en una imagen en blanco y negro, de tal forma que sepreserven las propiedades esenciales de la imagen. Una forma de hacerlo es mediante el histograma de la imagen donde se muestra el número de pixeles para cada nivel de grises que aparece a la imagen. Para binarizarla tenemos que escoger un umbral adecuado, a partir del cual todos los pixeles que no lo superen se convertirán en negro y el resto en blanco.
Mediante este proceso obtenemos una imagen enblanco y negro donde quedan claramente marcados los contornos de los caracteres y símbolos que contiene la imagen. A partir de aquí podemos aislar las partes de la imagen que contienen texto (mas transiciones entre blanco y negro).
Fragmentación o segmentación de la imagen
Este es el proceso más costoso y necesario para el posterior reconocimiento de caracteres. La segmentación de una imagenimplica la detección mediante procedimientos de etiquetado determinista o estocástico de los contornos o regiones de la imagen, basándose en la información de intensidad o información espacial.
Permite la descomposición de un texto en diferentes entidades lógicas, que han de ser suficientemente invariables, para ser independientes del escritor, y suficientemente significativas para su reconocimiento....
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • reconocimiento optico de caracteres
  • Reconocimiento De Caracteres
  • Reconocimiento de caracteres
  • Reconocimiento De Caracteres Y De Claves Dicot Micas
  • Reconocimiento optico
  • Orc – Software De Reconocimiento De Caracteres Para Calificar Pruebas
  • Reconocimiento optico
  • RECONOCIMIENTO DE CÉLULAS VEGETALES Y HUMANAS CON EL MICROSCOPIO ÓPTICO

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS