Sisope

Páginas: 17 (4185 palabras) Publicado: 17 de septiembre de 2010
Reconocimiento Óptico de Caracteres (OCR)
Carlos Javier Sánchez Fernández Ingeniería de telecomunicaciones
Universidad Carlos III Av. De la Universidad, 30 28911 Leganés (Madrid)

Víctor Sandonís Consuegra Ingeniería de telecomunicaciones
Universidad Carlos III Av. De la Universidad, 30 28911 Leganés (Madrid)

cjsanchez@tsc.uc3m.es

100047460@alumnos.uc3m.es

RESUMEN
En este artículose describen las técnicas más importantes para el reconocimiento óptico de caracteres. De cada una de las técnicas vistas se detallan sus fundamentos y se señalan sus características más importantes.

Para cada una de las cuatro etapas es posible aplicar multitud de técnicas ya existentes o desarrollar alguna específica en función de las condiciones en las que se presentan los datos de entrada,que en el caso de OCR se puede traducir por las imágenes de entrada. Uno de los pasos más difíciles es la extracción de las características, ya que es de gran dificultad elegir un conjunto óptimo de características. En general para que una característica sea buena debe tener: a) b) c) d) Discriminación: Deben ser características que diferencien suficientemente una clase de otra. Deben tener igualvalor para mismas clases. Independencia: Las características deben estar incorreladas unas de otras. Pequeño espacio para características: El número de características debe ser pequeño para la rapidez y facilidad de clasificación. características deben contar con otros como son que tengan un bajo gasto tanto en tiempo como en complejidad. Debido a es muy difícil conseguir unas característicasTérminos Generales
Algorithms, Documentation, Human Factors, Languages.

Palabras Clave
OCR, redes neuronales, árboles de decisión, algoritmo knn, Reconocimiento de Formas, Backpropagation.

1. INTRODUCCIÓN
Cuando se dispone de información en forma de documento impreso y se desea procesarla mediante un computador, existen dos opciones: una primera consistiría en introducirla a través delteclado, labor larga y tediosa. Otra posibilidad es automatizar esta operación por medio de un sistema de OCR compuesto de un software y hardware adecuado que reduciría considerablemente el tiempo de entrada de datos. La tecnología de reconocimiento de caracteres, OCR (Optical Character Recognition) engloba a un conjunto de técnicas basadas en estadísticas, en las formas de los caracteres,transformadas y en comparaciones, que complementándose entre sí, se emplean para distinguir de forma automática entre los diferentes caracteres alfanuméricos existentes. En realidad no se reconocen exactamente los caracteres de un determinado alfabeto, sino que es posible distinguir entre cualquier conjunto de formas o símbolos. Sin embargo, se debe tener en cuenta que la precisión que se obtiene en lapráctica al intentar distinguir entre un conjunto de símbolos no es del 100%. Por lo tanto, es fácil deducir que cuanto más numeroso es el conjunto de símbolos entre los que se debe decidir, mayor es la probabilidad de que se produzca un fallo de clasificación. En todo sistema de reconocimiento óptico de caracteres (OCR) se distinguen al menos estas 4 etapas: •Adecuación de la imagen (preproceso).•Selección de la zona de interés (segmentación). •Representación digital de la imagen (extracción de características). •Distinción del carácter contenido en la imagen (reconocimiento).

Además las requerimientos computacional, estos motivos óptimas.

A lo largo del documento se van a describir las distintas etapas en las que se puede dividir un sistema OCR y se analizarán tres técnicas en las que sebasan los sistemas de reconocimiento de caracteres: OCR basado en árboles binarios, OCR basado en redes neuronales y OCR basado en el algoritmo knn.

2. PREPROCESAMIENTO
Normalmente, las técnicas de OCR son útiles para digitalizar textos de algún libro (caracteres impresos) o formularios rellenados manualmente (caracteres manuscritos). Tanto en un caso como en el otro el desglose de los...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Sisope
  • SISOPE
  • sisop
  • SisOp
  • sisope

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS