Tesis

Solo disponible en BuenasTareas
  • Páginas : 32 (7857 palabras )
  • Descarga(s) : 14
  • Publicado : 19 de junio de 2010
Leer documento completo
Vista previa del texto
RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR) CON REDES NEURONALES ESTADO DEL ARTE OPTICAL CHARACTER RECOGNITION (OCR) WITH NEURAL NETWORKS STATE OF THE ART
Juan Pablo Ordóñez L.
Loja 086244139

jpordonez@utpl.edu.ec

RESUMEN
Los sistemas que, a partir de un texto escrito o impreso en papel o similar, crean un fichero de texto en un soporte de almacenamiento informático, se denominan Sistemasde OCR (Optical Character Recognition), o de Reconocimiento óptico de Caracteres. Un sistema OCR cuenta con las siguientes características: de poder "aprender", mediante una red neuronal, patrones de caracteres que representen las posibles variaciones (tamaño) de la forma de los diferentes caracteres impresos que pueden aparecer en los documentos, para en el futuro y con la misma red, poder"reconocerlos" y realizar la conversión del texto escrito en papel a texto almacenado en un fichero ASCII. PALABRAS CLAVE: Ocr, Redes neuronales, Reconocimiento de manuscritos.

conversion of written text on paper to text stored in an ASCII file. WORKS KEY: Ocr, network neuronal, Recognition of manuscripts.

HISTORIA DE OCR
En 1929, Gustav Tauschek obtuvo una patente sobre OCR en Alemania, luego,Handel en 1933 obtiene la patente de OCR en EEUU. En 1935, a Tauschek también se le concedió una patente en EEUU por su método. La máquina de Tauschek era un dispositivo mecánico que utilizaba plantillas. Un foto-detector era colocado de modo que cuando la plantilla y el carácter que se reconocería estuvieran alineados, una luz era dirigida hacia ellos. En 1950, David Shepard, criptoanalista en laagencia de seguridad de las fuerzas armadas de los Estados Unidos, fue consultado por Rowlett Franco para trabajar con el Dr. Louis Tordella, para recomendar los procedimientos de la automatización de los datos de la agencia. Esto incluía el problema de convertir mensajes impresos en lenguajes para almacenarlos en un computador. Shepard

ABSTRACT
Systems that, from a written or printed on paperor similar, creating a text file on a storage medium for computer systems are called OCR (Optical Character Recognition). An OCR system has the following characteristics: can "learn" through a neural network, patterns of characters representing the possible variations (size) as the different characters that can appear in documents, so in the future and with the same network, able to "recognize"and the

decide que es posible construir una máquina para realizar ese proceso, y, con la ayuda del cocinero de Harvey, un amigo, construyeron Gismo durante las tardes y fines de semana. Este suceso fue divulgado en los periódicos Washington Daily News y el New York Times en el año 1953, después de que su patente fuera concedida. En este momento, Shepard fundó Intelligent Machines ResearchCorporation (IMR), comenzando a fabricar el primero de varios sistemas del OCR usados para operaciones comerciales. Mientras que Gismo y los últimos sistemas de IMR, utilizaron análisis de imagen, en comparación con el carácter que emparejaba, pudiendo aceptar una cierta variación de la fuente. Gismo estaba limitado a los registros verticales, mientras que los reconocedores posteriores de la compañíaIMR, analizaban caracteres en cualquier parte del campo de exploración, una necesidad práctica en documentos del mundo real.

máquina. IBM y otras empresas fueron licenciadas más adelante sobre las patentes del OCR de Shepard. El servicio postal de Estados Unidos ha estado utilizando las máquinas de OCR para clasificar el correo desde que 1965, basados en la tecnología ideada sobre todo por elinventor prolífico Jacob Rabinow. El primer uso del OCR en Europa sucedió en la oficina de Gran Bretaña. En 1965 se comenzó a planear un sistema de actividades bancarias completo, Nacional Giro, usando la tecnología del OCR, ideó un proceso que revolucionó los sistemas del pago de cuentas en el Reino Unido. El correo postal de Canadá ha estado utilizando sistemas OCR desde 1971. Los sistemas OCR...
tracking img