reconocimiento optico de caracteres
Reconocimiento óptico de caracteres , generalmente abreviado a OCR , es la mecánica o electrónica de conversión de escaneadas las imágenes de texto escrito a mano, a máquina o impresa entexto a máquina codificada. Es ampliamente utilizado como una forma de entrada de datos de algún tipo de fuente de datos original en papel, ya sea documentos, recibos de venta, correo, o cualquier númerode registros impresos. Se trata de un método común de digitalizar los textos impresos para que puedan ser registrados electrónicamente, almacenados de forma más compacta, aparecen en línea, y seutilizan en los procesos de la máquina, tales como la traducción automática , texto a voz y text mining . OCR es un campo de investigación en el reconocimiento de patrones , la inteligenciaartificial y visión por computador .
Las primeras versiones necesitaban ser programado con imágenes de cada carácter, y trabajaron en una fuente a la vez. Sistemas "inteligentes" con un alto grado de precisión en elreconocimiento de la mayoría de las fuentes son ahora comunes. Algunos sistemas son capaces de reproducir el formato de salida que se aproxima mucho a la página original escaneado incluyendo imágenes,columnas y otros componentes no textuales.
El reconocimiento de caracteres
y dos tipos básicos dealgoritmo principal OCR, lo que puede producir una lista ordenada de caracteres candidatos.
Matriz de coincidencia implica comparar una imagen a un glifo almacenada en una base de píxel porpíxel, sino que también se conoce como "coincidencia de patrones" o "reconocimiento de patrones". Esto se basa en el glifo de entrada está correctamente aislado del resto de los la imagen, y en el glifo deser almacenada en una fuente similar y en la misma escala.
Esta técnica funciona mejor con el texto escrito a máquina y no funciona bien cuando se encuentran nuevas fuentes. Esta es la técnica...
Regístrate para leer el documento completo.