Documento PDF a texto (OCR) mediante OneNote 2010

Páginas: 2 (322 palabras) Publicado: 13 de octubre de 2014
Documento PDF a texto (OCR) mediante OneNote 2010
Lo más habitual es que el uso de OCR (Optical Character Recognition) sea algo muy puntual y esporádico, aunque en mi caso por motivosde trabajo es bastante habitual. Motores OCR gratuitos hay varios, Google sin ir más lejos tiene Tesseract, pero el resultado suele ser bastante decepcionante, al menos en documentos encastellano, y si quieres resultados buenos tienes que irte a los de pago. Hasta hace poco usaba la combinación Ghostscript para pasar el documento PDF a TIFF multipágina, y de ahi conMicrosoft Document Imaging para procesarlo mediante su OCR y pasarlo al Word, el resultado no era ninguna maravilla, pero es lo que había.
Eso hasta que me renovaron el PC y me pusieronOffice 2010, y descubrí que Microsoft Document Imaging había desaparecido, en las opciones de instalación el módulo OCR estaba instalado, pero ni idea de como usarlo. Después deinvestigar un poco descubrí cómo hacerlo, así que os lo pongo aquí por si a alguien le resulta de utilidad, porque no es muy evidente que digamos.
Lo primero que tenemos que hacer con nuestroOffice 2010 es instalar OneNote si no lo tenemos, ya que sin él no podremos hacer uso del motor OCR (o al menos de la forma en que nos interesa). Una vez instalado, nos colocará unaimpresora virtual en el sistema para pasar cualquier documento que imprimamos a OneNote, así que lo que tenemos que hacer es:
Abrir el PDF (o cualquier otro tipo de documento) con nuestroprograma habitual, e imprimirlo mediante la impresora virtual de One Note. Con esto ya tenemos el documento pasado sin perdida en OneNote.
Una vez en OneNote (se abre solo después deimprimir), pulsar con el botón derecho del ratón sobre la primera página y pulsar Copiar texto de todas las páginas de la copia impresa, esto realiza el proceso OCR y ya tenemos el texto
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Documento Pdf
  • que es un documento pdf
  • Elaboración De Documentos Mediante Un Procesador De Textos
  • Bitacorapagos 2010.pdf
  • Enlace 2010 pdf
  • Espejos 2010 Pdf
  • documento de texto
  • documento de texto

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS