Por lo general, extraer tablas de PDF y exportarlas a Excel es una debilidad de las aplicaciones de reconocimiento de caracteres. Las más sencillas de esta categoría, únicamente se limitan a reconocer el texto en una imagen y convertirlo en texto editable, que usualmente queda desordenado. Extract Tables, permite capturar tablas y reconocer los binomios clave-valor a partir de imágenes escaneadas o archivos PDF. Todo gratis y online.

Si necesitas exportar los datos en formato JSON, puedes configurar reglas para que el documento exportado sea válido para trabajarlo con alguna API en particular. También, puedes exportar la tabla escaneada en formato XLSX, para editarla en algún procesador de hojas de cálculo. Otras dos opciones son en formato de texto plano (TXT) y una copia de la imagen original.
Aunque es de acceso gratuito, esta herramienta limita su oferta a 20 documentos por día.
Esta utilidad, liberada gratuitamente hace poco tiempo, llega como complemento para otras herramientas de similar categoría que también se ofrecen gratis, como una herramienta OCR web de alta precisión y un convertidor de PDF a Excel, con menor parafernalia que la función antes reseñada.
Sobre sus desarrolladores
Docsumo es una startup de Bombay, India, que desde hace dos años ofrece soluciones empresariales para la digitalización de tareas administrativas, implementando sistemas de automatización del procesamiento de documentos, para facilitar su gestión y análisis.
Como suelen funcionar las cosas bajo este modelo, originalmente las prestaciones de Docsumo se ofrecían como servicios de pago. Aunque aquello se mantiene, durante el último tiempo algunas herramientas fueron liberadas para su uso gratuito.
Sigue leyendo: Un escáner de documentos que permite extraer tablas y exportarlas a Excel