Un escáner de documentos que te permite extraer tablas y exportarlas a Excel

Las herramientas para escanear documentos y extraer textos de ellos no son algo nuevo. La tecnología de reconocimiento óptico de caracteres (OCR) se puede encontrar en software para casi cualquier plataforma, incluidas las plataformas web.

Lo interesante de esto es cuando irrumpen en medio de las opciones que refrescan la propuesta con algo nuevo y asequible. Este es el caso de Docsumo.

Herramienta de escaneo de nivel empresarial disponible de forma gratuita

Docsumo es una startup de Bombay, India, que desde hace dos años ofrece soluciones comerciales para la digitalización de tareas administrativas, implementando sistemas de automatización de procesamiento de documentos para facilitar la gestión y el análisis.

Como suelen funcionar las cosas bajo este modelo, originalmente los servicios de Docsumo se ofrecían como servicios de pago. Aunque ciertamente se mantiene, durante el último tiempo algunas herramientas fueron liberadas para su uso gratuito.

Una de ellas es Extraer tablas, que le permite capturar tablas y reconocer binomios clave-valor a partir de imágenes escaneadas o archivos PDF. Para obtener resultados más precisos, puedes entrenar el algoritmo, aportando algunas muestras para guiarlo. Igualmente, tras escanear y antes de exportar, puede verificar manualmente los datos y corregirlos si es necesario.

Si necesita exportar los datos en formato JSON, puede configurar reglas para que el documento exportado sea válido para trabajar con una API en particular. Además, puede exportar la tabla escaneada en formato XLSX para editarla en un programa de hoja de cálculo. Otras dos opciones son en formato de texto plano (TXT) y una copia de la imagen original.

Aunque es de acceso gratuito, esta herramienta limita su oferta a 20 documentos por día.

Esta utilidad, liberada gratuitamente hace poco tiempo, viene como complemento a otras herramientas de similar categoría que también se ofrecen de forma gratuita, como una herramienta OCR web de alta precision y un convertidor de PDF a Excelcon menor parafernalia que la función antes reseñada.

Por lo general, las tablas son una debilidad de las aplicaciones de reconocimiento de caracteres. Las más sencillas de esta categoría, unión se limitan a reconocer el texto en una imagen y convertirlo en texto editable, que normalmente queda desordenado. Si bien otras aplicaciones logran esta misma tarea con éxito, incluida la versión móvil de Microsoft Excel, el valor agregado es la posibilidad de exportar datos de forma automatizada a través de su API, como se describe en la documentación de este servicio.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir
error: Content is protected !!