Grande parte das organizações possuem um longo pipeline de processos administrativos que demandam mão de obra e tomam tempo. O Form Recognizer do Azure pode extrair automaticamente texto, pares chave-valor e tabelas de documentos digitalizados sem a necessidade de configurações extensivas, para obter rapidamente resultados precisos, com uma fração do custo.
O serviço supera os desafios comuns de softwares OCR (reconhecimento óptico de caracteres), usando aprendizado de máquina para “ler” automaticamente os documentos. A maneira mais simples de começar é usando API de layout do serviço, que extrai as estruturas de texto, tabelas e seus valores, além de fornecer a posição de cada informação encontrada por meio de coordenadas.
Ele também oferece a capacidade de treinar modelos personalizados, para que você possa ajustar o serviço especificamente para seus documentos, usando aprendizado supervisionado ou não supervisionado, além de possuir um modelo de recibos pré-construído, criado utilizando recibos de vendas feitas nos EUA.
Com o modelo de recibos pré-construído, pode-se enviar uma foto de um recibo amassado:
O serviço retorna os dados contidos no documento, no formato JSON, automaticamente, e com isso as informações podem ser processadas.
Merchant | Contoso |
Address | 123 Main Street Redmond, WA 98052 |
Phone number | +9876543210 |
Date | 2019-06-10 |
Time | 13:59:00 |
Subtotal | 1098.99 |
Tax | 104.4 |
Total | 1203.39 |
Ao personalizar o modelo, os relacionamentos entre as informações contidas no formulário podem ser criados e extraídos automaticamente pelo serviço.
Atualmente em preview, ele suporta apenas o idioma inglês e possui uma excelente e extensa documentação no site oficial da Microsoft.
O Form Recognizer pode ser acessado via API REST ou por meio de SDKs desenvolvidos em .NET, Java, Python e Javascript para executar a extração de informações e a personalização do modelo. [tweet]Para organizações que lidam com processos administrativos manualmente, buscam a melhoria da eficiência e a redução de custos, o Form Recognizer pode ajudar a atingir esses objetivos[/tweet].