Document Insights
Document Insights
Resumo
Plataforma de análise inteligente de documentos combinando OCR, classificação automática, extração estruturada de dados, detecção de riscos, comparação de versões, workflows de aprovação e checagens de compliance (LGPD, GDPR, SOC2, ISO). Processamento assíncrono em fila, conversor de formatos, parser de tabelas e formulários e integração automática com uploads do Pages. Edição inline de documentos (TipTap + x-spreadsheet + Reveal.js) está no roadmap.
Para quem é
- Contabilidades e escritórios jurídicos que precisam classificar, extrair dados e detectar riscos em contratos, NFs e laudos.
- Equipes de compliance que auditam documentos contra frameworks (LGPD, GDPR, SOC2, ISO).
- RH e financeiro que recebem grande volume de documentos e precisam organizar por tipo e campos extraídos.
- Times de produto e operações que usam workflows de aprovação com múltiplos revisores e histórico.
O que você pode fazer
OCR e Extração
- OCR em PDFs, imagens (JPG/PNG) e documentos Word com pós-processamento que corrige artefatos.
- Extração de campos estruturados: CPF, CNPJ, datas, valores, e-mails, telefones.
- Parser de tabelas: extração estruturada de tabelas presentes no documento.
- Parser de formulários: extração de campos rotulados em formulários.
Classificação Automática
- Tipo do documento: contrato, nota fiscal, laudo, relatório, proposta, recibo.
- Área: jurídico, financeiro, saúde, técnico, RH.
- Templates de análise reutilizáveis e customizáveis por tenant.
Riscos e Qualidade
- Score de qualidade (0-100): completude e legibilidade do documento.
- Score de risco (0-100): baseado em cláusulas sensíveis, valores, prazos e compliance.
- Lista detalhada de riscos com severidade, descrição e recomendação.
- Notificações automáticas: analysiscompleted, riskdetected, reportready, queueerror.
Comparação e Versões
- Comparação de documentos: diff entre duas versões com destaque de alterações.
- Listagem de comparações feitas por período.
Compliance Frameworks
- LGPD, GDPR, SOC2, ISO: frameworks pré-configurados.
- Compliance checks: checagens automáticas por framework com resultado detalhado.
- Histórico de checks por documento.
Workflows de Aprovação
- Fluxo multi-step: aprovar, rejeitar ou solicitar revisão.
- Comentários por etapa e histórico completo.
- Pendentes por revisor: visão do que aguarda decisão.
Conversão e Processamento
- Conversor de formatos: PDF ↔ Word ↔ Excel ↔ texto.
- Fila assíncrona (
docinsights_queue) para arquivos grandes, sem travar a interface. - Upload em lote e análise em lote.
Relatórios
- Relatórios consolidados: lista, exportação, download.
- Stats agregadas por tipo, área, risco e período.
Como começar
- Acesse Dashboard → Document Insights → Documents.
- Clique em Upload e envie um PDF, imagem ou Word (ou use Batch Upload).
- Aguarde o processamento na fila; notificação aparece ao concluir.
- Revise a classificação, os campos extraídos, o score de risco e o relatório.
- Se precisar de aprovação, envie para um Workflow.
- Rode Compliance checks contra frameworks aplicáveis ao seu negócio.
Tutoriais
Tutorial 1: Analisar um contrato e ver riscos
Objetivo: enviar um contrato em PDF e revisar riscos detectados. Passos:
- Documents → Upload → selecione o contrato.
- Aguarde o OCR e a classificação (evento analysis_completed).
- Abra o relatório: score de qualidade, score de risco, cláusulas destacadas.
- Revise a lista de riscos com severidade e recomendação.
- Exporte o relatório em PDF se precisar arquivar.
Tutorial 2: Comparar duas versões de um documento
Objetivo: ver o que mudou entre a v1 e a v2 de um contrato. Passos:
- Faça upload das duas versões.
- Vá em Compare → Nova Comparação.
- Selecione origem e destino.
- Visualize diff com adições, remoções e alterações destacadas.
- Salve ou exporte o relatório de comparação.
Tutorial 3: Rodar compliance check LGPD
Objetivo: verificar um documento contra a LGPD. Passos:
- Abra o documento e clique em Compliance → Nova Checagem.
- Selecione o framework LGPD.
- O sistema roda as verificações automáticas (PII exposto, base legal, retenção).
- Revise o resultado com itens aprovados, alertas e falhas.
- Use as recomendações para ajustar o documento.
Tutorial 4: Criar workflow de aprovação de contrato
Objetivo: enviar contrato para aprovação multi-step. Passos:
- Em Workflows → Novo Workflow, selecione o documento.
- Adicione revisores em sequência (ex.: Jurídico → Financeiro → Diretoria).
- Cada revisor pode Aprovar, Rejeitar ou Solicitar Revisão com comentário.
- Acompanhe status em Pending; o histórico fica completo em History.
- Ao aprovar, o documento vai para Relatórios.
Tutorial 5: Extrair tabelas de um relatório financeiro
Objetivo: transformar tabelas do PDF em dados estruturados. Passos:
- Documents → selecione o PDF → Extract Tables.
- O parser identifica as tabelas e gera saída estruturada.
- Exporte como CSV/JSON para uso em planilha ou integração.
Integrações com outros plugins
- Pages: bridge
pages.page.conversionenvia uploads de formulários do Pages automaticamente para análise. - Files: documentos analisados ficam disponíveis em Files com tags (tipo, área, risco).
- Creative-Studio Knowledge Base: PDFs analisados podem alimentar bases RAG.
- Provider
docinsights_metrics: métricas expostas no admin (total, analyzed, pending, high_risks, reports). - Notificações: analysiscompleted, riskdetected, reportready, queueerror.
Perguntas frequentes
1. Quais formatos são suportados? Até 11 formatos: PDF, JPG, PNG, TIFF, Word (.docx), Excel (.xlsx), texto, CSV e derivados.
2. Como funciona a fila de processamento? Arquivos grandes entram em docinsights_queue e são processados em background por cron dedicado. Você é notificado ao concluir.
3. Posso criar templates de análise customizados? Sim. Templates definem quais campos extrair e quais regras de risco aplicar, por tipo de documento.
4. Quais frameworks de compliance estão disponíveis? LGPD e GDPR nativos. SOC2 e ISO configuráveis via templates de checagem.
5. Como funcionam os workflows de aprovação? Sequência de revisores com opções Aprovar / Rejeitar / Solicitar Revisão. Cada etapa grava comentário e timestamp; o histórico fica preservado.
6. Posso comparar duas versões de um contrato? Sim. A aba Compare gera diff visual com adições, remoções e alterações destacadas.
7. O plugin faz análise automática de uploads do Pages? Sim. O listener pages.page.conversion captura o upload e envia para a fila automaticamente.
8. Posso editar documentos diretamente no plugin? No momento, o foco é análise e extração. O editor inline (TipTap para Word, x-spreadsheet para Excel, Reveal.js para apresentações) está no roadmap próximo.
9. Quais notificações recebo? analysiscompleted (análise concluída), riskdetected (risco alto), reportready (relatório disponível), queueerror (falha na fila).
Glossário
- OCR: Optical Character Recognition, extração de texto de imagens/PDFs.
- PII: Personally Identifiable Information, dados pessoais.
- Framework de compliance: conjunto de regras (LGPD, GDPR, SOC2, ISO).
- Diff: comparação de diferenças entre dois textos/documentos.
- Workflow: fluxo de aprovação com múltiplos revisores.
- Template de análise: configuração reutilizável de campos e regras.
Limitações e avisos
- OCR depende da qualidade da imagem; documentos muito borrados podem reduzir precisão.
- Frameworks de compliance são guias automáticos, não substituem parecer jurídico oficial.
- Workflows não têm SLA automático (tempo máximo por etapa) — planejado para roadmap.
- Edição inline de Word/Excel/Slides (TipTap + x-spreadsheet + Reveal.js) está no roadmap; hoje o plugin é focado em análise, extração e workflow.
Roadmap (edição de documentos)
- Editor Word inline (TipTap) com WYSIWYG e comentários em linha.
- Editor de planilhas inline (x-spreadsheet) para .xlsx.
- Editor de apresentações (Reveal.js) para slides.
- Colaboração em tempo real com multi-cursor.
- Assinatura eletrônica nativa com workflow de signatários.
- Versionamento estilo Git para documentos.
Relacionados
- Pages — envio automático de uploads para análise.
- Files — armazenamento pós-análise.
- Creative-Studio — PDFs alimentam Knowledge Base RAG.
- BillingPortal — cobranças pós-análise em fluxos contábeis.
- Automation — gatilhos baseados em riskdetected e analysiscompleted.
Este artigo foi útil?
Perguntas e Respostas
Nenhuma pergunta ainda. Seja o primeiro a perguntar!