Plugins

Document Insights

Document Insights

Resumo

Plataforma de análise inteligente de documentos combinando OCR, classificação automática, extração estruturada de dados, detecção de riscos, comparação de versões, workflows de aprovação e checagens de compliance (LGPD, GDPR, SOC2, ISO). Processamento assíncrono em fila, conversor de formatos, parser de tabelas e formulários e integração automática com uploads do Pages. Edição inline de documentos (TipTap + x-spreadsheet + Reveal.js) está no roadmap.

Para quem é

  • Contabilidades e escritórios jurídicos que precisam classificar, extrair dados e detectar riscos em contratos, NFs e laudos.
  • Equipes de compliance que auditam documentos contra frameworks (LGPD, GDPR, SOC2, ISO).
  • RH e financeiro que recebem grande volume de documentos e precisam organizar por tipo e campos extraídos.
  • Times de produto e operações que usam workflows de aprovação com múltiplos revisores e histórico.

O que você pode fazer

OCR e Extração

  • OCR em PDFs, imagens (JPG/PNG) e documentos Word com pós-processamento que corrige artefatos.
  • Extração de campos estruturados: CPF, CNPJ, datas, valores, e-mails, telefones.
  • Parser de tabelas: extração estruturada de tabelas presentes no documento.
  • Parser de formulários: extração de campos rotulados em formulários.

Classificação Automática

  • Tipo do documento: contrato, nota fiscal, laudo, relatório, proposta, recibo.
  • Área: jurídico, financeiro, saúde, técnico, RH.
  • Templates de análise reutilizáveis e customizáveis por tenant.

Riscos e Qualidade

  • Score de qualidade (0-100): completude e legibilidade do documento.
  • Score de risco (0-100): baseado em cláusulas sensíveis, valores, prazos e compliance.
  • Lista detalhada de riscos com severidade, descrição e recomendação.
  • Notificações automáticas: analysiscompleted, riskdetected, reportready, queueerror.

Comparação e Versões

  • Comparação de documentos: diff entre duas versões com destaque de alterações.
  • Listagem de comparações feitas por período.

Compliance Frameworks

  • LGPD, GDPR, SOC2, ISO: frameworks pré-configurados.
  • Compliance checks: checagens automáticas por framework com resultado detalhado.
  • Histórico de checks por documento.

Workflows de Aprovação

  • Fluxo multi-step: aprovar, rejeitar ou solicitar revisão.
  • Comentários por etapa e histórico completo.
  • Pendentes por revisor: visão do que aguarda decisão.

Conversão e Processamento

  • Conversor de formatos: PDF ↔ Word ↔ Excel ↔ texto.
  • Fila assíncrona (docinsights_queue) para arquivos grandes, sem travar a interface.
  • Upload em lote e análise em lote.

Relatórios

  • Relatórios consolidados: lista, exportação, download.
  • Stats agregadas por tipo, área, risco e período.

Como começar

  1. Acesse Dashboard → Document Insights → Documents.
  2. Clique em Upload e envie um PDF, imagem ou Word (ou use Batch Upload).
  3. Aguarde o processamento na fila; notificação aparece ao concluir.
  4. Revise a classificação, os campos extraídos, o score de risco e o relatório.
  5. Se precisar de aprovação, envie para um Workflow.
  6. Rode Compliance checks contra frameworks aplicáveis ao seu negócio.

Tutoriais

Tutorial 1: Analisar um contrato e ver riscos

Objetivo: enviar um contrato em PDF e revisar riscos detectados. Passos:

  1. Documents → Upload → selecione o contrato.
  2. Aguarde o OCR e a classificação (evento analysis_completed).
  3. Abra o relatório: score de qualidade, score de risco, cláusulas destacadas.
  4. Revise a lista de riscos com severidade e recomendação.
  5. Exporte o relatório em PDF se precisar arquivar.

Tutorial 2: Comparar duas versões de um documento

Objetivo: ver o que mudou entre a v1 e a v2 de um contrato. Passos:

  1. Faça upload das duas versões.
  2. Vá em Compare → Nova Comparação.
  3. Selecione origem e destino.
  4. Visualize diff com adições, remoções e alterações destacadas.
  5. Salve ou exporte o relatório de comparação.

Tutorial 3: Rodar compliance check LGPD

Objetivo: verificar um documento contra a LGPD. Passos:

  1. Abra o documento e clique em Compliance → Nova Checagem.
  2. Selecione o framework LGPD.
  3. O sistema roda as verificações automáticas (PII exposto, base legal, retenção).
  4. Revise o resultado com itens aprovados, alertas e falhas.
  5. Use as recomendações para ajustar o documento.

Tutorial 4: Criar workflow de aprovação de contrato

Objetivo: enviar contrato para aprovação multi-step. Passos:

  1. Em Workflows → Novo Workflow, selecione o documento.
  2. Adicione revisores em sequência (ex.: Jurídico → Financeiro → Diretoria).
  3. Cada revisor pode Aprovar, Rejeitar ou Solicitar Revisão com comentário.
  4. Acompanhe status em Pending; o histórico fica completo em History.
  5. Ao aprovar, o documento vai para Relatórios.

Tutorial 5: Extrair tabelas de um relatório financeiro

Objetivo: transformar tabelas do PDF em dados estruturados. Passos:

  1. Documents → selecione o PDF → Extract Tables.
  2. O parser identifica as tabelas e gera saída estruturada.
  3. Exporte como CSV/JSON para uso em planilha ou integração.

Integrações com outros plugins

  • Pages: bridge pages.page.conversion envia uploads de formulários do Pages automaticamente para análise.
  • Files: documentos analisados ficam disponíveis em Files com tags (tipo, área, risco).
  • Creative-Studio Knowledge Base: PDFs analisados podem alimentar bases RAG.
  • Provider docinsights_metrics: métricas expostas no admin (total, analyzed, pending, high_risks, reports).
  • Notificações: analysiscompleted, riskdetected, reportready, queueerror.

Perguntas frequentes

1. Quais formatos são suportados? Até 11 formatos: PDF, JPG, PNG, TIFF, Word (.docx), Excel (.xlsx), texto, CSV e derivados.

2. Como funciona a fila de processamento? Arquivos grandes entram em docinsights_queue e são processados em background por cron dedicado. Você é notificado ao concluir.

3. Posso criar templates de análise customizados? Sim. Templates definem quais campos extrair e quais regras de risco aplicar, por tipo de documento.

4. Quais frameworks de compliance estão disponíveis? LGPD e GDPR nativos. SOC2 e ISO configuráveis via templates de checagem.

5. Como funcionam os workflows de aprovação? Sequência de revisores com opções Aprovar / Rejeitar / Solicitar Revisão. Cada etapa grava comentário e timestamp; o histórico fica preservado.

6. Posso comparar duas versões de um contrato? Sim. A aba Compare gera diff visual com adições, remoções e alterações destacadas.

7. O plugin faz análise automática de uploads do Pages? Sim. O listener pages.page.conversion captura o upload e envia para a fila automaticamente.

8. Posso editar documentos diretamente no plugin? No momento, o foco é análise e extração. O editor inline (TipTap para Word, x-spreadsheet para Excel, Reveal.js para apresentações) está no roadmap próximo.

9. Quais notificações recebo? analysiscompleted (análise concluída), riskdetected (risco alto), reportready (relatório disponível), queueerror (falha na fila).

Glossário

  • OCR: Optical Character Recognition, extração de texto de imagens/PDFs.
  • PII: Personally Identifiable Information, dados pessoais.
  • Framework de compliance: conjunto de regras (LGPD, GDPR, SOC2, ISO).
  • Diff: comparação de diferenças entre dois textos/documentos.
  • Workflow: fluxo de aprovação com múltiplos revisores.
  • Template de análise: configuração reutilizável de campos e regras.

Limitações e avisos

  • OCR depende da qualidade da imagem; documentos muito borrados podem reduzir precisão.
  • Frameworks de compliance são guias automáticos, não substituem parecer jurídico oficial.
  • Workflows não têm SLA automático (tempo máximo por etapa) — planejado para roadmap.
  • Edição inline de Word/Excel/Slides (TipTap + x-spreadsheet + Reveal.js) está no roadmap; hoje o plugin é focado em análise, extração e workflow.

Roadmap (edição de documentos)

  • Editor Word inline (TipTap) com WYSIWYG e comentários em linha.
  • Editor de planilhas inline (x-spreadsheet) para .xlsx.
  • Editor de apresentações (Reveal.js) para slides.
  • Colaboração em tempo real com multi-cursor.
  • Assinatura eletrônica nativa com workflow de signatários.
  • Versionamento estilo Git para documentos.

Relacionados

  • Pages — envio automático de uploads para análise.
  • Files — armazenamento pós-análise.
  • Creative-Studio — PDFs alimentam Knowledge Base RAG.
  • BillingPortal — cobranças pós-análise em fluxos contábeis.
  • Automation — gatilhos baseados em riskdetected e analysiscompleted.

Este artigo foi útil?

Perguntas e Respostas

Nenhuma pergunta ainda. Seja o primeiro a perguntar!

Tem uma dúvida sobre este artigo?

CAPTCHA