A Qualidade da Entrada Determina a Saida
A regra de ouro do OCR: a qualidade do resultado e diretamente proporcional a qualidade da imagem de entrada. Uma digitalizacao nitida e bem contrastada produz texto quase perfeito. Uma imagem borrada e escura gera erros em cascata.
Cada dica abaixo melhora a qualidade da entrada que o motor OCR recebe, resultando em reconhecimento mais preciso.
Dica 1: Resolucao da Digitalizacao
300 DPI — O Padrao
Para a maioria dos documentos com texto de tamanho normal (10-12pt), 300 DPI e suficiente e oferece excelente precisao com tamanho de arquivo razoavel.
600 DPI — Para Textos Pequenos
Documentos com letras miudas, notas de rodape ou tabelas detalhadas se beneficiam de 600 DPI. O arquivo sera maior, mas a precisao melhora.
Abaixo de 200 DPI — Evite
Digitalizacoes abaixo de 200 DPI resultam em caracteres borrados que o OCR tem grande dificuldade de reconhecer. Se possivel, redigitalize o documento.
Dica 2: Contraste e Iluminacao
- •Texto escuro em fundo claro e a combinacao ideal. Evite papel colorido escuro ou texto em cor clara.
- •Iluminacao uniforme ao digitalizar com celular. Sombras no documento prejudicam o reconhecimento.
- •Limpeza de Digitalizacao do OmnisPDF pode melhorar o contraste automaticamente se a digitalizacao ficou escura ou com sombras.
Dica 3: Alinhamento do Documento
Paginas tortas confundem o motor OCR. O texto deve estar o mais horizontal possivel. Se a digitalizacao ficou inclinada:
- ✓ Muitos scanners oferecem correcao automatica de alinhamento (deskew).
- ✓ Se digitalizou com celular, tente novamente mantendo o celular paralelo ao documento.
- ✓ Uma inclinacao de ate 5 graus geralmente e tolerada pelo OCR, mas acima disso a precisao cai rapidamente.
Dica 4: Selecao de Idioma
Sempre selecione o idioma correto do documento antes de executar o OCR. O motor usa dicionarios especificos de cada idioma para:
- ✓ Corrigir caracteres ambiguos com base no contexto linguistico.
- ✓ Reconhecer caracteres especiais (acentos, cedilhas, til no portugues).
- ✓ Sugerir palavras provaveis quando um caractere nao e 100% claro.
Dica 5: Prepare o Documento
Remova Grampos e Dobras
Grampos criam sombras e dobras distorcem o texto. Remova-os antes de digitalizar para uma imagem mais limpa.
Vidro do Scanner Limpo
Poeira e manchas no vidro do scanner aparecem como ruido na digitalizacao e podem ser confundidas com caracteres pelo OCR.
Documentos Antigos ou Desbotados
Use 600 DPI, digitalize em escala de cinza e aplique Limpeza de Digitalizacao para maximizar o contraste antes do OCR.
Checklist de Precisao OCR
- ☑ Resolucao de 300 DPI ou mais.
- ☑ Bom contraste entre texto e fundo.
- ☑ Documento alinhado (sem inclinacao).
- ☑ Idioma correto selecionado.
- ☑ Sem sombras, manchas ou dobras.
- ☑ Limpeza de digitalizacao aplicada (se necessario).