Componentes

Por que o meu scanner produz arquivos PDF enormes?

OCR - Como converter imagem em texto editável

OCR - Como converter imagem em texto editável
Anonim

Você provavelmente está digitalizando para.pdf de uma forma que cria uma imagem de bitmap da página, em vez de text (eu faço isso com bastante frequência eu mesmo). Em outras palavras, o computador não reconhece as letras como letras, apenas como uma série de pontos. Essa não é uma maneira eficiente de gravar e armazenar texto digitalmente.

Uma solução é usar o software Optical Character Reader (OCR). Alguns provavelmente vieram junto com sua impressora. Esses programas examinam a página digitalizada e convertem a imagem em texto. Eles não são perfeitos, mas seus erros são raros e quase sempre pegos por corretores ortográficos. Por outro lado, uma verificação de OCR perde os gráficos e a formatação da página, fornecendo apenas o texto. Se isso é um problema ou não, depende do que você está digitalizando.

Se a digitalização OCR não for prática, tente digitalizar em uma resolução mais baixa e em preto e branco em vez de em cores. Isso diminuirá consideravelmente o tamanho do arquivo.

E se você simplesmente não conseguir obter o arquivo pequeno o suficiente, consulte A Melhor Maneira de Enviar Grandes Anexos por E-Mail.

Leia a discussão original no fórum em / /forums.pcworld.com/message/138427.

Envie suas perguntas de tecnologia para mim em [email protected] ou publique-as em uma comunidade de pessoas úteis no fórum da linha de respostas da PCW.