Conversores PDF para Texto e PostScript
Colaboração: Rubens Queiroz de Almeida
Data de Publicação: 19 de Dezembro de 2000
Antes da mensagem de hoje, uma pequena nota. A Telefônica está fazendo uma campanha beneficiando as seguintes instituições: APAE-SP, AACD e Pastoral da Criança. Você não paga nada, é grátis. O número é 0800.802001.
Conversores PDF para Texto e PostScript
O software xpdf, distribuído com a maioria dos sistemas GNU/Linux do mercado, além de ser um visualizador de arquivos PDF, nos permite também a conversão do formato PDF para os formatos texto e postscript.
Os utilitários que realizam esta conversão chamam-se pdftotext e pdftops. A sintaxe é bastante simples. Basta invocar o programa fornecendo como parâmetro o arquivo sobre o qual se deseja trabalhar e será criado um outro arquivo com a extensão destino.
% pdftotext dict.pdf
O comando acima irá criar um arquivo chamado dict.txt.
Finalmente, gostaria também de citar o utilitário pdfimages, também integrante do pacote xpdf, que faz a extração dos arquivos de imagem de um determinado arquivo PDF. As imagens podem ser salvas no formato PPM (Portable Pixmap), PBM (Portable Bitmap), ou JPEG.