Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

RiCnhURiCo

PDFBox extração e manipulação

Recommended Posts

Olá Pessoal,

 

Estou com um problema e desde a umas 2 semanas atraz estou travado nisso :(

 

Bom, o problema é que preciso que no codigo abaixo a extração dos dados do arquivo PDF sejam enviados para um arquivo de texto já existente, ou seja (example.TXT). No caso o que consigo é somente a impressão desses dados em tela, e isso não serve para mim, alguem pode dar uma luz?

Segue o código:

package theocom.reader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.Arrays;

import org.apache.pdfbox.pdfparser.PDFParser;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class PDFExtraction {

		public static void main(String[] args) {
			try {
				String pdfFile = "conta.pdf";
				
				File filePDF = new File(pdfFile);
				FileInputStream fileInputStream = new FileInputStream(filePDF);

				PDDocument pdfDocument = null;
				try {
					PDFParser parser = new PDFParser(fileInputStream);
					parser.parse();
					pdfDocument = parser.getPDDocument();
					PDFTextStripper stripper = new PDFTextStripper();

					info("Arquivo PDF: ");
					info("");
					info(stripper.getText(pdfDocument));
				} finally {
					if (pdfDocument != null) {
						try {
							pdfDocument.close();
						} catch (IOException e) {}
					}
				}
			} catch (Exception e) {
				error(e.toString());
			}
		
		}
		
		/**
		 * Log Info.
		 * @param log
		 */
		public static void info(Object log) {
			Object[] ArrayList = new Object[] { log };
			System.out.println(Arrays.toString(ArrayList));		
		}

		/**
		 * Log Error.
		 * @param log
		 */
		public static void error(String log) {
			System.out.println("ERROR: " + log);
		}

	} 

OBS: o script está rodando legalzinho, e no caso pode ajudar bastante gente que necessite dessa solução...venho procurando uma LIB que faça esse tipo de coisa e a PDFBox é a melhor, pelo menos na minha opnião..

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.