Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

joaogil

Busca em arquivo PDF

Recommended Posts

Eu achei no site phpclasses um script que dizia "Search PDF". Testei o script, mas ele não acha nenhuma palavra contina no conteúdo do PDF, so achou o nome do autor do arquivo. Fiz um debug no código para ver qual o resultado da leitura do PDF, e contatei o que já imaginava, ele não retorna o texto e sim uma codificação diferente, por isso não achava o texto buscado.

 

Eu não quero gerar um PDF, eu quero procurar no conteúdo de um PDF que já existe. Alguém tem mais alguma dica ?

Compartilhar este post


Link para o post
Compartilhar em outros sites

Galera, agora achei uma classe que leu o texto do PDF mesmo. Encontra-se neste link:

http://www.phpclasses.org/browse/file/31030.html

 

Pra chamá-la para ler o PDF:

 

include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('test.pdf');
$a->decodePDF();
echo $a->output();

Agora só falta adaptar uma busca por palavra-chave, e depois fazer com que procure em vários arquivos PDF dentro de um diretório.

Compartilhar este post


Link para o post
Compartilhar em outros sites

A busca simples eu já adaptei:

 

include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('MyDocument.pdf');
$a->decodePDF();
$conteudo = $a->output();

$palavra = "teste"; // string a ser procurada, viria de um form

if(stristr($conteudo, $palavra) === FALSE)
{
	echo "<strong>String NÃO encontrada:</strong> ".$palavra;
}
else
{
	echo "<strong>String encontrada:</strong> ".$palavra;
}

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.