Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.
Alguém sabe como fazer uma busca que precure no conteúdo de arquivos PDF ?
Eu achei no site phpclasses um script que dizia "Search PDF". Testei o script, mas ele não acha nenhuma palavra contina no conteúdo do PDF, so achou o nome do autor do arquivo. Fiz um debug no código para ver qual o resultado da leitura do PDF, e contatei o que já imaginava, ele não retorna o texto e sim uma codificação diferente, por isso não achava o texto buscado.
Eu não quero gerar um PDF, eu quero procurar no conteúdo de um PDF que já existe. Alguém tem mais alguma dica ?
Galera, agora achei uma classe que leu o texto do PDF mesmo. Encontra-se neste link:
http://www.phpclasses.org/browse/file/31030.html
Pra chamá-la para ler o PDF:
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('test.pdf');
$a->decodePDF();
echo $a->output();
Agora só falta adaptar uma busca por palavra-chave, e depois fazer com que procure em vários arquivos PDF dentro de um diretório.
A busca simples eu já adaptei:
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('MyDocument.pdf');
$a->decodePDF();
$conteudo = $a->output();
$palavra = "teste"; // string a ser procurada, viria de um form
if(stristr($conteudo, $palavra) === FALSE)
{
echo "<strong>String NÃO encontrada:</strong> ".$palavra;
} echo "<strong>String encontrada:</strong> ".$palavra;
}
nunca fiz isso mas o google me ajudou :P
http://cgoncalves.com/ler-pdf-e-documentos-word-com-php/
http://groups.google.com.br/group/listaphp/browse_thread/thread/e5ba80d1bd7812e2
e tem mais coisa aqui:
http://www.google.com.br/search?sourceid=chrome&ie=UTF-8&q=php+ler+pdf