Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.
Olá a todos,
estou desenvolvendo um sistema, no qual preciso procurar informações em um arquivo pdf, que acreditem... cada arquivo é muito extenso.
Uma solução que pensei foi em transformá-lo em .doc e então realizar a busca, mas novamente não encontrei uma forma de fazer isto automaticamente.
Outra solução seria conseguir realizar a pesquisa diretamente no arquivo, mas neste caso simplesmente abrir o arquivo não funciona, pois a codificação de arquivo pdf faz com que leiamos binário o arquivo codificado e não texto.
Para arquivos de texto, uma busca pode ser feita assim:
function execute() {
//ARQUIVO A SER PESQUISADO
$arquivo = getcwd() . "/arquivo.pdf";
//ABRE O ARQUIVO
$arq = fopen($arquivo, "r");
//Lê o arquivo
$conteudo = fread($arq , filesize($arquivo) );
//FECHA O ARQUIVO
fclose($ponteiro);
$procurando = "Texto";
$busca = stripos($conteudo, $procurando);
if($busca === false)
{
return "Nenhuma ocorrencia encontrada";
}
else
{
return "Encontramos os resultados" ;
}
}
Procurei também referências as bibliotecas de manipulaçao de pdf existentes, tais como fpdf, mas nenhuma resolve meu problema.
Carregando comentários...