Spybr 0 Denunciar post Postado Março 29, 2020 Tenho em um sistema com um acervo de documentos em PDF onde os usuários podem pesquisar pelo título dos documentos cadastrados. Gostaria de implementar um modo de busca avançada que pesquisasse dentro dos documentos pdf. Existe alguma biblioteca para fazer isso em PHP? Um alternativa que pensei para tornar a busca mais rápida seria extrair todo o texto dos arquivos PDF para uma tabela no banco de dados e usar as proprias funções de busca do banco de dados. Alguem ja implementou algo do tipo poderia dar alguma dica? Compartilhar este post Link para o post Compartilhar em outros sites
ExtremsX 58 Denunciar post Postado Abril 2, 2020 Não existe, leitura em arquivos sempre será lenta. Se voce precisar fazer, existem duas maneiras: 1. É converter o arquivo para TXT e pesquisar no texto (ex: https://www.pdfparser.org/) 2. É jogar o conteudo do PDF em uma DB usando DB proprias pra isso (ex: https://lucene.apache.org/) Referencia: https://en.wikipedia.org/wiki/Full-text_search Compartilhar este post Link para o post Compartilhar em outros sites
Spybr 0 Denunciar post Postado Abril 8, 2020 Em 02/04/2020 at 15:14, ExtremsX disse: Não existe, leitura em arquivos sempre será lenta. Se voce precisar fazer, existem duas maneiras: 1. É converter o arquivo para TXT e pesquisar no texto (ex: https://www.pdfparser.org/) 2. É jogar o conteudo do PDF em uma DB usando DB proprias pra isso (ex: https://lucene.apache.org/) Referencia: https://en.wikipedia.org/wiki/Full-text_search Obrigado irei verificar. Compartilhar este post Link para o post Compartilhar em outros sites