Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Wellington09

Busca de apostila

Recommended Posts

Pessoal, estou desenvolvendo uma aplicação para busca de apostilas PDF e gostaria de saber se alguem conhece alguma classe PHP que faz a busca de texto dentro de arquivos PDF, ou algum tutorial na net.

 

Eu não estou achando no google tutoriais que me ajudem a fazer uma busca de texto dento do PDF, na verdade eu não quero pesquisar dentro de um PDF mas dentro de varios PDFs, só queria um NORTE, para saber como iria fazer esta busca sem utilizar base de dados, se é que é possivel, tenho de inicio 421 arquivos e vai aumentar cada vez mais.

 

Outra duvida que eu tenho é:

Se eu scanner uma apostila sera q é possivel converter ela para string em PDF ?

e no caso utilizo PHP ou algum software já existente no mercado ?

Compartilhar este post


Link para o post
Compartilhar em outros sites

Sobre buscar em PDF, nunca fiz, mas esta dúvida semelhante pode te dar um caminho.

 

Sobre transformar o PDF em texto, leia sobre OCR.

O Tesseract é um dos "melhores" dentre os gratuitos. Ele funciona muito bem para inglês. Mas pra português costuma falhar por causa das acentuações. Usei há muitos anos. Talvez hoje tenha evoluído bastante

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.