Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.
Bom dia a todos!
Estou desenvolvendo uma solução onde a partir do upload de um relatório PDF eu possa fazer comparativo com dados no banco de dados.
Sendo para para isso preciso de uma API ou outra funcionalidade que eu possa ler os dados na tabela do relatório coluna por coluna.
Achei algumas APIs pagas mas tive problemas na adaptação. Cheguei até a ter a ideia de converter o PDF para HTML e usar o simple_dom_html mas também tive dificuldades de achar algo mais automatizado.
Poderiam me dar uma luz, por favor?
Uma alternativa para que o projeto seja viável é converter o arquivo PDF em HTML neste site: http://www.pdfonline.com/easyconverter/sdk/pdf-to-html/index.htm , e usar Jquery para coletar os dados dentro das classes.
Mas fazer isso diretamente do PDF seria ótimo.
Eu comecei a incluir uma função parecida no sistema aqui da empresa, pra ler uns arquivos gerados pelo ECAC, porem não cheguei muito longe pois tinha outras coisas mais urgentes, mas acredito ser bem possível sim, eu estava tentando com essa classe:
neste caso você vai ter uma série de problemas, PDF não usam estrutura tabelada (sem estrutura), isso você pode até analisar quando você tenta selecionar um texto dentro de um PDF.
Acho melhor você rever esta funcionalidade em seu painel.