Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

lfbadwolf

'chupar conteúdo'

Recommended Posts

Olá, gostaria de saber como faço para chupar conteúdo de um site, se tem como criar um sistema ou se alguem tem algo parecido.

Ex. no site Imprensa Oficial tem o e-diariooficial, que mantém o conteúdo dos ultimos 15 dias somente, gostaria então de poder gravar o conteúdo diário que sai nele para poder fazer consultas futuras.

 

Agradeço desde já a tenção

Luiz Felipe

Compartilhar este post


Link para o post
Compartilhar em outros sites

acho grosseiro abrir usando fopen e tal..acho que não tem problema pedir com educação para os administradores do site disponibilizarem algum rss, xml...

Compartilhar este post


Link para o post
Compartilhar em outros sites

acho grosseiro abrir usando fopen e tal..acho que não tem problema pedir com educação para os administradores do site disponibilizarem algum rss, xml...

olá concordo contigo, mas o problema é que é um site do governo onde eles disponiblizam o conteúdo somente durante 15 dias, para que ninguem fique sabendo das coisas que eles fazem mesmo saca.Ainda nao encontrei solução

Compartilhar este post


Link para o post
Compartilhar em outros sites

você usa o fopen apontando pra url desejado, pega todo o html do site, faz a limpeza e grava no seu banco... antes de fazer o fopen, dê uma estudada na estrurura html do site... pq como o site é dinamico, tem sempre as mesmas tags no local.. daí é só usar substr pra limpar o que você quiser percorrendo todo o html... usei mto isso em PHP e CF qdo trabalhava num site de buscas gringo... a gente pegava conteudo de outros sites como se estivesse navegando como usuário...

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.