Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Francisco De Assis Dias

Extrair informações dinâmicas de uma página HTML e armazenar os dados

Recommended Posts

Bom dia,

 

Veja se ajuda - http://desenvolvimentoparaweb.com/php/como-pegar-parte-do-conteudo-dados-de-outro-site-com-php/

 

 

Boa tarde,

 

 

 

Exemplo online - http://angelorubin.besaba.com/Pegar-Conteudo-Outro-Dominio/pegar-conteudo.php

 

Com php e jquery da pra fazer assim:

<!DOCTYPE html><html lang="pt-br"><head><meta charset="utf-8" /><title>PHP & JQUERY</title><style type="text/css">#imasters{    display:none;    }#resultado{    margin:10px;    overflow:hidden;    border:1px solid #CCC;    padding:10px;    height:auto;    min-height:400px;    }</style></head><body><div id="imasters">    <?php    // post_id_1982786    $imasters = file_get_contents('http://forum.imasters.com.br/topic/500876-extrair-informaes-dinmicas-de-uma-pgina-html-e-armazenar-os-dados/?p=1982786');    echo $imasters;    ?></div><div id="resultado"></div><script type="text/javascript" src="//ajax.googleapis.com/ajax/libs/jquery/1.10.1/jquery.min.js"></script><script type="text/javascript">$(function() {        var contexto = $('#imasters');//('.post entry-content');        var resultado = $(contexto).find('#post_id_1982786');        $('#resultado').append(resultado);        console.log(typeof(resultado));        console.log(resultado);}); </script></body></html>

Espero que ajude.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Só cuidado com file_get_contents(). Se a página tiver muito conteúdo e/ou estiver em um servidor lento pode ancorar sua aplicação.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Bom dia,

 

Realmente Bruno você tem razão, notei que fica meio pesado desta forma.

 

Como fazer isso de uma forma melhor?

 

OBS: Outro detalhe Francisco, para pegar de 10 em 10 minutos vai precisar de um setInterval.

Compartilhar este post


Link para o post
Compartilhar em outros sites

É só não usar file_get_contents() e sim a tríade fopen() / fread() / fclose() ou cURL.

 

Lembrando que mágica essa mudança não irá fazer, mas no nível da sua aplicação vai diminuir o consumo de memória e processamento.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Sei lá... mas será que o pessoal que é dono dessa página aí que você vai chupar vão gostar disso? Verifique primeiro se não há nota de copyright na página ou se os Termos de Uso proíbem o acesso através de meios automatizados ou pode rolar processo. Recomendo também usar um proxy.

 

Com cURL, o proxy pode ser definido usando a opção CURLOPT_HTTPPROXYTUNNEL:

$ch = curl_init ();
curl_setopt ($ch, CURLOPT_HTTPPROXYTUNNEL, "IP DO PROXY");

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.