Publicado em 19 de abr.

Pegar codigo fonte de um pagina

Olá pessoal,

estou tentando pegar o codigo fonte de uma página do orkut, porém como o site trabalha com redirecionamento, esta ficando dificil.

A questão é a seguinte, tanto com o get_file_content() quanto com o CURL, estou tendo o seguinte problema.

1 - criei o código em php abaixo:

<?php
$url = "http://www.orkut.com.br/Main#Home.aspx";

//$content = file_get_contents($url);

function open_url($url){
$curl = curl_init();
curl_setopt ($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
//curl_setopt($curl, CURLOPT_REFERER, 'https://www.google.com/);
$content = curl_exec ($curl);
curl_close ($curl);
return $content;
}

$content = open_url($url);
print $content;
?>

2 - em seguida, este codigo php puxa o codigo fonte da página http://www.orkut.com.br/Main#Home.aspx (usuário já logado e os cookies todos setados).

Agora é que vem o problema, não sei porque, quando vem o resultado, ele substitui o "Home.aspx" pelo nome do meu arquivo (pegar.php) e retornando uma página inválida.

Alguém tem uma idéia de como posso resolver isto?

desde já agradeço.

Obrigado

Julio Diniz

Discussão (14)

Entre ou cadastre-se para participar da discussão

Entrar Criar conta

Carregando comentários...