Pegar codigo fonte de um pagina
Olá pessoal,
estou tentando pegar o codigo fonte de uma página do orkut, porém como o site trabalha com redirecionamento, esta ficando dificil.
A questão é a seguinte, tanto com o get_file_content() quanto com o CURL, estou tendo o seguinte problema.
1 - criei o código em php abaixo:
<?php
$url = "http://www.orkut.com.br/Main#Home.aspx";
//$content = file_get_contents($url);
function open_url($url){
$curl = curl_init();
curl_setopt ($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
//curl_setopt($curl, CURLOPT_REFERER, 'https://www.google.com/);
$content = curl_exec ($curl);
curl_close ($curl);
return $content;
}
$content = open_url($url);
print $content;
?>
2 - em seguida, este codigo php puxa o codigo fonte da página http://www.orkut.com.br/Main#Home.aspx (usuário já logado e os cookies todos setados).
Agora é que vem o problema, não sei porque, quando vem o resultado, ele substitui o "Home.aspx" pelo nome do meu arquivo (pegar.php) e retornando uma página inválida.
Alguém tem uma idéia de como posso resolver isto?
desde já agradeço.
Obrigado
Julio Diniz
Discussão (14)
Carregando comentários...