Ir para conteúdo

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Maykel-ctba

Pegar conteúdo de uma página externa com LoadHTML/XPath - dúvida

Recommended Posts

Boa tarde!

Preciso pegar informações que estão contidas em divs em um HTML.

 

HTML:

<div id="fundo_conteudo_noticia_setor" class="textogeral marrom">
            <div id="data_noticia_setor" class="textogeral_bold verde">Data</div>
            <div id="conteudo_noticia_setor">
                <a href="noticia_interna.asp?id=13692" class="sublinhado verde">
                    <span class="titulo_destaque_bold verde">Título<br>
                        <span class="titulo_destaque verde">Categoria</span>
                    </span>
                    <br><br>
                </a>
                Resumo do conteúdo...
            </div>
            </div>
            <div id="seta_noticia_setor"><i class="fa fa-angle-right fa-3x verde"></i></div>
        </div>

 

E este é o PHP que estou utilizando para pegar as informações. Porém, ao pegar o título da notícia, está trazendo o  $result['titulo'], está retornando junto os elementos filhos.

if(!$data = file_get_contents("meusiteteste.com.br")){
    $results = false;
}
else {

    $html = iconv('UTF-8', 'ISO-8859-1//TRANSLIT', $data);
    $doc = new DomDocument();
    @$doc->loadHTML($html);
    $xpath = new DomXpath($doc);
    $entries = $xpath->query("//div[@id=\"conteudo_noticia_setor\"]");
    $results = array();

    foreach ($entries as $entry){

        $node = $xpath->query("a/attribute::href", $entry);
        $result['link'] = $node->item(0)->value;

        echo $result['link'].'<br>';

        $node = $xpath->query("a/span[contains(@class, 'titulo_destaque_bold')]", $entry);
        $result['titulo'] = $node->item(0)->nodeValue;

        echo $result['titulo'].'<br><br>';

    }
}

Está imprimindo: TituloCategoria

 

Gostaria de tirar o conteúdo do span que consta dentro, porém não sei como proceder. Alguém pode me dar uma força? haha

Compartilhar este post


Link para o post
Compartilhar em outros sites

Você precisa adicionar alguma tag no conteúdo.. de preferência um P de paragrafo.

No código abaixo eu pego o primeiro elemento P visível no HTML.
Ai é só você estender para as outras tags necessárias.

$url = 'http://minhaurl.com.br';
$html = file_get_contents_curl($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$title = $doc->getElementsByTagName('p')->item(0)->nodeValue;

 

Compartilhar este post


Link para o post
Compartilhar em outros sites

@Maykel-ctba

Conhece esse cara?
http://simplehtmldom.sourceforge.net/

 

A vantagem dele comparado ao DomDocument()  é que funciona mesmo se o HTML está 'quebrado' 

 

Se liga no exemplo da documentação:

<?php

// Create DOM from string
$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>');

$html->find('div', 1)->class = 'bar';

$html->find('div[id=hello]', 0)->innertext = 'foo';

echo $html; // Output: <div id="hello">foo</div><div id="world" class="bar">World</div>

 

No caso só substituir o str_get_html por:

$html = file_get_html('http://www.google.com/');

(Ou CURL dependendo da complexidade para a requisição)

 

 

Compartilhar este post


Link para o post
Compartilhar em outros sites

@Vinicius Rangel eu não tenho como manipular o conteúdo de origem. Por isso, não consegui fazer a divisão antes!

 

@gabrieldarezzo Legal essa variação! Porém, mesmo com essas funções, caio no mesmo problema. Preciso pegar o conteúdo de uma div, e limpar todos os elementos filhos dele...

 

No caso de uma estrutura assim:

<div id="texto">
  Texto
  <div id="textoCat">
   TextoCat
  </div>
</div>

Ao pegar o conteúdo de #texto, ele vai concatenar com o de #textoCat. E preciso que me retorne sem os elementos filhos!

Compartilhar este post


Link para o post
Compartilhar em outros sites

De qualquer maneira creio que meu exemplo ainda vale...
 

$url = 'http://minhaurl.com.br';
$html = file_get_contents_curl($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$title = $doc->getElementsById('texto')->item(0)->nodeValue;

testa esse código por favor

Compartilhar este post


Link para o post
Compartilhar em outros sites

  • Conteúdo Similar

    • Por ILR master
      Fala galera, tudo bem?
       
      Tenho o seguinte codigo:
       
       class Data {
      public static function ExibirTempoDecorrido($date)
      {
          if(empty($date))
          {
              return "Informe a data";
          }
          $periodos = array("segundo", "minuto", "hora", "dia", "semana", "mês", "ano", "década");
          $duracao = array("60","60","24","7","4.35","12","10");
          $agora = time();
          $unix_data = strtotime($date);
          // check validity of date
          if(empty($unix_data))
          {  
              return "Bad date";
          }
          // is it future date or past date
          if($agora > $unix_data) 
          {  
              $diferenca     = $agora - $unix_data;
              $tempo         = "atrás";
          } 
          else 
          {
              $diferenca     = $unix_data - $agora;
              $tempo         = "agora";
          }
          for($j = 0; $diferenca >= $duracao[$j] && $j < count($duracao)-1; $j++) 
          {
              $diferenca /= $duracao[$j];
          }
          $diferenca = round($diferenca);
          if($diferenca != 1) 
          {
              $periodos[$j].= "s";
          }
          return "$diferenca $periodos[$j] {$tempo}";
      }
      }
       
      Funciona redondinho se o valor retornado for de algumas horas, mas...
      Quando passa de dois meses, ele retorna a palavra mess. Deve ser por conta dessa linha
      if($diferenca != 1) 
          {
              $periodos[$j].= "s";
          }
       
      Quero que modre:
       
      2 meses atrás
      e não
      2 mess atrás.
       
      Espero que tenham entendido.
       
      Valeu
    • Por Carlos Web Soluções Web
      Olá...
      Estou tentando fazer o seguinte !!
      Listando dados em tabela !!
      Gostaria que....se na listagem houver 4 linhas...indepedente de seu número de ID, faça a listagem em ID ser em ordem 1 2 3 4 !!
      Exemplo...se tiver uma listagem de dados que está em ID 1 3 3...faça ficar 1 2 3 !!

       
      echo "<table class='tabela_dados' border='1'> <tr> <td>ID</td> <td>Nome Empresa</td> <td>Responsável</td> <td>Telefone 1</td> <td>Telefone 2</td> <td>E-mail 1</td> <td>E-mail 2</td> <td>Endereço</td> <td>CEP</td> <td>Bairro</td> <td>AÇÃO 1</td> <td>AÇÃO 2</td> </tr> "; $sql = "SELECT ID FROM usuarios_dados WHERE Usuario='$usuario'"; $result = $conn->query($sql); $num_rows = $result->num_rows; $Novo_ID = 1; for ($i = 0; $i < $num_rows; $i++) { $registro = $result -> fetch_row(); $sql2 = "UPDATE usuarios_dados SET ID='$Novo_ID' WHERE ID='$Novo_ID'"; $result2 = $conn->query($sql2); $Novo_ID++; } $sql = "SELECT * FROM usuarios_dados"; $result = $conn->query($sql); if ($result->num_rows > 0) { // output data of each row while($row = $result->fetch_assoc()) { echo "<tr> <td>$row[ID]</td> <td>$row[Nome_Empresa]</td> <td>$row[Responsavel]</td> <td>$row[Telefone_1]</td> <td>$row[Telefone_2]</td> <td>$row[Email_1]</td> <td>$row[Email_2]</td> <td>$row[Endereço]</td> <td>$row[CEP]</td> <td>$row[Bairro]</td> <td> <form method='post' action='Editar_Dados.php'> <input type='hidden' name='usuario' value='$usuario'> <input type='hidden' name='senha' value='$senha'> <input type='hidden' name='ID' value='$row[ID]'> <input type='submit' style='padding: 10px;' value='EDITAR'> </form> </td> <td> <form method='post' action='Deletar_Dados.php'> <input type='hidden' name='usuario' value='$usuario'> <input type='hidden' name='senha' value='$senha'> <input type='hidden' name='ID' value='$row[ID]'> <input type='submit' style='padding: 10px;' value='DELETAR'> </form> </td> </tr> "; } } else { echo "0 results"; } $conn->close();  
    • Por ILR master
      Boa tarde pessoal, tudo bem ?
       
      Eu uso o tinymce para cadastro de textos no meu siite, porém, quero fazer um sistema para que os colunistas possam fazer o próprio post.
      O problema do tinymce, é que ele mantém a formatação do texto copiado, como tamanho de fonts, negritos, etc... Quero que o usuário cole o texto e a própria textarea limpe a formatação para que ele formate como quiser.
       
      A pergunta é:
       
      O tinymce tem uma opção para desabilitar a formatação quando um texto é colocado?
      Tem alguma função via java ou php para retirar a formatação assim que o texto é colado?
      Ou é melhor usar um outro editor?
       
      Agradeço deste já.
    • Por Giovanird
      Olá a todos!
      Tenho uma pagina que possui uma DIV onde coloquei uma pagina PHP.
      Uso a função setInterval para atualizar a pagina inclusa dentro da DIV.
      O problema é que ao acessar o site , a DIV só me mostra a pagina inclusa somente quando completo o primeiro minuto.
      Preciso que a pagina inclusa já inicie carregada
       
      Meu código JavaScript e a DIV com a pagina PHP
       
      <script> function atualiza(){ var url = 'direita.php'; $.get(url, function(dataReturn) { $('#direita').html(dataReturn); }); } setInterval("atualiza()",60000); </script> <div> <span id="direita"></span> </div>  
    • Por ILR master
      Fala pessoal.
       
      Seguinte:
       
      Quero selecionar duas tabelas e mostrar com resultados intercalados. Abaixo segue um código explicando para vcs terem uma ideia.
       
      $consulta = "SELECT A.*, B.* FROM tabela1 A, tabela2 B'";
      $resultado = mysqli_query($conexao, $consulta) or die ("erro");
      while($busca = mysqli_fetch_array($resultado)){
       
      print $busca['cod_evento']; --> traz o código da tabela1 
      print $busca['titulo_evento']; -->  traz o titulo da tabela1
      print $busca['cod_noticia']; --> traz o código da tabela2
      print $busca['titulo_noticia']; --> traz o tituloda tabela2
       
      }
       
      Espero que entendam. Grato
       
×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.