Ir para conteúdo

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Maykel-ctba

Pegar conteúdo de uma página externa com LoadHTML/XPath - dúvida

Recommended Posts

Boa tarde!

Preciso pegar informações que estão contidas em divs em um HTML.

 

HTML:

<div id="fundo_conteudo_noticia_setor" class="textogeral marrom">
            <div id="data_noticia_setor" class="textogeral_bold verde">Data</div>
            <div id="conteudo_noticia_setor">
                <a href="noticia_interna.asp?id=13692" class="sublinhado verde">
                    <span class="titulo_destaque_bold verde">Título<br>
                        <span class="titulo_destaque verde">Categoria</span>
                    </span>
                    <br><br>
                </a>
                Resumo do conteúdo...
            </div>
            </div>
            <div id="seta_noticia_setor"><i class="fa fa-angle-right fa-3x verde"></i></div>
        </div>

 

E este é o PHP que estou utilizando para pegar as informações. Porém, ao pegar o título da notícia, está trazendo o  $result['titulo'], está retornando junto os elementos filhos.

if(!$data = file_get_contents("meusiteteste.com.br")){
    $results = false;
}
else {

    $html = iconv('UTF-8', 'ISO-8859-1//TRANSLIT', $data);
    $doc = new DomDocument();
    @$doc->loadHTML($html);
    $xpath = new DomXpath($doc);
    $entries = $xpath->query("//div[@id=\"conteudo_noticia_setor\"]");
    $results = array();

    foreach ($entries as $entry){

        $node = $xpath->query("a/attribute::href", $entry);
        $result['link'] = $node->item(0)->value;

        echo $result['link'].'<br>';

        $node = $xpath->query("a/span[contains(@class, 'titulo_destaque_bold')]", $entry);
        $result['titulo'] = $node->item(0)->nodeValue;

        echo $result['titulo'].'<br><br>';

    }
}

Está imprimindo: TituloCategoria

 

Gostaria de tirar o conteúdo do span que consta dentro, porém não sei como proceder. Alguém pode me dar uma força? haha

Compartilhar este post


Link para o post
Compartilhar em outros sites

Você precisa adicionar alguma tag no conteúdo.. de preferência um P de paragrafo.

No código abaixo eu pego o primeiro elemento P visível no HTML.
Ai é só você estender para as outras tags necessárias.

$url = 'http://minhaurl.com.br';
$html = file_get_contents_curl($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$title = $doc->getElementsByTagName('p')->item(0)->nodeValue;

 

Compartilhar este post


Link para o post
Compartilhar em outros sites

@Maykel-ctba

Conhece esse cara?
http://simplehtmldom.sourceforge.net/

 

A vantagem dele comparado ao DomDocument()  é que funciona mesmo se o HTML está 'quebrado' 

 

Se liga no exemplo da documentação:

<?php

// Create DOM from string
$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>');

$html->find('div', 1)->class = 'bar';

$html->find('div[id=hello]', 0)->innertext = 'foo';

echo $html; // Output: <div id="hello">foo</div><div id="world" class="bar">World</div>

 

No caso só substituir o str_get_html por:

$html = file_get_html('http://www.google.com/');

(Ou CURL dependendo da complexidade para a requisição)

 

 

Compartilhar este post


Link para o post
Compartilhar em outros sites

@Vinicius Rangel eu não tenho como manipular o conteúdo de origem. Por isso, não consegui fazer a divisão antes!

 

@gabrieldarezzo Legal essa variação! Porém, mesmo com essas funções, caio no mesmo problema. Preciso pegar o conteúdo de uma div, e limpar todos os elementos filhos dele...

 

No caso de uma estrutura assim:

<div id="texto">
  Texto
  <div id="textoCat">
   TextoCat
  </div>
</div>

Ao pegar o conteúdo de #texto, ele vai concatenar com o de #textoCat. E preciso que me retorne sem os elementos filhos!

Compartilhar este post


Link para o post
Compartilhar em outros sites

De qualquer maneira creio que meu exemplo ainda vale...
 

$url = 'http://minhaurl.com.br';
$html = file_get_contents_curl($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$title = $doc->getElementsById('texto')->item(0)->nodeValue;

testa esse código por favor

Compartilhar este post


Link para o post
Compartilhar em outros sites

  • Conteúdo Similar

    • Por landerbadi
      Boa tarde pessoal. Estou tentado fazer uma consulta no banco de dados porém estou tendo dificuldades. Tenho uma tabela chamada "itens" com os seguintes campos: id, item, ativo. Nela tem cadastrado vários itens. No campo ativo eu coloco a letra "S" para informar que este item está ativo no sistema. Por exemplo: 1, casa, S 2, mesa, S 3, cama, S 4, moto S 5, rádio O quinto registro "radio" não está ativo no sistema pois não tem um "S" no campo ativo. E outra tabela chamada "produtos" com os seguintes campos (id, item1, item2, item3) com os seguintes registros: 1, casa, mesa, moto 2, mesa, casa, cama 3, rádio, cama, mesa Eu preciso fazer uma busca na tabela produtos da seguinte maneira: Eu escolho um registro na tabela "itens", por exemplo "mesa". Preciso fazer com que o php me liste todos os registros da tabela "produtos" que contenham a palavra "mesa". Até aqui tudo bem eu consigo listar. Estou fazendo assim: <?php $item = "mesa" $sql = mysqli_query($conn, "SELECT * FROM produtos WHERE item1 LIKE '$item' OR item2 LIKE '$item' OR item3 LIKE '$item' LIMIT 10"); while($aux = mysqli_fetch_assoc($sql)) { $id = $aux["id"]; $item1 = $aux["item1"]; $item2 = $aux["item2"]; $item3 = $aux["item3"]; echo $id . " - " . $item1 . ", " . $item2 . ", " $item3 . "<br>"; } ?> O problema é que está listando todos os registros que contém o item mesa. Eu preciso que o php verifique os demais item e me liste somente os registro em que todos os registros estejam ativos no sistema. No exemplo acima ele não deveria listar o registro 3. pois nesse registro contém o item "radio" e este item não está ativo no sistema. Ou seja, o registro "radio" na tabela itens não possui um "S" na coluna "ativo". Alguém sabe como resolver isso?
    • Por ILR master
      Fala galera.
      Espero que todos estejam bem.
      Seguinte: Tenho um arquivo xml onde alguns campos estão com : (dois pontos), como o exemplo abaixo:
       
      <item>
      <title>
      d sa dsad sad sadasdas
      </title>
      <link>
      dsadas dsa sad asd as dsada
      </link>
      <pubDate>sadasdasdsa as</pubDate>
      <dc:creator>
      d sad sad sa ad as das
      </dc:creator>
      </item>
       
      Meu código:
       
      $link = "noticias.xml"; 
      $xml = simplexml_load_file($link); 
      foreach($xml -> channel as $ite) {     
           $titulo = $ite -> item->title;
           $urltitulo = $ite -> item->link;
           print $urltitulo = $ite -> item->dc:creator;
      } //fim do foreach
      ?>
       
      Esse campo dc:creator eu não consigo ler. Como faço?
       
      Agradeço quem puder me ajudar.
       
      Abs
       
       
    • Por First
      Olá a todos!
       
      Eu estou criando um sistema do zero mas estou encontnrando algumas dificuldades e não estou sabendo resolver, então vim recorrer ajuda de vocês.
      Aqui está todo o meu código: https://github.com/PauloJagata/aprendizado/
       
      Eu fiz um sistema de rotas mas só mostra o conteúdo da '/' não sei porque, quando eu tento acessar o register nada muda.
      E eu também quero que se não estiver liberado na rota mostra o erro de 404, mas quando eu tento acessar um link inválido, nada acontece.
      Alguém pode me ajudar com isso? E se tiver algumas sugestão para melhoria do código também estou aceitando.
       
       
      Desde já, obrigado.
    • Por landerbadi
      Olá pessoal, boa tarde
       
      Tenho uma tabela chamada "produtos" com os seguintes campos (id, produto) e outra tabela chamada "itens" com os seguintes campos (id, prod_01, prod_02, prod_03, prod_04).
       
      Na tabela produtos eu tenho cadastrado os seguintes produtos: laranja, maçã, uva, goiaba, arroz, feijão, macarrão, etc.
       
      Na tabela itens eu tenho cadastrado os itens da seguinte maneira:
       
      1, laranja, uva, arroz, feijão;
      2, maçã, macarrão, goiaba, uva;
      3, arroz, feijão, maçã, azeite
       
      Meu problema é o seguinte: 
      Eu escolho um produto da tabela "produtos", por exemplo "uva".  Preciso fazer uma consulta na tabela "itens" para ser listado todos os registros que contenham o produto "uva" e que todos os demais produtos estejam cadastrados na tabela "produtos".
       
      No exemplo acima seria listado apenas dois registros, pois o terceiro registro não contém o produto "uva". 
       
      Alguém pode me ajudar? Pois estou quebrando a cabeça a vários dias e não consigo achar uma solução.
    • Por landerbadi
      Boa tarde pessoal. Estou tentado fazer uma consulta no banco de dados porém estou tendo dificuldades. Tenho uma tabela chamada "itens" com os seguintes campos: id, item, plural, ativo. Nela tem cadastrado vários itens e seu respectivo plural. No campo ativo eu coloco a letra "S" para informar que esta palavra está ativa no sistema. Por exemplo: 1, casa, casas, S 2, mesa, mesas, S 3, cama, camas, S 4, moto, motos, S 5, rádio, rádios O quinto registro "radio" não está ativo no sistema pois não tem um "S" no campo ativo. E outra tabela chamada "variações" com os seguintes campos (id, item1, item2, item3) com os seguintes registros: 1, casa, camas, moto 2, mesas, casas, radio 3, rádio, cama, mesa Eu preciso fazer uma busca na tabela variações da seguinte maneira: Eu escolho um registro na tabela "itens", por exemplo "casa". Preciso fazer com que o php me liste todos os registros da tabela "variações" que contenham a palavra "casa". Porém se tiver algum registro com a palavra "casas" também tem que ser listado. Neste caso ele irá encontrar dois registros. Agora eu preciso que o php verifique os demais itens e faça a listagem apenas dos item que estão ativos (que contenham um "S" no campo ativo. Neste caso ele irá encontrar apenas um registro, pois o segundo registro contém a palavra "rádio". E "rádio" não está ativo na tabela itens. Como faço isso?
×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.