Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

andersonpda

expressões regulares

Recommended Posts

olá, eu andei pesquisando e vi que tem como extrair textos de um html extenso.a questao é eu tenho um html gigante que eu pego de um site e preciso retirar todos as urls que estao neles, mas preciso que retire apenas as urs que começem com http:// ou https:// , feito isso jogar num array com cada url retirada.alguem sabe fazer isso?

Compartilhar este post


Link para o post
Compartilhar em outros sites
<?php
$url  = "http://www.php.net";
$file = @file_get_contents($url);
preg_match_all("#(http:\/\/|https:\/\/)([^\s<>\.]+)\.([^\s\n<>\"\']+)#sm", $file, $matches);
echo "<pre>";
print_r($matches[0]);
echo "</pre>";
?>

Compartilhar este post


Link para o post
Compartilhar em outros sites

<?php$url  = "http://www.php.net";$file = @file_get_contents($url);preg_match_all("#(http:\/\/|https:\/\/)([^\s<>\.]+)\.([^\s\n<>\"\']+)#sm", $file, $matches);echo "<pre>";print_r($matches[0]);echo "</pre>";?>

ressucitando o tópico.... estou utilizando uma rotina parecida com essa que o Fabyo postou pra pegar determinados textos em um site.

 

Observei que o que quero pegar sempre é assim:

 

<strong></strong></td><td>xx</td>

 

o que altera são o: y e o xx que em ambos os casos são números:

 

como é que eu faço para indicar essa linha: <strong></strong></td><td>xx</td> para ser pega, através de expressões regulares?

 

obrigado aí a todos pela ajuda. http://forum.imasters.com.br/public/style_emoticons/default/thumbsup.gif

Compartilhar este post


Link para o post
Compartilhar em outros sites

se você deseja manipular expressoes..... da uma olhada em whikipedia sobre elas.... ai você vai entender ,, dai fica facil você manipula las

ok.

 

eu acessei tbm um outro site ai que fala sobre expressões regulares, porem o meu maior problema, como não tenho nenhum conhecimento eh saber como iniciar a tal expressão.

 

então dessa forma, como transformar o seguinte trecho de linha em expressão regular, levando em considerção o exposto anteriormente, onde "y" eh um numeo e "xxx" tbm:

 

<strong>yº</strong></td><td>xx</td>

 

 

para "y" e "xxx" creio que deva colocar algo parecido com isso -> [0-9]{1} para "y" haja visto que tenho apenas um dígito e -> [0-9]{3} para "xxx" por serem 3 digitos.

 

mas e o restante, como é que eu transformo em expressões regulares.

 

será que alguem poderia de mostrar como é que ficaria tal linha e se possível tipo comentar o porque de colocar tal sinal aqui ou tal sinal lá

 

desde já agradeço...

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.