Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Lab Design

[Resolvido] Preciso fazer um parser num arquivo html

Recommended Posts

To montando um sistema de envio de emails local pra um cliente e preciso fazer um parse no html que ele selecionar para envio, capturando as url das imagens para poder incorporar no email, já que as mesmas não serão enviadas pra um servidor remoto.

Já tenho o metodo montado e funcionando porém em testes eu detectei que em caso de quebra de linha no meio da tag img, o Regex não consegue pegar e passa batido.

 

Ex.:

<img height=150 src="Palestra - Sintonia_arquivos/foto_01.jpg" height=150 width=100>

o Regex pega normal independe de onde esteja a tag img ou src

 

mas neste caso

<img

height=150 src="Palestra - Sintonia_arquivos/foto_01.jpg" height=150 width=100>

 

ou sej um quebra de linha no meio já confundiu ele e passa direto.

 

Como eu poderia refazer essa expressão pra desconsiderar a quebra de linha e consequentemente qualquer tab que tenha dentro da abertura e fechamento do img.

 

A expressão que to usando é:

 

objRegEx = new Regex("img.*src\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\S+))", RegexOptions.IgnoreCase | RegexOptions.Compiled);

 

// procura no HTML

objMatch = objRegEx.Match(HTML);

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.