Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.
Olá pessoal;Alguem sabe como eu faço para converter html para texto? ou seja, quero pegar o texto sem as tag do html. Preciso pegar o que esta em uma pagina e armazenar em um banco de dados. Desde já agradecidoEmílio
As tags não seguem um padrão.Eu preciso armazenar os texto de uma determinada pagina escolhida pelo usuario. No caso é so texto.o texto tem que ficar como se fosse dado um ctrl + c na pagina e um crtl + v em um campo memo.
Pesquise sobre:
WebBrowser1.OleObject.Document.Body.InnerText
ou
WebBrowser1.OleObject.Document.Body.InnerHtml
Acredito que era um destes comandos que faz o que deseja, no caso usando um TWebBrowser para buscar a página.
Veja neste site: http://delphi.about.com/od/internetintrane...browserenum.htm
Cara, Valeu funcionou!!!! Era isso que eu estava procurando
Achei uma outra forma de fazer... faz o seguinte... coloque no seu formulário um TWebBrowser, na propriedade OnDocumentComplete faz o seguinte:
var pagina: IHTMLElement;beginif Assigned(WebBrowser1.Document) then begin pagina:=(WebBrowser1.Document as IHTMLDocument2).Body; while pagina.ParentElement <> nil do pagina:=pagina.ParentElement; //Memo1.Text:=pagina.outerHTML; //HTML Memo1.Text:=pagina.outerText; //Texto end;Declare mshtml no uses, no caso ele vai atirar tudo em um Memo. No caso o usuário informa a página que deseja pegar o texto digamos que seria WebBrowser1.Navigate('http://www.google.com.br'); depois que a página carregar ele pega o texto e coloca no Memo1.
Aproveitando o tópico aqui do nosso amigo, existe algo semelhante para criar um documento XML?No meu sistema ele gera dois relatórios totalmente em texto (txt), e eu queria a partir destas informações criar um XML deste txt, existe algum componente que facilite este tipo de coisa ou terei de fazer no braço mesmo?
Veja se um destes artigos lhe ajuda: http://delphi.about.com/od/objectpascalide/l/aa072500a.htm
Voltando ao assunto do html; tem como pegar a configuração de fonte tb?
No momento não sei lhe dizer, não cheguei a estudar os comandos a fundo, mas pq você nao faz o seguinte, salvar tanto somente o texto quanto o HTML, ai você deixa a opção para o user olhar, se ele quer em versão textou ou html, se pedir html abre em um TWebBrowser, senão, na versão texto abre em um Memo mesmo...Olhei e tem umas propriedades para pegar o style, font, etc... mas não sei se funciona, teria de tetar...
As tags sempre seguem um padrão ? No caso todas as tags devem de ser descartadas ?