Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Marcuskpn

Criar uma ferramenta de Analise de HTML

Recommended Posts

Amigos,

 

Quero criar uma ferramenta que faz analise em HTML e pega cada tag como TITLE, DESCRIÇÃO, PALAVRAS de um site. Ou mesmo criar um bot igual do google, onde ele pegar informações de site e atualiza seu banco de dados. pois o mesmo gostaria de fazer...

 

Meu codigo atual, mais claro so peguei o site e coloquei em um arquivo txt, quero agora pegar as informações como TITLE, DESCRIÇÃO e PALAVRAS

 

<%

'Captura a pagina

pagina = "http://www.classifacilbusca.com/"

Dim OBJ_HTML, strReturn

Set OBJ_HTML = Server.CreateObject("Microsoft.XMLHTTP")

OBJ_HTML.Open "GET", ""& pagina &"", False

OBJ_HTML.Send

Dados = OBJ_HTML.responseText

Set OBJ_HTML = Nothing

cTXT = server.HTMLEncode(dados)   'replace(server.HTMLEncode(dados),chr(13),"<br>") 

Set FSO = Server.CreateObject("Scripting.FileSystemObject")
caminho = Server.MapPath("teste.htm") 'especifique aqui o caminho onde ficará/está o TXT
Set GRAVAR = FSO.CreateTextFile(caminho,true)
'Foi criado o objeto e logo após busca o txt em caminho para gravar, se não achar, vai cria-lo (por causa da marcação TRUE)

gravar.write cTXT
gravar.close
response.write "GRAVADO!"
'apos abrir o TXT, gravará a linha com o texto "TESTE DE GRAVAÇÃO" a confirmação no cliente aparecerá como "GRAVADO"



Set FSO = Server.CreateObject("Scripting.FileSystemObject")
caminho = Server.Mappath("teste.htm")
Set TXT = FSO.OpenTextFile(caminho)
'cria o objeto, e busca pelo TXT indicado pela variável caminho como acima

response.write txt.readALL
'após abrir o TXT, enviará direto ao cliente todo conteúdo do TXT, neste exemplo, retornará "TESTE DE GRAVAÇÃO" como foi gravado acima
txt.close
%>

 

 

Exemplo de como é um resultado coletado do site http://www.divulgue.com/analisador.php

 

 

Segue abaixo, a análise efetuada para o site "www.classifacilbusca.com". Imprima esta página ou salve em algum local para futuras comparações.

 

A página possui 58277 caracteres.

A página possui 2 imagens (jpg, gif ou png).

A página possui 16 links.

A página NÃO possui animações flash (.swf).

A página possui 1 frames.

 

Não foram encontradas tags descritivas "alt"

Tags "alt" são úteis para descrição de imagens e figuras presentes no site, facilitando a localização de palavras-chave nos mecanismos de busca. Exemplo: <img src="nome_da_imagem.gif" alt="descrição da imagem">

 

Foram encontradas folhas de estilo em seu site.

Folhas de estilo ou CSS (Cascading Style Sheets) como são conhecidas, contribuem para uma melhor formatação de sites, isto facilita a identificação do conteúdo do site pelos mecanismos de busca.

 

Foi detectada a presença de javascripts nesta página

Está correto, javascripts devem ser salvos em um arquivo de extensão ".js" e chamados no topo da página, assim como CSS, isto facilita a indexação por parte dos mecanismos.

 

Foram encontradas tags de título <H1>, <H2>, <H3>...

Mecanismos de busca como o Google priorizam as palavras-chave que se encontram entre tags <H1> e </H1>

 

A página analisada possui título.

O título de um site é essencial para determinação do conteúdo da página. Exemplo: <title>Título do site</title>

 

A página analisada possui metatags de descrição.

A metatag descrição é essencial para determinação do conteúdo da página. Descrição encontrada: CLASSI FÁCIL BUSCA - Guia mais completo da Interenet.

 

A página analisada possui metatag palavras-chave.

A presença de palavras-chave de um site é essencial para determinação do conteúdo da página. Palavras-chave encontrada(s): Busca Guia Comercial Publicidade classificados Cartão Visita Agencia Promocional Cupom Turismo

 

 

 

COMO FAZER ISSO, paramim poder criar meu mecanismo de busca?

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.