Ir para conteúdo

POWERED BY:

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

leoQueiroga

Registros parcialmente repetidos em uma tabela.

Recommended Posts

Olá comunidade.

 

Estou com um problema bem tenso aqui e não estou sabendo como proceder.

 

Eu estou tendo que "consertar" um banco de dados que foi construido a muitos anos e que está com os dados bem confusos.

 

no campo EXPORTADOR eu tenho registros "repetidos" ex.:

MOLINS DO BRASIL MAQUINAS AUTOMATICAS LTDA.

MOLINS DO BRASIL MAQUINAS AUTOMATICAS.

MOLINS DO BRASIL MAQUINAS AUTOMATICAS LTD

 

Eu gostaria de saber se existe algum jeito de eu recuperar os campos "parecidos" com o mysql, pra pelo menos ficar mais "fácil" de eu excluir eles. são mais ou menos uns 8mil registros que tem na tabela, e tem muita coisa repetida.

 

Agradeço desde já qualquer ajuda.

 

Atenciosamente,

Leonardo

 

bump

Compartilhar este post


Link para o post
Compartilhar em outros sites

Grato pela resposta, Thelon.

 

Mas o meu problema é que o "molins" foi só um exemplo. Eu tenho MUITOS registros repetidos, de vários clientes. eu gostaria de saber se existe alguma maneira de verificar e retornar os que forem "parecidos" algo assim... lol

 

 

abraços!

Compartilhar este post


Link para o post
Compartilhar em outros sites

Não seria melhor ir pelo cgc/cnpj ?

 

É um dado menos sujo que o nome.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Estava pesquisando sobre o assunto e talvez o recurso FULLTEXT (http://dev.mysql.com/doc/refman/4.1/pt/fulltext-search.html) te ajude (segundo a referência é apenas para tabelas MyISAM).

 

Imagino que se você fizer um loop de todos os registros e 1 a 1 organizar por score como no segundo exemplo do link de referência acima acho que você deve encontrar os registros parecidos.

 

Abraços!

Compartilhar este post


Link para o post
Compartilhar em outros sites

@Alexandre,

 

Grato pela sugestão, eu tentarei e postarei os resultados aqui.

 

@Motta

 

Então brother, esse cadastro que estou mexendo é um cadastro todo zoado. Ele não tem cnpj e nenhum dado "único". A pessoa que trabalhava aqui antes de mim usava um campo blob (BLOB!!!) pra guardar TODAS as informações de um cliente de uma nota fiscal.

Ex.: No programa dele tem um textarea "favorecido" ou algo assim, e é um campo onde a pessoa ia em um documento do word que estavam guardadas todas as infos do cliente, copiava e colava no campo, e isso era salvo em um campo blob. Mas como sempre, e em toda empresa, tem o funcionário espertão que sabe tudo e digita os dados manualmente no campo. Aí você imagina o caos que eu estou enfrentando né?

 

 

Grato por toda ajuda.

Atenciosamente,

Leonardo Queiroga

Compartilhar este post


Link para o post
Compartilhar em outros sites

... Então brother, esse cadastro que estou mexendo é um cadastro todo zoado. Ele não tem cnpj e nenhum dado "único". A pessoa que trabalhava aqui antes de mim usava um campo blob (BLOB!!!) pra guardar TODAS as informações de um cliente de uma nota fiscal. ...

.... quando você acha que já viu de tudo aparece algo que te surpreende ...

Compartilhar este post


Link para o post
Compartilhar em outros sites

Só pra você ter uma idéia. A "estrutura" dos dados do blob é a seguinte:

 

ZANOTTI S/A

RUA GERMANO WAGNER, 1000 - BAIRRO CENTENARIO

89256-800 - JARAGUA DO SUL -SC- BRASIL

 

Elas estão sempre nesse """""padrão"""" de nome na primeira linha, endereço na segunda e terceira. Com isso, eu consegui fazer uma MASTER-ULTRA-WTF-gambi pra pegar os dados e passar pra uma tabela decente de cadastro de pessoa. Aí é que está meu problema, tem um monte de registro tipo ZANOTTI S/A, ZANOTTI S.A., ZANOTTI SA.

 

 

Já sentiu vergonha de código alheio? Eu to sentindo. =(

Compartilhar este post


Link para o post
Compartilhar em outros sites

acredito q a melhor soluçao começe com o seguinte comando:drop database...

Bem que eu queria usar esse comando viu, mas se eu fizer um negocio desse, é só eu ir buscar minha justa causa no andar de baixo... hauauhua :ermm:Enfim, valeu pela ajuda que tentaram dar pra mim, infelizmente o FULLTEXT do amigo acima não adiantou para meu caso. Vou ter q ir fazendo o negocio meio "manual" mesmo até eu terminar a aplicação nova.Abraços a todos!

Compartilhar este post


Link para o post
Compartilhar em outros sites

Provalvemente será preciso uma aplicação para tentar recuperar estas informações mas não será nada fácil.

 

Isto parece sistema feito por sobrinho....

Compartilhar este post


Link para o post
Compartilhar em outros sites

o q dava pra fazer era uma funçao q contasse a qtde e o tipo letra em cada entrada e depois por qtde aproximadas mostrasse as possiveis proximidades e logico um like com % entre os espaços

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.