Ir para conteúdo

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Good

Comparar similaridade com strings

Recommended Posts

Estou com vários títulos de produtos, que mudam só uma palavra, etc. E preciso que não possa repetir o mesmo titulo..

Exemplo:

1- Microondas de alta qualidade cinza

2- Microondas de alta qualidade cinza novo

3- Microondas de alta qualidade cinza velho

4- Microondas de alta qualidade branco

5- Microondas de alta qualidade branco velho

A dúvida que estou é na lógica pra tirar os produtos com título repetido.. Neste exemplo aí, só deveria sair do sistema as IDs 2, 3 e 5. Pois é indiferente, eles tem a palavra novo e velho que não importam, é o mesmo produto.

Alguma dica como posso fazer?

Compartilhar este post


Link para o post
Compartilhar em outros sites

Se você tiver um SGBD "melhor" (leia-se melhor como "mais recursos", o resto é relativo), pode utilizar Full Text Search para encontrar sentenças parecidas. Já lhe adianto que MySQL não tem...

Outro ponto, depende de como estão as DDL's. Em todo o caso, eu indicaria reestruturar a forma de cadastro (no final das contas, não sei como estão, mas poderia ajudar a resolver o seu problema).

Se o seu caso é um e-commerce ou qualquer outra loja. Você deve ter uma estrutura similar a isto:
- Linha;
- Família;
- Grupo;
- Produto (nesse caso ele é vinculado a uma marca também);
- Item do produto.

Basicamente o produto é o básico: Micro-ondas Electrolux MI41S.

Já os itens, são as características do produto dentro do produto:

- Voltagem/bi-volt;

- Cor;

- Capacidade;

- Estado (novo/usado).

Todas essas características dependem do que o fabricante considera um mesmo produto. Falando ainda sobre o mesmo micro-ondas, ele existe em duas versões: EXMI41S1 e EXMI41S2.

Logo, EXMI41S1 e EXMI41S2 são dois itens do produto MI41S.

Nesse caso, todos os códigos são chaves únicas, pois eles definem um item (e não mais ficaria dependente do título).

Outro exemplo: televisores Samsung, olhar em questão a série 6 da nova linha (K). Olharemos o produto K6500A.

Do produto, encontram-se dois itens:

- UN40K6500AG;

- UN49K6500AG.

Agora, se o erro de cadastro é humano... bem, então, não tem sistema que te salve, alguém sempre vai conseguir burlar.

Compartilhar este post


Link para o post
Compartilhar em outros sites

KKKKKKk

é erro humano... de uma loja no mercado livre.. o que o cliente quer é tirar os produtos repetidos..

eu penso em remover palavras como velho, novo, usado, etc pra depois fazer a comparação pra ver se é o mesmo produto.. Acho que é o único jeito

valeu Gabriel pela atenção!!

Compartilhar este post


Link para o post
Compartilhar em outros sites

×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.