Ir para conteúdo

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

DiogoD

Remover caracteres, símbolos e números de uma URL

Recommended Posts

Olá a todos,
Sou novíssimo aqui no fórum como usuário, mas já venho acompanhando o trabalho a tempo.

Tenho uma aplicação que trabalha com Woocommerce e o gateway Pagar.Me pelo Wordpress, e em um dos módulos, recebe os parâmetros de uma URL.

Me deparei com um problema que não achei soluções neste e em outros fóruns.

 

No caso de um valor que contivesse espaços  e/ou acentos, como substituiria para uma string comum (somente com os caracteres alfabéticos)?

 

Uma URL não aceita certos caracteres e o substitui automaticamente por outros caracteres especiais. Tendo essa premissa, criei uma função para resolver o problema:

 

function concerta_URL($string){
   $string = str_replace(array("%C3%A7", "%C3%87", "%C3%A3", "%C3%83", "%C3%A1", "%C3%81", "%C3%A0", "%C3%80", "%C3%A2", "%C3%82", "%C3%A4", "%C3%84",
       "%C3%A9","%C3%89","%C3%A8", "%C3%88", "%C3%AA", "%C3%8A", "%C3%AB", "%C3%8B", "%C3%AB", "%C3%8B", "%C3%AD", "%C3%8D", "%C3%AC", "%C3%8C", "%C3%AE", "%C3%8E", "%C3%AF", "%C3%8F",
       "%C3%B3", "%C3%93", "%C3%B2", "%C3%92", "%C3%B6", "%C3%96", "%C3%B5", "%C3%95", "%C3%B3", "%C3%93", "%C3%B2", "%C3%92", "%C3%B4", "%C3%94", "%C3%B6", "%C3%96",
       "%C3%BA", "%C3%9A", "%C3%B9", "%C3%99", "%C3%BB", "%C3%9B", "%C3%BC", "%C3%9C"), 
            array("c", "C", "a", "A", "a", "A", "a", "A", "a", "A", "a", "A", "e", "E", "e", "E", "e", "E", "e", "E", "i", "I", "i", "I", "i", "I", "i", "I", "o", "O", "o", "O", 
            "o", "O", "o", "O", "o", "O", "u", "U", "u", "U", "u", "U", "u", "U"), $string);
   $string = trim(strtolower($string));
   $a = 'ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýýþÿŔŕ?';
   $b = 'aaaaaaaceeeeiiiidnoooooouuuuybsaaaaaaaceeeeiiiidnoooooouuuuyybyRr-';
   $string = strtr($string, utf8_decode($a), $b);
   $string = str_replace(".","-",$string);
   $string = str_replace(array('0', '1', '2', '3', '4', '5', '6', '7', '8', '9'), '', $string);
   $string = preg_replace( "/[^0-9a-zA-Z\.]+/",' ',$string);
   
   return utf8_decode(rtrim($string, "-"));
}

A mesma retorna uma string low(caixa baixa) sem os caracteres, símbolos e números que podem eventualmente, serem inseridos.

 

A função foi feita de um modo bem deselegante, mas não consegui faze-la utilizando a função php preg_replace, pois ela não aceita um filtro maior que 10 caracteres.

Se alguém souber de um modo melhor de fazer, seria muito legal compartilhar.

No mais espero ajudar quem tiver deparado com o mesmo problema.

Até.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Acho que essa é uma das mais interessantes:

 

Compartilhar este post


Link para o post
Compartilhar em outros sites

Pessoalmente uso:

function urlizer($str) {
	$str = preg_replace('/[áàãâä]/ui', 'a', $str);
	$str = preg_replace('/[éèêë]/ui', 'e', $str);
	$str = preg_replace('/[íìîï]/ui', 'i', $str);
	$str = preg_replace('/[óòõôö]/ui', 'o', $str);
	$str = preg_replace('/[úùûü]/ui', 'u', $str);
	$str = preg_replace('/[ç]/ui', 'c', $str);
	$str = preg_replace('/[^a-z0-9]/i', '-', $str);
	$str = preg_replace('/_+/', '-', $str);
	$str = rtrim($str,"-");
	return strtolower($str);
}

Veja se serve para seu uso. Sobre os 10 caracteres, achei estranho você dizer isso... eu uso para URLs até que longas (nomes de posts de blog, por exemplo).

Compartilhar este post


Link para o post
Compartilhar em outros sites
Em 12/07/2017 at 16:49, Gabriel Heming disse:

Acho que essa é uma das mais interessantes:

 

Obrigado pela resposta. Mas pelo que entendi, sua solução verifica apenas acentos de uma string, não os caracteres especiais retornados pela URL. Cada caractere com acentuação recebe um código. Por isso fiz da maneira acima...

 

Em 12/07/2017 at 17:08, Maykel-ctba disse:

Pessoalmente uso:


function urlizer($str) {
	$str = preg_replace('/[áàãâä]/ui', 'a', $str);
	$str = preg_replace('/[éèêë]/ui', 'e', $str);
	$str = preg_replace('/[íìîï]/ui', 'i', $str);
	$str = preg_replace('/[óòõôö]/ui', 'o', $str);
	$str = preg_replace('/[úùûü]/ui', 'u', $str);
	$str = preg_replace('/[ç]/ui', 'c', $str);
	$str = preg_replace('/[^a-z0-9]/i', '-', $str);
	$str = preg_replace('/_+/', '-', $str);
	$str = rtrim($str,"-");
	return strtolower($str);
}

Veja se serve para seu uso. Sobre os 10 caracteres, achei estranho você dizer isso... eu uso para URLs até que longas (nomes de posts de blog, por exemplo).

Maykel. Testei sua função mas não funcionou. Porque ela retorna sem os números e os caracteres, porém, se o código atribuído ao caractere especial conter letras, você não resolve o problema.

Exemplo: Parâmetro na URL = name_course= Curso de Sistemas de informação..
Retorno da sua função: curso-20de-20sistemas-20de-20informa-c3-a7-c3-a3o.

No caso do preg_replace o que quis dizer não é o parâmetro da função só aceitar 10 caracteres, mas sim o filtro que vai utilizar para o replace.

 

Por exemplo: o seu 

$str = preg_replace('/[áàãâä]/ui', 'a', $str);

O filtro '/[áàãâä]/ui' não pode conter mais que 10 caracteres.
 

Mas agradeço pela resposta. Se eu tiver dito algo errado...



[ATUALIZAÇÃO]

 

Meu código continha alguns símbolos repetidos. Corrigi e testei:

 

function remove_simbolos_acentos($string){
   $string = str_replace(array("%C3%A7", "%C3%87", "%C3%A3", "%C3%83", "%C3%A1", "%C3%81", "%C3%A0", "%C3%80", "%C3%A2", "%C3%82", "%C3%A4", "%C3%84",
       "%C3%A9","%C3%89","%C3%A8", "%C3%88", "%C3%AA", "%C3%8A", "%C3%AB", "%C3%8B", "%C3%AD", "%C3%8D", "%C3%AC", "%C3%8C", "%C3%AE", "%C3%8E", "%C3%AF", "%C3%8F",
       "%C3%B3", "%C3%93", "%C3%B2", "%C3%92", "%C3%B6", "%C3%96", "%C3%B5", "%C3%95", "%C3%B4", "%C3%94",
       "%C3%BA", "%C3%9A", "%C3%B9", "%C3%99", "%C3%BB", "%C3%9B", "%C3%BC", "%C3%9C"), 
            array("c", "C", "a", "A", "a", "A", "a", "A", "a", "A", "a", "A", "e", "E", "e", "E", "e", "E", "e", "E", "i", "I", "i", "I", "i", "I", "i", "I", "o", "O", "o", "O", 
            "o", "O", "o", "O", "o", "O", "u", "U", "u", "U", "u", "U", "u", "U"), $string);
   $string = trim(strtolower($string));
   $a = 'ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýýþÿŔŕ?';
   $b = 'aaaaaaaceeeeiiiidnoooooouuuuybsaaaaaaaceeeeiiiidnoooooouuuuyybyRr-';
   $string = strtr($string, utf8_decode($a), $b);
   $string = str_replace(".","-",$string);
   $string = str_replace(array('0', '1', '2', '3', '4', '5', '6', '7', '8', '9'), '', $string);
   $string = preg_replace( "/[^0-9a-zA-Z\.]+/",' ',$string);
   
   return utf8_decode(rtrim($string, "-"));
}


Agradeço novamente

Compartilhar este post


Link para o post
Compartilhar em outros sites

@DiogoD a função pega um range de caracteres através do literal em UTF-8 e não os caracteres em si. 

http://www.utf8-chartable.de/unicode-utf8-table.pl?start=128&number=128&utf8=string-literal&unicodeinhtml=hex

 

Quais tipos de caracteres especiais que ela não substitui?

Compartilhar este post


Link para o post
Compartilhar em outros sites

@DiogoD acabei de testar aqui, e não trocou os números...

$str = "Curso de Sistemas de informação";
echo urlizer($str); // * curso-de-sistemas-de-informacao

Ele está inserindo os números porque você não tratou a URL que vem do GET antes. Tente usar urldecode antes de jogar a string para a função!

Compartilhar este post


Link para o post
Compartilhar em outros sites

  • Conteúdo Similar

    • Por landerbadi
      Boa tarde pessoal. Estou tentado fazer uma consulta no banco de dados porém estou tendo dificuldades. Tenho uma tabela chamada "itens" com os seguintes campos: id, item, ativo. Nela tem cadastrado vários itens. No campo ativo eu coloco a letra "S" para informar que este item está ativo no sistema. Por exemplo: 1, casa, S 2, mesa, S 3, cama, S 4, moto S 5, rádio O quinto registro "radio" não está ativo no sistema pois não tem um "S" no campo ativo. E outra tabela chamada "produtos" com os seguintes campos (id, item1, item2, item3) com os seguintes registros: 1, casa, mesa, moto 2, mesa, casa, cama 3, rádio, cama, mesa Eu preciso fazer uma busca na tabela produtos da seguinte maneira: Eu escolho um registro na tabela "itens", por exemplo "mesa". Preciso fazer com que o php me liste todos os registros da tabela "produtos" que contenham a palavra "mesa". Até aqui tudo bem eu consigo listar. Estou fazendo assim: <?php $item = "mesa" $sql = mysqli_query($conn, "SELECT * FROM produtos WHERE item1 LIKE '$item' OR item2 LIKE '$item' OR item3 LIKE '$item' LIMIT 10"); while($aux = mysqli_fetch_assoc($sql)) { $id = $aux["id"]; $item1 = $aux["item1"]; $item2 = $aux["item2"]; $item3 = $aux["item3"]; echo $id . " - " . $item1 . ", " . $item2 . ", " $item3 . "<br>"; } ?> O problema é que está listando todos os registros que contém o item mesa. Eu preciso que o php verifique os demais item e me liste somente os registro em que todos os registros estejam ativos no sistema. No exemplo acima ele não deveria listar o registro 3. pois nesse registro contém o item "radio" e este item não está ativo no sistema. Ou seja, o registro "radio" na tabela itens não possui um "S" na coluna "ativo". Alguém sabe como resolver isso?
    • Por ILR master
      Fala galera.
      Espero que todos estejam bem.
      Seguinte: Tenho um arquivo xml onde alguns campos estão com : (dois pontos), como o exemplo abaixo:
       
      <item>
      <title>
      d sa dsad sad sadasdas
      </title>
      <link>
      dsadas dsa sad asd as dsada
      </link>
      <pubDate>sadasdasdsa as</pubDate>
      <dc:creator>
      d sad sad sa ad as das
      </dc:creator>
      </item>
       
      Meu código:
       
      $link = "noticias.xml"; 
      $xml = simplexml_load_file($link); 
      foreach($xml -> channel as $ite) {     
           $titulo = $ite -> item->title;
           $urltitulo = $ite -> item->link;
           print $urltitulo = $ite -> item->dc:creator;
      } //fim do foreach
      ?>
       
      Esse campo dc:creator eu não consigo ler. Como faço?
       
      Agradeço quem puder me ajudar.
       
      Abs
       
       
    • Por First
      Olá a todos!
       
      Eu estou criando um sistema do zero mas estou encontnrando algumas dificuldades e não estou sabendo resolver, então vim recorrer ajuda de vocês.
      Aqui está todo o meu código: https://github.com/PauloJagata/aprendizado/
       
      Eu fiz um sistema de rotas mas só mostra o conteúdo da '/' não sei porque, quando eu tento acessar o register nada muda.
      E eu também quero que se não estiver liberado na rota mostra o erro de 404, mas quando eu tento acessar um link inválido, nada acontece.
      Alguém pode me ajudar com isso? E se tiver algumas sugestão para melhoria do código também estou aceitando.
       
       
      Desde já, obrigado.
    • Por landerbadi
      Olá pessoal, boa tarde
       
      Tenho uma tabela chamada "produtos" com os seguintes campos (id, produto) e outra tabela chamada "itens" com os seguintes campos (id, prod_01, prod_02, prod_03, prod_04).
       
      Na tabela produtos eu tenho cadastrado os seguintes produtos: laranja, maçã, uva, goiaba, arroz, feijão, macarrão, etc.
       
      Na tabela itens eu tenho cadastrado os itens da seguinte maneira:
       
      1, laranja, uva, arroz, feijão;
      2, maçã, macarrão, goiaba, uva;
      3, arroz, feijão, maçã, azeite
       
      Meu problema é o seguinte: 
      Eu escolho um produto da tabela "produtos", por exemplo "uva".  Preciso fazer uma consulta na tabela "itens" para ser listado todos os registros que contenham o produto "uva" e que todos os demais produtos estejam cadastrados na tabela "produtos".
       
      No exemplo acima seria listado apenas dois registros, pois o terceiro registro não contém o produto "uva". 
       
      Alguém pode me ajudar? Pois estou quebrando a cabeça a vários dias e não consigo achar uma solução.
    • Por landerbadi
      Boa tarde pessoal. Estou tentado fazer uma consulta no banco de dados porém estou tendo dificuldades. Tenho uma tabela chamada "itens" com os seguintes campos: id, item, plural, ativo. Nela tem cadastrado vários itens e seu respectivo plural. No campo ativo eu coloco a letra "S" para informar que esta palavra está ativa no sistema. Por exemplo: 1, casa, casas, S 2, mesa, mesas, S 3, cama, camas, S 4, moto, motos, S 5, rádio, rádios O quinto registro "radio" não está ativo no sistema pois não tem um "S" no campo ativo. E outra tabela chamada "variações" com os seguintes campos (id, item1, item2, item3) com os seguintes registros: 1, casa, camas, moto 2, mesas, casas, radio 3, rádio, cama, mesa Eu preciso fazer uma busca na tabela variações da seguinte maneira: Eu escolho um registro na tabela "itens", por exemplo "casa". Preciso fazer com que o php me liste todos os registros da tabela "variações" que contenham a palavra "casa". Porém se tiver algum registro com a palavra "casas" também tem que ser listado. Neste caso ele irá encontrar dois registros. Agora eu preciso que o php verifique os demais itens e faça a listagem apenas dos item que estão ativos (que contenham um "S" no campo ativo. Neste caso ele irá encontrar apenas um registro, pois o segundo registro contém a palavra "rádio". E "rádio" não está ativo na tabela itens. Como faço isso?
×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.