Ir para conteúdo

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Yan Gabriel

Consulta de mais de 100.000 Linhas em tabela MySql usando PHP.

Recommended Posts

Olá!

 

Minha tabela possui mais de 100 mil registros e preciso capturar todos para a geração de um arquivo do tipo xlsx.

O esquema atual consiste em capturar esses dados e armazená-los em um único array de objetos para poupar processamento enquanto a conexão está aberta.

Após o fechamento da conexão, eu trato essas informações separando-as em outros arrays de objetos para gerar as estatísticas e colocá-las no arquivo xlsx.

 

Observações:

  1. Esse primeiro array de objetos armazena 16 campos da tabela para cada objeto.
  2. A velocidade de captura desses dados está em torno de 40 segundos(o que não é tão ruim pois a intensão é de processar esses dados durante a madrugada com o uso do crontab e do wget e disponibilizar os arquivos pela manhã).
  3. O grande problema está justamente no tratamento desse array porque preciso de vários laços para gerar as informações.
  4. Já estou utilizando a função: set_time_limit(0) do PHP para tornar o processamento possível.
  5. Por enquanto não estou usando a biblioteca PHPExcel, assim como nenhuma outra, porque quero testar o desempenho sem elas, tratar as informações que irão para o arquivo e... para não perder tempo à toa tendo um código maior para verificar.

 

Como faço para aumentar o desempenho do processamento?

Na última vez deixei processando por mais de 4 horas e disponibilizei 1GB de memória através do init_set('memory_limit', '1G') do PHP. E adivinhem? O processamento não ficou completo.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Jogar tudo pra memória pode ser o principal fator da lentidão. Se você puder processar as informações dentro do loop que busca os resultados, o uso de memória será bem menor.

 

Falando em código, em vez disto:

 

$dados = [];
// consulta
while ( fetch() )
{
    $dados[] = $dado_corrente;
}
 
// aqui $dados possui todos os registros

 

faça algo assim

 

while ( fetch() )
{
    // efetua os cálculos com o $dado_corrente;
}

 

Nesse segundo caso, não existiria $dados e todos os cálculos seriam feitos em um único loop, com menor uso de memória

 

A conexão ficará aberta por mais tempo, porém o uso de memória tende a ser bem menor que gerar um array com todos os dados

Compartilhar este post


Link para o post
Compartilhar em outros sites

Jogar tudo pra memória pode ser o principal fator da lentidão. Se você puder processar as informações dentro do loop que busca os resultados, o uso de memória será bem menor.

 

Falando em código, em vez disto:

$dados = [];
// consulta
while ( fetch() )
{
    $dados[] = $dado_corrente;
}
 
// aqui $dados possui todos os registros

faça algo assim

while ( fetch() )
{
    // efetua os cálculos com o $dado_corrente;
}

Nesse segundo caso, não existiria $dados e todos os cálculos seriam feitos em um único loop, com menor uso de memória

 

A conexão ficará aberta por mais tempo, porém o uso de memória tende a ser bem menor que gerar um array com todos os dados

 

Valeu! Mas isso não faria o banco de dados quebrar/interromper a conexão por causa do tempo?

Compartilhar este post


Link para o post
Compartilhar em outros sites

Valeu! Mas isso não faria o banco de dados quebrar/interromper a conexão por causa do tempo?

É possível alterar o timeout do MySQL. Não lembro de cabeça qual é a diretiva, mas dá pra mudar, sim.

Compartilhar este post


Link para o post
Compartilhar em outros sites

Solução:

 

Resolvi o problema usando a linguagem C++ para manipulação dos dados afim de gerar os arquivos .xlsx com as estatísticas pois essa tarefa é muito massante para o PHP que não foi feito para isso(só serve para manipulações em pequenas escalas, como por exemplo, exibir relatórios em uma painel de controle conforme for sendo solicitado com o auxílio ajax ao invés de tudo de uma vez só).

 

Percebam que se você chegar ao ponto de utilizar funções como set_time_limit, init_set('memory_limit', '1G') e entre outras é porque seu script(PHP, SQL ou até mesmo Javascript) não está bem formulado ou a linguagem não é a ideal para tal tarefa como no meu caso. Utilizá-las só vai atrasar sua dor de cabeça que com o tempo se tornará pior.

 

 

 

Por quê?

 

Lembrem-se que o meu caso é diferente do painel com relatórios citado acima. Para gerar o arquivo é necessário todas, repetindo, TODAS, as informações que correspondem a minha pesquisa SQL porque é assim que se gera estatística. Necessitamos de todos os dados disponíveis para conceder algo útil. O C++ é perfeito porque posso gerenciar a memória assim como outros recursos.

 

 

Agradeço a ajuda!

Compartilhar este post


Link para o post
Compartilhar em outros sites

  • Conteúdo Similar

    • Por ILR master
      Fala galera.
      Espero que todos estejam bem.
      Seguinte: Tenho um arquivo xml onde alguns campos estão com : (dois pontos), como o exemplo abaixo:
       
      <item>
      <title>
      d sa dsad sad sadasdas
      </title>
      <link>
      dsadas dsa sad asd as dsada
      </link>
      <pubDate>sadasdasdsa as</pubDate>
      <dc:creator>
      d sad sad sa ad as das
      </dc:creator>
      </item>
       
      Meu código:
       
      $link = "noticias.xml"; 
      $xml = simplexml_load_file($link); 
      foreach($xml -> channel as $ite) {     
           $titulo = $ite -> item->title;
           $urltitulo = $ite -> item->link;
           print $urltitulo = $ite -> item->dc:creator;
      } //fim do foreach
      ?>
       
      Esse campo dc:creator eu não consigo ler. Como faço?
       
      Agradeço quem puder me ajudar.
       
      Abs
       
       
    • Por First
      Olá a todos!
       
      Eu estou criando um sistema do zero mas estou encontnrando algumas dificuldades e não estou sabendo resolver, então vim recorrer ajuda de vocês.
      Aqui está todo o meu código: https://github.com/PauloJagata/aprendizado/
       
      Eu fiz um sistema de rotas mas só mostra o conteúdo da '/' não sei porque, quando eu tento acessar o register nada muda.
      E eu também quero que se não estiver liberado na rota mostra o erro de 404, mas quando eu tento acessar um link inválido, nada acontece.
      Alguém pode me ajudar com isso? E se tiver algumas sugestão para melhoria do código também estou aceitando.
       
       
      Desde já, obrigado.
    • Por landerbadi
      Olá pessoal, boa tarde
       
      Tenho uma tabela chamada "produtos" com os seguintes campos (id, produto) e outra tabela chamada "itens" com os seguintes campos (id, prod_01, prod_02, prod_03, prod_04).
       
      Na tabela produtos eu tenho cadastrado os seguintes produtos: laranja, maçã, uva, goiaba, arroz, feijão, macarrão, etc.
       
      Na tabela itens eu tenho cadastrado os itens da seguinte maneira:
       
      1, laranja, uva, arroz, feijão;
      2, maçã, macarrão, goiaba, uva;
      3, arroz, feijão, maçã, azeite
       
      Meu problema é o seguinte: 
      Eu escolho um produto da tabela "produtos", por exemplo "uva".  Preciso fazer uma consulta na tabela "itens" para ser listado todos os registros que contenham o produto "uva" e que todos os demais produtos estejam cadastrados na tabela "produtos".
       
      No exemplo acima seria listado apenas dois registros, pois o terceiro registro não contém o produto "uva". 
       
      Alguém pode me ajudar? Pois estou quebrando a cabeça a vários dias e não consigo achar uma solução.
×

Informação importante

Ao usar o fórum, você concorda com nossos Termos e condições.