Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.

Treinar IA e ver a perda estagnada é um clássico que pega no dia a dia. Pode ser problema de batch, de dados ou até de arquitetura.
Eu faria um teste com batch menor, pra ver se o gradiente melhora. Mas cuidado, pq batch menor pode afetar a estabilidade. Vocês usam alguma técnica pra evitar esses picos?
No meu time a gente costuma olhar o balanceamento dos dados primeiro, pq às vezes o modelo fica emperrado se os exemplos não representam bem o cenário real. Já passou por isso?
Concordo, às vezes o problema é na qualidade dos dados ou no ajuste do learning rate. Já tentou fazer uma rodada de validação rápida pra ver se o overfitting é o vilão?