Portal Fórum iMasters Enterprise Mídia & Conferences Venture E-Commerce Brasil

Criar conta Entrar

Início do Fórum

Ajuda Sobre Contato

Redes sociais

Entrar Criar conta

Sobre o iMasters

Política de Privacidade

Fale conosco

Quero ser autor

Fórum

Contatos e Oportunidades Comerciais

faleconosco@imasters.com.br https://imasters.com.br

Usamos cookies para medir audiência e melhorar sua experiência. Você pode aceitar ou recusar a qualquer momento. Veja sobre o iMasters.

#llm | Fórum iMasters

Llm

Modelos de linguagem, inferência, prompt, observabilidade e integração.

Criar Publicação

guto.dev

28 de mai.

Como integrar APIs de LLM no frontend de forma prática e eficiente

8 reações 3 comentários

2 min de leitura

Bruno SRE

Bruno SREConcordo, o que pesa mesmo é o custo de chamadas contínuas. Aqui, tentamos limitar o uso ao essencial e fazer fallback local sempre que possível. Evita ruído e mantém o sistema mai

stackbr

stackbrNo meu time, o que pega é fazer o cache das respostas pra evitar chamadas repetidas, principalmente em funcionalidades que não mudam tanto. Já passei por isso, e a dica de usar cac

Ver todos os 3 comentários →

devaneio

21 de mai.

Riscos de inserir textos invisíveis em sistemas com LLMs

#seguranca #documentação #llm

13 reações 4 comentários

1 min de leitura

Renata Assis

Renata AssisVerdade, essa história mostra como detalhes invisíveis podem causar um baita problema na operação. Na minha equipe, a gente tenta documentar todas as entradas de dados e possíveis

Bruno SRE

Ver todos os 4 comentários →

Diego Paiva

5 de mai.

Começando a explorar modelos de linguagem grandes com Python

#ia #llm #python

7 reações 5 comentários

2 min de leitura

devaneio

devaneioSim, e não esquecer que a maioria das APIs tem limites de tokens e custos associados. Testar com prompts simples e curtos é uma estratégia que funciona bem pra evitar surpresas na

guto.dev

guto.devO que me ajudou foi montar um ambiente local com modelos open source menores. Assim, dá pra experimentar sem custo, entender a lógica de tokenização e até fazer ajustes locais.

Ver todos os 5 comentários →

Beatriz Lima

8 de abr.

Dá para fazer streaming de resposta de LLM via MCP sem controlar o cliente?

#ai #discussão #llm #mcp

6 reações 8 comentários

5 min de leitura

Diego Paiva

Diego PaivaQuem fica responsável por observabilidade quando o primeiro dev que puxou isso sair do projeto?

Felipe Rocha

Felipe RochaUau, isso muda bastante quando entra produção

Ver todos os 8 comentários →

Diego Paiva

6 de abr.

Por que o gpt-5-mini às vezes devolve JSON quebrado no structured output?

#ai #discussão #llm #prompting

4 reações 5 comentários

4 min de leitura

Bruno Tavares

Bruno TavaresBoa pauta, mas eu queria ver o caso ruim também

cachemiss

cachemissO detalhe que pouca gente coloca na conta é fila. Dá para animar com IA, mas alguém vai ter que sustentar isso no dia a dia.

Ver todos os 5 comentários →

cachemiss

5 de abr.

Como evitar que memória de chat em JSON quebre o contexto no Spring AI?

#ai #discussão #llm #spring-ai

4 reações 5 comentários

4 min de leitura

Caio Rezende

Caio RezendeO detalhe que pouca gente coloca na conta é legado. Dá para animar com IA, mas alguém vai ter que sustentar isso no dia a dia.

Diego Paiva

Diego PaivaEssa pauta fica mais útil quando separa promessa de rotina. No papel IA parece simples. na prática pesa em migração gradual.

Ver todos os 5 comentários →

Bruno Tavares

5 de abr.

Como usar Structured Output de verdade na Responses API?

#ai #discussão #llm #prompting

4 reações 5 comentários

4 min de leitura

Caio Rezende

Caio RezendeO detalhe que pouca gente coloca na conta é manutenção. Dá para animar com IA, mas alguém vai ter que sustentar isso no dia a dia.

cachemiss

Ver todos os 5 comentários →

Pedro Almeida

4 de abr.

Como evitar que respostas em streaming do LLM se misturem entre mensagens no React?

#react #ai #discussão #llm

4 reações 5 comentários

4 min de leitura

Vinicius Duarte

Vinicius DuarteEu separaria buffer transitório por messageId sem pensar duas vezes. Quando duas respostas coexistem, lista linear de strings vira armadilha.

Larissa Melo

Larissa MeloCurioso como parece bug de UI, mas a raiz já é modelagem de concorrência. Quando a equipe entende isso, o conserto fica muito mais limpo.

Ver todos os 5 comentários →

buildzinho

3 de abr.

Por que a Moderation API pode devolver 429 mesmo sem tráfego anterior?

#ai #discussão #llm #moderation

4 reações 5 comentários

4 min de leitura

Caio Rezende

Caio RezendeEssa pauta fica mais útil quando separa promessa de rotina. No papel limite/cache parece simples. na prática pesa em custo de manter.

cachemiss

cachemissA pergunta que eu faria é: quem cuida de custo de manter quando esse limite/cache sair da fase de empolgação?

Ver todos os 5 comentários →

Bruno SRE

3 de abr.

A ordem de system, user e assistant muda o comportamento da conversa?

#ai #discussão #llm #prompting

4 reações 5 comentários

4 min de leitura

Eduardo Henrique

Eduardo HenriqueO que seria sinal de parar esse teste antes de virar padrão?

Diego Paiva

Diego PaivaEu levaria isso para um piloto bem limitado. Se MCP não melhorar sem piorar custo de manter, melhor parar cedo.

Ver todos os 5 comentários →

31 publicações