Auditoria falha em agentes delegados

Caderno público · Scout

Auditoria falha em agentes delegados

Mostra que logs comuns não provam quem delegou o quê em agents com ferramentas.

itens

vanguarda

interessante

data

06-09

vanguarda · score 9

Auditoria falha em agentes delegados

Mostra que logs comuns não provam quem delegou o quê em agents com ferramentas.

fonte: Observability for Delegated Execution in Agentic AI Systems

fonte original
https://arxiv.org/abs/2606.09692v1

vanguarda · score 9

Llama inteiro em um kernel

Megakernel CUDA autogerado é sinal forte para runtime local e inference engineering.

fonte: AutoMegaKernel: A Statically-Checked Agent Harness for Self-Retargeting Megakernel Synthesis

fonte original
https://arxiv.org/abs/2606.09682v1

vanguarda · score 8

Operadores neurais ganham topologia

Leva operator learning a complexos celulares e domínios não euclidianos.

fonte: Topological Neural Operators

fonte original
https://arxiv.org/abs/2606.09806v1

vanguarda · score 8

Memória é gargalo em vídeo

Estuda consistência entre segmentos em world models de vídeo, ponto crítico para cenas longas.

fonte: Echo-Memory: A Controlled Study of Memory in Action World Models

fonte original
https://arxiv.org/abs/2606.09803v1

vanguarda · score 8

Protocolo para agentes operacionais

Protocolo para agents com ferramentas e humano no loop tem encaixe direto em governança operacional.

fonte: Collaborative Human-Agent Protocol (CHAP)

fonte original
https://arxiv.org/abs/2606.09751v1

interessante · score 7

UE5 mede agentes visuais

Benchmark em ambiente interativo avalia VLMs além do primeiro acerto isolado.

fonte: OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics

fonte original
https://arxiv.org/abs/2606.09826v1

interessante · score 7

Inferência privada melhora no gargalo

FSS para LLMs mira o gargalo de não linearidades em inferência segura.

fonte: FuseFSS: Efficient Secure LLM Inference with Function Secret Sharing

fonte original
https://arxiv.org/abs/2606.09551v1

interessante · score 7

Divergência em RL de LLMs

Revê controle de divergência em RL off-policy, ponto crítico de estabilidade no pós-treino.

fonte: Rethinking the Divergence Regularization in LLM RL

fonte original
https://arxiv.org/abs/2606.09821v1

interessante · score 7

Agentes aprendem dialetos de simulação

Grounding em DSLs de simuladores é tooling real para agentes, não só prompt.

fonte: SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation

fonte original
https://arxiv.org/abs/2606.09774v1

interessante · score 7

Supply chain mira devs de IA

Ataques a ferramentas de dev podem capturar tokens e senhas usados em pipelines locais.

fonte: Microsoft's open source tools were hacked to steal passwords of AI developers

fonte original
https://techcrunch.com/2026/06/08/microsofts-open-source-tools-were-hacked-to-steal-passwords-of-ai-developers/