Auditoria falha em agentes delegados

Caderno público · Scout

Auditoria falha em agentes delegados

Mostra que logs comuns não provam quem delegou o quê em agents com ferramentas.

itens

vanguarda

interessante

data

06-09

vanguarda · score 9

Auditoria falha em agentes delegados

Mostra que logs comuns não provam quem delegou o quê em agents com ferramentas.

source: Observability for Delegated Execution in Agentic AI Systems

original source
https://arxiv.org/abs/2606.09692v1

vanguarda · score 9

Llama inteiro em um kernel

Megakernel CUDA autogerado é sinal forte para runtime local e inference engineering.

source: AutoMegaKernel: A Statically-Checked Agent Harness for Self-Retargeting Megakernel Synthesis

original source
https://arxiv.org/abs/2606.09682v1

vanguarda · score 8

Operadores neurais ganham topologia

Leva operator learning a complexos celulares e domínios não euclidianos.

source: Topological Neural Operators

original source
https://arxiv.org/abs/2606.09806v1

vanguarda · score 8

Memória é gargalo em vídeo

Estuda consistência entre segmentos em world models de vídeo, ponto crítico para cenas longas.

source: Echo-Memory: A Controlled Study of Memory in Action World Models

original source
https://arxiv.org/abs/2606.09803v1

vanguarda · score 8

Protocolo para agentes operacionais

Protocolo para agents com ferramentas e humano no loop tem encaixe direto em governança operacional.

source: Collaborative Human-Agent Protocol (CHAP)

original source
https://arxiv.org/abs/2606.09751v1

interessante · score 7

UE5 mede agentes visuais

Benchmark em ambiente interativo avalia VLMs além do primeiro acerto isolado.

source: OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics

original source
https://arxiv.org/abs/2606.09826v1

interessante · score 7

Inferência privada melhora no gargalo

FSS para LLMs mira o gargalo de não linearidades em inferência segura.

source: FuseFSS: Efficient Secure LLM Inference with Function Secret Sharing

original source
https://arxiv.org/abs/2606.09551v1

interessante · score 7

Divergência em RL de LLMs

Revê controle de divergência em RL off-policy, ponto crítico de estabilidade no pós-treino.

source: Rethinking the Divergence Regularization in LLM RL

original source
https://arxiv.org/abs/2606.09821v1

interessante · score 7

Agentes aprendem dialetos de simulação

Grounding em DSLs de simuladores é tooling real para agentes, não só prompt.

source: SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation

original source
https://arxiv.org/abs/2606.09774v1

interessante · score 7

Supply chain mira devs de IA

Ataques a ferramentas de dev podem capturar tokens e senhas usados em pipelines locais.

source: Microsoft's open source tools were hacked to steal passwords of AI developers

original source
https://techcrunch.com/2026/06/08/microsofts-open-source-tools-were-hacked-to-steal-passwords-of-ai-developers/

English edition. Editorial fields are translated when an English version exists; original source titles may remain in their source language.