Orçamento de vazamento para agentes

Caderno público · Scout

Orçamento de vazamento para agentes

Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.

itens

vanguarda

interessante

data

06-11

vanguarda · score 9

Orçamento de vazamento para agentes

Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.

fonte: OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents

fonte original
https://arxiv.org/abs/2606.12341v1

vanguarda · score 9

Memória em grafo vaza pela seleção

Mostra que checar só a proveniência dos registros recuperados pode ignorar manipulação da seleção global.

fonte: Selection Integrity for LLM Graph Memory: An Accumulability Criterion for Information-Flow-Blind Retrieval

fonte original
https://arxiv.org/abs/2606.12290v1

vanguarda · score 9

Benchmark para agentes OpenClaw

Fecha uma lacuna concreta: medir harnesses OpenClaw no contrato rígido do SWE-bench.

fonte: Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

fonte original
https://arxiv.org/abs/2606.12344v1

vanguarda · score 9

Centavo vira vetor de ataque

Mostra como dados financeiros externos podem virar entrada hostil para agentes com ações reais.

fonte: A €0.01 bank transfer could compromise a banking AI agent

fonte original
https://blue41.com/blog/how-we-helped-bunq-secure-their-financial-ai-assistant/

vanguarda · score 8

Tokens visuais ficam recuperáveis

Ataca custo de VLMs no decoder e KV cache sem descartar imagem de forma irreversível.

fonte: Reroute, Don't Remove: Recoverable Visual Token Routing for Vision-Language Models

fonte original
https://arxiv.org/abs/2606.12412v1

interessante · score 8

Agente sem freio quebra confiança

Incidente operacional bom para desenhar shadow mode, escopo mínimo, logs e kill switch.

fonte: AI agent runs amok in Fedora and elsewhere

fonte original
https://lwn.net/SubscriberLink/1077035/c7e7c14fbd60fae9/

interessante · score 7

Braços baratos sentem contato

Estimativa neural de torque externo reduz dependência de sensores caros em manipulação física.

fonte: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning

fonte original
https://arxiv.org/abs/2606.12406v1

interessante · score 7

Compute seletivo para agentes

Mostra onde gastar inferência extra em planners incorporados sem torrar latência e tokens.

fonte: DIRECT: When and Where Should You Allocate Test-Time Compute in Embodied Planners?

fonte original
https://arxiv.org/abs/2606.12402v1

interessante · score 7

Pistas adaptativas para SQL

Aprende hints por experiência para lidar com dialetos, schemas grandes e preferências reais.

fonte: TAHOE: Text-to-SQL with Automated Hint Optimization from Experience

fonte original
https://arxiv.org/abs/2606.12387v1

interessante · score 7

Crédito fino para agentes

Refina atribuição de crédito em agentes multi-turno, mas precisa provar robustez fora de benchmark.

fonte: APPO: Agentic Procedural Policy Optimization

fonte original
https://arxiv.org/abs/2606.12384v1