Orçamento de vazamento para agentes

Caderno público · Scout

Orçamento de vazamento para agentes

Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.

itens

vanguarda

interessante

data

06-11

vanguarda · score 9

Orçamento de vazamento para agentes

Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.

source: OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents

original source
https://arxiv.org/abs/2606.12341v1

vanguarda · score 9

Memória em grafo vaza pela seleção

Mostra que checar só a proveniência dos registros recuperados pode ignorar manipulação da seleção global.

source: Selection Integrity for LLM Graph Memory: An Accumulability Criterion for Information-Flow-Blind Retrieval

original source
https://arxiv.org/abs/2606.12290v1

vanguarda · score 9

Benchmark para agentes OpenClaw

Fecha uma lacuna concreta: medir harnesses OpenClaw no contrato rígido do SWE-bench.

source: Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

original source
https://arxiv.org/abs/2606.12344v1

vanguarda · score 9

Centavo vira vetor de ataque

Mostra como dados financeiros externos podem virar entrada hostil para agentes com ações reais.

source: A €0.01 bank transfer could compromise a banking AI agent

original source
https://blue41.com/blog/how-we-helped-bunq-secure-their-financial-ai-assistant/

vanguarda · score 8

Tokens visuais ficam recuperáveis

Ataca custo de VLMs no decoder e KV cache sem descartar imagem de forma irreversível.

source: Reroute, Don't Remove: Recoverable Visual Token Routing for Vision-Language Models

original source
https://arxiv.org/abs/2606.12412v1

interessante · score 8

Agente sem freio quebra confiança

Incidente operacional bom para desenhar shadow mode, escopo mínimo, logs e kill switch.

source: AI agent runs amok in Fedora and elsewhere

original source
https://lwn.net/SubscriberLink/1077035/c7e7c14fbd60fae9/

interessante · score 7

Braços baratos sentem contato

Estimativa neural de torque externo reduz dependência de sensores caros em manipulação física.

source: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning

original source
https://arxiv.org/abs/2606.12406v1

interessante · score 7

Compute seletivo para agentes

Mostra onde gastar inferência extra em planners incorporados sem torrar latência e tokens.

source: DIRECT: When and Where Should You Allocate Test-Time Compute in Embodied Planners?

original source
https://arxiv.org/abs/2606.12402v1

interessante · score 7

Pistas adaptativas para SQL

Aprende hints por experiência para lidar com dialetos, schemas grandes e preferências reais.

source: TAHOE: Text-to-SQL with Automated Hint Optimization from Experience

original source
https://arxiv.org/abs/2606.12387v1

interessante · score 7

Crédito fino para agentes

Refina atribuição de crédito em agentes multi-turno, mas precisa provar robustez fora de benchmark.

source: APPO: Agentic Procedural Policy Optimization

original source
https://arxiv.org/abs/2606.12384v1

English edition. Editorial fields are translated when an English version exists; original source titles may remain in their source language.