Orçamento de vazamento para agentes
Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.
fonte: OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents
https://arxiv.org/abs/2606.12341v1
Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.
Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.
fonte: OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents
Mostra que checar só a proveniência dos registros recuperados pode ignorar manipulação da seleção global.
fonte: Selection Integrity for LLM Graph Memory: An Accumulability Criterion for Information-Flow-Blind Retrieval
Fecha uma lacuna concreta: medir harnesses OpenClaw no contrato rígido do SWE-bench.
fonte: Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks
Mostra como dados financeiros externos podem virar entrada hostil para agentes com ações reais.
fonte: A €0.01 bank transfer could compromise a banking AI agent
Ataca custo de VLMs no decoder e KV cache sem descartar imagem de forma irreversível.
fonte: Reroute, Don't Remove: Recoverable Visual Token Routing for Vision-Language Models
Incidente operacional bom para desenhar shadow mode, escopo mínimo, logs e kill switch.
fonte: AI agent runs amok in Fedora and elsewhere
Estimativa neural de torque externo reduz dependência de sensores caros em manipulação física.
fonte: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning
Mostra onde gastar inferência extra em planners incorporados sem torrar latência e tokens.
fonte: DIRECT: When and Where Should You Allocate Test-Time Compute in Embodied Planners?
Aprende hints por experiência para lidar com dialetos, schemas grandes e preferências reais.
fonte: TAHOE: Text-to-SQL with Automated Hint Optimization from Experience
Refina atribuição de crédito em agentes multi-turno, mas precisa provar robustez fora de benchmark.
fonte: APPO: Agentic Procedural Policy Optimization