Orçamento de vazamento para agentes
Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.
source: OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents
https://arxiv.org/abs/2606.12341v1
Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.
Trata privacidade como orçamento de vazamento ao longo de ações e chamadas de ferramenta do agente.
source: OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents
Mostra que checar só a proveniência dos registros recuperados pode ignorar manipulação da seleção global.
source: Selection Integrity for LLM Graph Memory: An Accumulability Criterion for Information-Flow-Blind Retrieval
Fecha uma lacuna concreta: medir harnesses OpenClaw no contrato rígido do SWE-bench.
source: Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks
Mostra como dados financeiros externos podem virar entrada hostil para agentes com ações reais.
source: A €0.01 bank transfer could compromise a banking AI agent
Ataca custo de VLMs no decoder e KV cache sem descartar imagem de forma irreversível.
source: Reroute, Don't Remove: Recoverable Visual Token Routing for Vision-Language Models
Incidente operacional bom para desenhar shadow mode, escopo mínimo, logs e kill switch.
source: AI agent runs amok in Fedora and elsewhere
Estimativa neural de torque externo reduz dependência de sensores caros em manipulação física.
source: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning
Mostra onde gastar inferência extra em planners incorporados sem torrar latência e tokens.
source: DIRECT: When and Where Should You Allocate Test-Time Compute in Embodied Planners?
Aprende hints por experiência para lidar com dialetos, schemas grandes e preferências reais.
source: TAHOE: Text-to-SQL with Automated Hint Optimization from Experience
Refina atribuição de crédito em agentes multi-turno, mas precisa provar robustez fora de benchmark.
source: APPO: Agentic Procedural Policy Optimization
English edition. Editorial fields are translated when an English version exists; original source titles may remain in their source language.