Agentes precisam recusar acesso

Caderno público · Scout

Agentes precisam recusar acesso

Mede se agentes respeitam sinais de negação quando as credenciais ainda funcionam.

itens

vanguarda

interessante

data

06-07

vanguarda · score 9

Agentes precisam recusar acesso

Mede se agentes respeitam sinais de negação quando as credenciais ainda funcionam.

source: Will the Agent Recuse Itself? Measuring LLM-Agent Compliance with In-Band Access-Deny Signals

original source
https://arxiv.org/abs/2606.06460v1

vanguarda · score 9

WebMCP abre ataque de ferramentas

Mostra uma superfície nova de ataque para agentes que consomem ferramentas web via MCP.

source: WebMCP Tool Surface Poisoning: Runtime Manipulation Attacks on LLM Agents

original source
https://arxiv.org/abs/2606.06387v1

vanguarda · score 9

Agente expõe credenciais GitHub

Prompt injection em agentes de código toca o eixo Claude Code, secrets e guardrails de runtime.

source: Claude Code Vulnerability Could Let Attackers Steal Credentials From GitHub, Says Microsoft

original source
https://decrypt.co/370238/claude-code-vulnerability-attackers-steal-credentials-github-microsoft

vanguarda · score 8

Adapters gerados para repositórios vivos

Troca contexto longo por LoRAs gerados para bases de código que mudam.

source: Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models under Software Evolution

original source
https://arxiv.org/abs/2606.06492v1

vanguarda · score 8

NVSHMEM ganha raio X sistêmico

Mapeia memória simétrica e operações iniciadas pela GPU, camada rara para cluster e inferência distribuída.

source: Demystifying NVSHMEM: A System-Level Analysis on Symmetric Memory and Device-Initiated Operations in GPU Communication

original source
https://arxiv.org/abs/2606.05951v1

interessante · score 8

Atenção esparsa compartilha roteamento

Reusar roteamento entre camadas reduz custo de contexto longo, bom sinal para inferência.

source: You Only Index Once: Cross-Layer Sparse Attention with Shared Routing

original source
https://arxiv.org/abs/2606.06467v1

interessante · score 7

Containment por política em Rust

Isolamento programável conversa direto com agents e guardrails reais.

source: microsoft/mxc

original source
https://github.com/microsoft/mxc

interessante · score 7

CodeLLMs podados contra detecção

Avalia se compressão mantém mutação de código usada para evasão, bom para threat modeling local.

source: SecRL-Prune: Structured Reinforcement Learning-Based Pruning of CodeLLMs for Preserving Adversarial Code Mutation

original source
https://arxiv.org/abs/2606.06254v1

interessante · score 7

Edição agente testa filtros visuais

MCTS guia edições para achar falhas em classificadores de imagem, útil para pipelines visuais.

source: RedEdit: Agentic Red-Teaming of Image Safety Classifiers via MCTS-Guided Photo-Editing

original source
https://arxiv.org/abs/2606.06140v1

interessante · score 7

CUDA automático começa pela desotimização

Workflow de desotimizar e reotimizar é um padrão útil para portar kernels com LLM.

source: LLM-Based Porting of Optimized C++ to CUDA Through Deoptimization and Reoptimization

original source
https://arxiv.org/abs/2606.06063v1

English edition. Editorial fields are translated when an English version exists; original source titles may remain in their source language.