Guardrail vira alvo de DoS
Injeções podem explorar o próprio guardrail de agentes para negar serviço.
source: From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails
https://arxiv.org/abs/2606.14517v1
Injeções podem explorar o próprio guardrail de agentes para negar serviço.
Injeções podem explorar o próprio guardrail de agentes para negar serviço.
source: From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails
Taxonomia longitudinal de runtime agente em produção; encaixa direto em audit log, guardrails e Portal AYA.
source: When Errors Become Narratives: A Longitudinal Taxonomy of Silent Failures in a Production LLM Agent Runtime
Ataca a lacuna entre prova verificável e matemática valiosa, ponto quente pós-assistentes.
source: Flood and Harvest: The Provable Necessity of Trivia for Generating Valuable Mathematics via the Lens of Language Generation in the Limit
Mapeia heads de VLM que alinham texto a regiões visuais; forte para interpretabilidade.
source: Gaze Heads: How VLMs Look at What They Describe
Isola memória, reflexão e ação em agentes, útil para auditar arquitetura antes de automatizar escrita real.
source: AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled Composition
Mostra que self-DPO guiado por verificador pode regredir em tarefas novas.
source: When Good Verifiers Go Bad: Self-Improving VLMs Can Regress on New Tasks
Benchmark multi-host tenta medir capacidades ofensivas de IA em ambientes reproduzíveis.
source: AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges
Mostra vibração acústica como vetor físico contra câmeras usadas por visão computacional.
source: Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications
Mapeia scripts que detectam navegadores automatizados e distorcem medições.
source: Detecting Bot Detection: Prevalence, Techniques, and Implications for Web Measurement Research
Defende análise específica para segurança de redes quantizadas em aceleradores de borda.
source: Breaking TinyML: Why Quantized Neural Networks Need Domain-Specific Security Analysis
English edition. Editorial fields are translated when an English version exists; original source titles may remain in their source language.