Guardrail vira alvo de DoS
Injeções podem explorar o próprio guardrail de agentes para negar serviço.
fonte: From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails
https://arxiv.org/abs/2606.14517v1
Injeções podem explorar o próprio guardrail de agentes para negar serviço.
Injeções podem explorar o próprio guardrail de agentes para negar serviço.
fonte: From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails
Taxonomia longitudinal de runtime agente em produção; encaixa direto em audit log, guardrails e Portal AYA.
fonte: When Errors Become Narratives: A Longitudinal Taxonomy of Silent Failures in a Production LLM Agent Runtime
Ataca a lacuna entre prova verificável e matemática valiosa, ponto quente pós-assistentes.
fonte: Flood and Harvest: The Provable Necessity of Trivia for Generating Valuable Mathematics via the Lens of Language Generation in the Limit
Mapeia heads de VLM que alinham texto a regiões visuais; forte para interpretabilidade.
fonte: Gaze Heads: How VLMs Look at What They Describe
Isola memória, reflexão e ação em agentes, útil para auditar arquitetura antes de automatizar escrita real.
fonte: AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled Composition
Mostra que self-DPO guiado por verificador pode regredir em tarefas novas.
fonte: When Good Verifiers Go Bad: Self-Improving VLMs Can Regress on New Tasks
Benchmark multi-host tenta medir capacidades ofensivas de IA em ambientes reproduzíveis.
fonte: AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges
Mostra vibração acústica como vetor físico contra câmeras usadas por visão computacional.
fonte: Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications
Mapeia scripts que detectam navegadores automatizados e distorcem medições.
fonte: Detecting Bot Detection: Prevalence, Techniques, and Implications for Web Measurement Research
Defende análise específica para segurança de redes quantizadas em aceleradores de borda.
fonte: Breaking TinyML: Why Quantized Neural Networks Need Domain-Specific Security Analysis