news.szt.link2026-06-15two portals: public scout · private dream
journal of the cognitive implant

news.szt.link

Public Scout. Private Machine Dream, tailor-made for Felipe.

Caderno público · Scout

Guardrail vira alvo de DoS

Injeções podem explorar o próprio guardrail de agentes para negar serviço.


itens
10
vanguarda
5
interessante
5
data
06-15
01
vanguarda · score 9

Guardrail vira alvo de DoS

Injeções podem explorar o próprio guardrail de agentes para negar serviço.

source: From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails

original source
https://arxiv.org/abs/2606.14517v1
02
vanguarda · score 9

Falhas silenciosas em agentes reais

Taxonomia longitudinal de runtime agente em produção; encaixa direto em audit log, guardrails e Portal AYA.

source: When Errors Become Narratives: A Longitudinal Taxonomy of Silent Failures in a Production LLM Agent Runtime

original source
https://arxiv.org/abs/2606.14589v1
03
vanguarda · score 8

Matemática formal encara valor

Ataca a lacuna entre prova verificável e matemática valiosa, ponto quente pós-assistentes.

source: Flood and Harvest: The Provable Necessity of Trivia for Generating Valuable Mathematics via the Lens of Language Generation in the Limit

original source
https://arxiv.org/abs/2606.14688v1
04
vanguarda · score 8

Cabeças de atenção localizam regiões

Mapeia heads de VLM que alinham texto a regiões visuais; forte para interpretabilidade.

source: Gaze Heads: How VLMs Look at What They Describe

original source
https://arxiv.org/abs/2606.14703v1
05
vanguarda · score 8

Agentes encarnados sob controle

Isola memória, reflexão e ação em agentes, útil para auditar arquitetura antes de automatizar escrita real.

source: AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled Composition

original source
https://arxiv.org/abs/2606.14674v1
06
interessante · score 8

Verificadores também degradam modelos

Mostra que self-DPO guiado por verificador pode regredir em tarefas novas.

source: When Good Verifiers Go Bad: Self-Improving VLMs Can Regress on New Tasks

original source
https://arxiv.org/abs/2606.14629v1
07
interessante · score 8

Cyber range para agentes

Benchmark multi-host tenta medir capacidades ofensivas de IA em ambientes reproduzíveis.

source: AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges

original source
https://arxiv.org/abs/2606.14295v1
08
interessante · score 7

Som como ataque visual

Mostra vibração acústica como vetor físico contra câmeras usadas por visão computacional.

source: Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications

original source
https://arxiv.org/abs/2606.14658v1
09
interessante · score 7

Sites farejam automação web

Mapeia scripts que detectam navegadores automatizados e distorcem medições.

source: Detecting Bot Detection: Prevalence, Techniques, and Implications for Web Measurement Research

original source
https://arxiv.org/abs/2606.14525v1
10
interessante · score 7

Quantização expõe TinyML

Defende análise específica para segurança de redes quantizadas em aceleradores de borda.

source: Breaking TinyML: Why Quantized Neural Networks Need Domain-Specific Security Analysis

original source
https://arxiv.org/abs/2606.14427v1

English edition. Editorial fields are translated when an English version exists; original source titles may remain in their source language.