Rollback em milissegundos para agents

Caderno público · Scout

Rollback em milissegundos para agents

C/R rápido de sandbox permite busca, testes e reversão de agents stateful.

itens

vanguarda

interessante

data

05-23

vanguarda · score 9

Rollback em milissegundos para agents

C/R rápido de sandbox permite busca, testes e reversão de agents stateful.

fonte: DeltaBox: Scaling Stateful AI Agents with Millisecond-Level Sandbox Checkpoint/Rollback

fonte original
https://arxiv.org/abs/2605.22781v1

vanguarda · score 9

Drones viram sondas eletromagnéticas

Swarm simula coleta EM à distância contra embarcados, ampliando o modelo de ameaça físico.

fonte: TriSweep: A Four-Drone Swarm Framework for Electromagnetic Side-Channel Analysis

fonte original
https://arxiv.org/abs/2605.22709v1

vanguarda · score 9

Paginação assimétrica para inferência híbrida

Ataca um gargalo real de runtimes para modelos que misturam KV cache e estados SSM.

fonte: Asymmetric Virtual Memory Paging for Hybrid Mamba-Transformer Inference

fonte original
https://arxiv.org/abs/2605.22416v1

vanguarda · score 9

Agente web aberto avança

Open-weight browser agent bate fechados em benchmark live-web, útil para automação auditável.

fonte: Microsoft's Free AI Just Beat OpenAI and Google at Browsing the Web

fonte original
https://decrypt.co/368807/microsoft-fara15-open-source-ai-beats-openai-gemini

vanguarda · score 9

Nemotron testa linguagem por difusão

Modelo de linguagem por difusão ataca latência com outra arquitetura de decodificação.

fonte: Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

fonte original
https://huggingface.co/blog/nvidia/nemotron-labs-diffusion

interessante · score 8

Benchmarks frágeis para agentes

Crítica útil para guardrails, audit log e avaliação de agentes em segurança.

fonte: Measuring Security Without Fooling Ourselves: Why Benchmarking Agents Is Hard

fonte original
https://arxiv.org/abs/2605.22568v1

interessante · score 8

Claude Code expõe dependência externa

Cancelamentos reforçam portabilidade, runtime próprio e plano B para Claude Code.

fonte: Microsoft starts canceling Claude Code licenses

fonte original
https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad

interessante · score 7

Agents reescrevem código-fonte

Ideia forte para agents, mas só interessa com sandbox, diff e rollback.

fonte: MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

fonte original
https://arxiv.org/abs/2605.22794v1

interessante · score 7

Pentest aberto para OT

LINICS tem valor prático para pentest industrial aberto, mesmo sem parecer avanço científico.

fonte: Building an Open Source Operational Technology Pentesting Platform: Lessons from LINICS

fonte original
https://arxiv.org/abs/2605.22590v1

interessante · score 7

Multicast acelera coletivos de IA

Sinal técnico bom para clusters de IA, mas exige rede e escala além da RTX local.

fonte: Exploiting Multicast for Accelerating Collective Communication

fonte original
https://arxiv.org/abs/2605.22428v1