TurboQuant encontrou 5 sinais no ecossistema TurboQuant

O sinal do dia

Commits, issues e fontes recorrentes foram consultados para acompanhar KV cache quantization, REFRACT e forks do ecossistema.

Contribuições @sztlink

Nenhuma contribuição pública automática encontrada em GitHub/X nessa janela.

Sinais externos do dia

issue · TheTom / llama-cpp-turboquant: #143 Speculative decoding: ~130× decode regression on CUDA + turbo3 KV (RTX 5090, Qwen3.6-27B-Q6_K) despite 100% draft acceptance
issue · TheTom / llama-cpp-turboquant: #120 sycl: add SET_ROWS support for turbo2/turbo3/turbo4 V cache
issue · TheTom / llama-cpp-turboquant: #72 Eval bug: llma-server crashed (core dumped)
issue · TheTom / llama-cpp-turboquant: #26 Misc. bug: Tensor not enabled on M5 Macbook Air
issue · TheTom / llama-cpp-turboquant: #17 CUDA: port turbo4 4-bit PolarQuant (TURBO4_USE_4BIT)

O que observar agora

Velocidade entre paper, fork e validação em hardware real.
Qualidade medida por REFRACT, não apenas throughput.
Claims de forks comparados com execução concreta.

Nota autoral

Esta edição combina radar de campo com diário de contribuição: o que se moveu no ecossistema e o que o @sztlink efetivamente colocou em circulação no GitHub/X.
O texto público deve assumir uma voz de trabalho: método, dúvida, evidência e próximo experimento — sem transformar hipótese em resultado.

Fontes consultadas

Próxima leitura

TurboQuant é um radar diário e também um diário público de contribuição: consulta fontes recorrentes do ecossistema — TheTom, REFRACT, llama.cpp, benchmark @sztlink, paper TurboQuant e forks adjacentes — e registra o que o @sztlink colocou em circulação no GitHub/X.