O sinal do dia
Registro autoral do que foi desenvolvido ou publicado no dia anterior, cruzado com sinais das fontes recorrentes do ecossistema.
Contribuições @sztlink
- commit · sztlink / turboquant-cuda-bench: Fix KVFidelity report parsing for nested fences
- commit · sztlink / turboquant-cuda-bench: Add reviewed KVFidelity hold-out result
- commit · sztlink / turboquant-cuda-bench: Add KVFidelity hold-out protocol
- commit · sztlink / turboquant-cuda-bench: Add trace-bound KVFidelity review overrides
- commit · sztlink / turboquant-cuda-bench: Update KVFidelity note with corrected severity curve
- commit · sztlink / turboquant-cuda-bench: Guard KVFidelity review metadata reuse
- commit · sztlink / turboquant-cuda-bench: Add KVFidelity comparator v2 note
- commit · sztlink / turboquant-cuda-bench: Review KVFidelity v2 low-confidence drifts
- commit · sztlink / turboquant-cuda-bench: Add KVFidelity comparator v2 draft
- commit · sztlink / turboquant-cuda-bench: Add wide KVFidelity stateful sweep result
Sinais externos do dia
- issue · TheTom / llama-cpp-turboquant: #133 Describe how this project differs from the fork in the README
- issue · TheTom / llama-cpp-turboquant: #132 CUDA: turbo2 decode regression on MoE — VEC/MMA dispatch gap widens with upstream optimizations
- issue · TheTom / llama-cpp-turboquant: #131 CUDA: turbo2 decode regression on MoE models — VEC/MMA dispatch gap widens with upstream optimizations
- issue · TheTom / llama-cpp-turboquant: #130 CUDA: q8_0/q8_0 KV cache fails to create context on Qwen3.5 9B hybrid (head_dim=256)
- issue · TheTom / llama-cpp-turboquant: #128 Can someone help me with building AMD HIP version on windows?
- issue · TheTom / turboquant_plus / REFRACT: #89 Consider proper attribution for EDEN quantization
O que observar agora
- Velocidade entre paper, fork e validação em hardware real.
- Qualidade medida por REFRACT, não apenas throughput.
- Claims de forks comparados com execução concreta.
Nota autoral
- Esta edição combina radar de campo com diário de contribuição: o que se moveu no ecossistema e o que o @sztlink efetivamente colocou em circulação no GitHub/X.
- O texto público deve assumir uma voz de trabalho: método, dúvida, evidência e próximo experimento — sem transformar hipótese em resultado.
Fontes consultadas
- TheTom / llama-cpp-turboquant
- TheTom / turboquant_plus / REFRACT
- llama.cpp discussion #20969
- sztlink / turboquant-cuda-bench
- TurboQuant paper
Próxima leitura
TurboQuant é um radar diário e também um diário público de contribuição: consulta fontes recorrentes do ecossistema — TheTom, REFRACT, llama.cpp, benchmark @sztlink, paper TurboQuant e forks adjacentes — e registra o que o @sztlink colocou em circulação no GitHub/X.