O sinal do dia
Registro autoral do que foi desenvolvido ou publicado no dia anterior, cruzado com sinais das fontes recorrentes do ecossistema.
Contribuições @sztlink
- commit · sztlink / turboquant-cuda-bench: Add KVFidelity cross-GPU mini-check
- commit · sztlink / turboquant-cuda-bench: Add KVFidelity positioning one-pager
- commit · sztlink / turboquant-cuda-bench: Add KVFidelity related work positioning
- x · @sztlink / X: Related-work update: SciBORG (Muhoberac/Chopra et al., arXiv:2507.00081) explicitly uses "action trace fidelity" as an agent-benchmark dimension. KVFidelity sits in the broader tra
Sinais externos do dia
- commit · TheTom / llama-cpp-turboquant: fix(hip): add (turbo*, F16) template-instance .cu files to HIP build
- commit · TheTom / llama-cpp-turboquant: fix(perplexity): cast n_ctx * nv to size_t in KL logits save (#138)
- commit · TheTom / llama-cpp-turboquant: fix(fattn): add (turbo*, F16) template instantiations
- issue · TheTom / llama-cpp-turboquant: #139 Eval Bug: Broken reasoning and wrong language output with --threads 4
- issue · TheTom / llama-cpp-turboquant: #137 Eval bug: -ctk turbo3 -ctv turbo3 corrupts decode on Gemma 4 31B (Vulkan / RDNA 3.5 / GFX1151) — likely K head_dim 512 path, not ISWA
- issue · TheTom / llama-cpp-turboquant: #128 Can someone help me with building AMD HIP version on windows?
O que observar agora
- Velocidade entre paper, fork e validação em hardware real.
- Qualidade medida por REFRACT, não apenas throughput.
- Claims de forks comparados com execução concreta.
Nota autoral
- Esta edição combina radar de campo com diário de contribuição: o que se moveu no ecossistema e o que o @sztlink efetivamente colocou em circulação no GitHub/X.
- O texto público deve assumir uma voz de trabalho: método, dúvida, evidência e próximo experimento — sem transformar hipótese em resultado.
Fontes consultadas
- TheTom / llama-cpp-turboquant
- TheTom / turboquant_plus / REFRACT
- llama.cpp discussion #20969
- sztlink / turboquant-cuda-bench
- TurboQuant paper
Próxima leitura
TurboQuant é um radar diário e também um diário público de contribuição: consulta fontes recorrentes do ecossistema — TheTom, REFRACT, llama.cpp, benchmark @sztlink, paper TurboQuant e forks adjacentes — e registra o que o @sztlink colocou em circulação no GitHub/X.