O sinal do dia
Commits, issues e fontes recorrentes foram consultados para acompanhar KV cache quantization, REFRACT e forks do ecossistema.
Contribuições @sztlink
- Nenhuma contribuição pública automática encontrada em GitHub/X nessa janela.
Sinais externos do dia
- commit · TheTom / llama-cpp-turboquant: Merge pull request #175 from kmehan/fix/recurrent-seq-rm-exact-match-abort
- issue · TheTom / llama-cpp-turboquant: #179 Eval bug: cudaGetLastError (c9aa86a7c), cmd_child_to_router:error (73eb521da)
- issue · TheTom / llama-cpp-turboquant: #102 Perfomance: CUDA turbo4/turbo4 shows severe generation slowdown at large contexts
- commit · TheTom / turboquant_plus / REFRACT: README: drop RotorQuant from adopters table
- commit · TheTom / turboquant_plus / REFRACT: README: add credited community adopters to Run It Today table
- commit · TheTom / turboquant_plus / REFRACT: README: note upstream llama.cpp Hadamard KV rotation (21038 + FWHT kernels)
- commit · TheTom / turboquant_plus / REFRACT: docs: fix relative links in benchmarks.md after move
- commit · TheTom / turboquant_plus / REFRACT: docs(readme): restructure around engine ecosystem table
- commit · TheTom / turboquant_plus / REFRACT: docs: move status history to docs/changelog.md
- commit · TheTom / turboquant_plus / REFRACT: docs: move MLX framework port section to docs/mlx-port.md
- commit · TheTom / turboquant_plus / REFRACT: docs: move benchmark tables to docs/benchmarks.md
- commit · TheTom / turboquant_plus / REFRACT: README: headline vLLM upstream TurboQuant merge (PR 38479)
- commit · TheTom / turboquant_plus / REFRACT: README: link lablup/mlxcel TurboQuant+ KV cache port
O que observar agora
- Velocidade entre paper, fork e validação em hardware real.
- Qualidade medida por REFRACT, não apenas throughput.
- Claims de forks comparados com execução concreta.
Nota autoral
- Esta edição combina radar de campo com diário de contribuição: o que se moveu no ecossistema e o que o @sztlink efetivamente colocou em circulação no GitHub/X.
- O texto público deve assumir uma voz de trabalho: método, dúvida, evidência e próximo experimento — sem transformar hipótese em resultado.
Fontes consultadas
- TheTom / llama-cpp-turboquant
- TheTom / turboquant_plus / REFRACT
- llama.cpp discussion #20969
- sztlink / turboquant-cuda-bench
- TurboQuant paper
Próxima leitura
TurboQuant é um radar diário e também um diário público de contribuição: consulta fontes recorrentes do ecossistema — TheTom, REFRACT, llama.cpp, benchmark @sztlink, paper TurboQuant e forks adjacentes — e registra o que o @sztlink colocou em circulação no GitHub/X.