O sinal do dia
Registro autoral do que foi desenvolvido ou publicado no dia anterior, cruzado com sinais das fontes recorrentes do ecossistema.
Contribuições @sztlink
- commit · sztlink / turboquant-cuda-bench: Add RealRAG 2Wiki sentence-compression gate
- commit · sztlink / turboquant-cuda-bench: Add RealRAG 2Wiki prompt-schema ablation
- commit · sztlink / turboquant-cuda-bench: Add RealRAG 2Wiki diagnostic analysis
- commit · sztlink / turboquant-cuda-bench: Add RealRAG 2Wiki generalization gate
- commit · sztlink / turboquant-cuda-bench: Add RealRAG HotpotQA AI adjudication draft
- commit · sztlink / turboquant-cuda-bench: Add RealRAG HotpotQA adjudication packet
- commit · sztlink / turboquant-cuda-bench: Add RealRAG HotpotQA local-judge audit
- commit · sztlink / turboquant-cuda-bench: Add RealRAG HotpotQA metric-audit pack
- commit · sztlink / turboquant-cuda-bench: Link RealRAG natural-retrieval gate in public docs
- commit · sztlink / turboquant-cuda-bench: Record RealRAG HotpotQA natural-retrieval gate
Sinais externos do dia
- issue · TheTom / llama-cpp-turboquant: #151 Compile bug:
- issue · TheTom / llama-cpp-turboquant: #148 Doubt from new readme.md
- issue · TheTom / llama-cpp-turboquant: #147 Misc. bug: current draft MTP implementation very slow input tokens digestion
- issue · TheTom / llama-cpp-turboquant: #120 sycl: add SET_ROWS support for turbo2/turbo3/turbo4 V cache
- issue · TheTom / llama-cpp-turboquant: #88 Eval bug: Vulkan turbo3 KV produces incoherent decode while HIP on same model is fine (7900 XTX, head_dim=128)
- issue · TheTom / llama-cpp-turboquant: #48 Compile bug: CUDA error: invalid use of ‘extern’ in linkage specification
- issue · TheTom / llama-cpp-turboquant: #39 Porting TurboQuant to Windows (MSVC): Compatibility fixes and Python IDs
O que observar agora
- Velocidade entre paper, fork e validação em hardware real.
- Qualidade medida por REFRACT, não apenas throughput.
- Claims de forks comparados com execução concreta.
Nota autoral
- Esta edição combina radar de campo com diário de contribuição: o que se moveu no ecossistema e o que o @sztlink efetivamente colocou em circulação no GitHub/X.
- O texto público deve assumir uma voz de trabalho: método, dúvida, evidência e próximo experimento — sem transformar hipótese em resultado.
Fontes consultadas
- TheTom / llama-cpp-turboquant
- TheTom / turboquant_plus / REFRACT
- llama.cpp discussion #20969
- sztlink / turboquant-cuda-bench
- TurboQuant paper
Próxima leitura
TurboQuant é um radar diário e também um diário público de contribuição: consulta fontes recorrentes do ecossistema — TheTom, REFRACT, llama.cpp, benchmark @sztlink, paper TurboQuant e forks adjacentes — e registra o que o @sztlink colocou em circulação no GitHub/X.