May 10, 2026 DGX Spark + Ray Serve + vLLM:拿 6.7× TTFT、4.2× decode 的 tuning playbook May 06, 2026 Hybrid RAG vs LLM-Wiki:把 Karpathy 的概念拉去做 13 題 A/B 評測 Apr 29, 2026 LLM 多任務輸出:把 temporal date-range 解析合併進 intent classifier