HuggingFace一覧

ローカル LLM 選び、もう「VRAM に入る一番デカいやつ」で決めるの卒業しよ? – whichllm を RTX 4060 Ti 16GB で測ってみた

ローカル LLM 選びを「VRAM に入る最大」から「ベンチ score × 推定 tok/s × quant × fit type」に切り替えると、選定がめちゃくちゃ楽になる。OSS CLI の whichllm を RTX 4060 Ti 16GB で実際に試した結果と、Windows 落とし穴・GPU 買い替えシミュレーションまでまとめた。