kojira 3 weeks ago

あ、ログボしそこねたか

kojira 3 weeks ago

pytorchとかtensor rtとかコンテナビルドしまくって60GBくらい無駄になったのをさっき消した。でもストレージ1番食ってるのはLLMのモデル

kojira 3 weeks ago

そしてBlackwellで動かしてもnvfp4に対応してないんだ

kojira 3 weeks ago

pytorchで動かせるけどカーネルがBlackwellで動かないからちっとも速くならんのよね

kojira 3 weeks ago

まだやりかけだけどDGX sparkでvLLMとllama.cppでベンチマークしたリポジトリ見て。

GitHub

GitHub - kojira/vllm_gb10

Contribute to kojira/vllm_gb10 development by creating an account on GitHub.

kojira 3 weeks ago

DGX sparkでgpt-ossをnvfp4ではまだ動かせないんだよな

kojira 3 weeks ago

はらへったなあ

kojira 3 weeks ago

リニモは名古屋にあるけど鈍行

kojira 3 weeks ago

mix依頼が5本くらいたまってるや

kojira 3 weeks ago

Tiktokの方は結構バズったらしい

Load More → Loading...