lkjsxc / スク 2 months ago

バッチサイズが大きいと、毎回全部読み込むモデルの方がキャッシュに乗せやすいので有利か

lkjsxc / スク 2 months ago

あれ、逆か？

lkjsxc / スク 2 months ago

（と思ってるけど実際どうなのか知らない）

lkjsxc / スク 2 months ago

llama3 70bは全てのパラメータを毎回読み込む必要があるので、メモリの帯域幅で殴るゲームになる。対してgpt-oss 120bは毎回5b程度しか読み込まなくてもいいので嬉しい

lkjsxc / スク 2 months ago

無限に適当吐いてる

lkjsxc / スク 2 months ago

LLMでこれなら画像処理とかめちゃくちゃ速いんだろうな

lkjsxc / スク 2 months ago

てか金ない

lkjsxc / スク 2 months ago

私もNVIDIAのこれ欲しい。まともに使い倒せる自信ないからあれだけど

lkjsxc / スク 2 months ago

16窓の動画撮って記事書いたらバズりそう

lkjsxc / スク 2 months ago

これで消費電力めっちゃ低いんでしょ。最高じゃん

Load More → Loading...