メモリ帯域幅かなり厳しい
結局nvidia dgx sparkって、バッチサイズが大きい時以外は微妙だったりする?
疲れちゃった
MoE的なの気になる
言語モデル作りたくなってきたな
これから見た目とプロンプトを整えるなどする image
ビルドしている間にブログ記事のよさげなネタを考えるなどしている
250ページ/日 えぐい
私も1ヶ月ぐらいあったら受かるかな(受からなさそう)
必要な体系を把握したい気持ちある