人間は言語を扱う領域に関しては llm と割と似てるらしいんだけど、どうもそこで思考してるわけではないらしいというのが報告されてた気がする。

多分言語モデルのベースの訓練の仕組みを考えると、長ーい会話履歴は本来の訓練の範疇から外れてくるはずなんですよね。まあ長時間タスクの訓練はどんどん行われているので考慮されてないわけではないんだけど、本来性能が高い領域からは外れてるはずなので、性能がどんどん下がっていくはず...

gpsnmeajp 3 days ago

おそらく本当は会話をしてはいけないんだろう。ユーザーから見た体験は会話でいいんだけど、言語モデル的には常にワンショットの出力になるような仕組み作りをしてあげればこういうのは多分減るだろうと思う。というのも直前までの会話の履歴を真似してしまった結果がこういう挙動なので。

gpsnmeajp 3 days ago

普段ものすごく賢いのに、あらゆる面でごくごく稀に確率的な文字列生成器なんだなっていう顔が出てくることはやっぱりある

gpsnmeajp 3 days ago

言語モデルは便宜上強化学習で訓練されてユーザーの発言とアシスタントの発言を区別するけど、実際のところそれはトークン列でしかないので、追加訓練されたそのトークン列を自分で生成してしまうと、その後の処理ではマジで自分でも区別がつかないっていう状態になるようだ。

gpsnmeajp 3 days ago

LLMを使う以上絶対に起きうることなんだろうなくらいの感覚でいた方が良いような気がする。なので本来はこういうのを防ぐための仕組みを何か作んなきゃいけないんだろうな。

gpsnmeajp 3 days ago

どのモデルでも確率的に発生してるっぽい感じはある。ローカルモデルでも、クラウドのモデルでも割と報告があるし、私も稀に見かける。

gpsnmeajp 3 days ago

この手の現象が起きる原因として、温度 T で予測トークンがずれた結果、EOSが来るはずのところに来なくなってしまい、結果としてユーザー応答を続けて作ろうとしてしまうんじゃないかなと推測しています。 Instruction Tuningされたモデルを、jinjaテンプレート無しで動かしたときにこんな感じの出力が頻発した。

gpsnmeajp 3 days ago

ログの監視とか、遠隔メンテナンスとかそういったことをさせる仕組みは、ちょっと独立した仕組みとして欲しいかもしれないなとは思っている。昔考えたのは、記憶を極端に制限したエージェントをメンテナンスと緊急用として用意しておくというもの。ようはRAMディスク上で動くPEとかみたいなやつのイメージ。

gpsnmeajp 3 days ago

初期設定済んだ後に会話で立ち上げが始まるのは面白かったな。確かに将来のセットアップってこうあるべきだよな。