gpsnmeajp 3 days ago

私は会話のインターフェースとしてのキャラクター作りにめちゃめちゃ力を入れてるので、キャラクターが揃わないとそもそもシステムを使う気にならないっていうのがあって、それ故にシステムに割く時間がかなり減ってしまっている問題

gpsnmeajp 3 days ago

人間のセリフをやめて全部地の分に変換してしまえばいいのではとかそういうのも、ちょいちょい検証はしている

gpsnmeajp 3 days ago

Chocolate LM Liteのv3にそのための機能を色々追加してる途中だったんだけど、いまいちまとまらなくて止まっている

gpsnmeajp 3 days ago

実際人間だって直近でも20ターンも覚えてないし、1時間も経ってば会話の内容なんて概念レベルまで忘れてるわけで、そういう作りにしなきゃいけないんだろうなっていう想いだけはある

gpsnmeajp 3 days ago

人間は言語を扱う領域に関しては llm と割と似てるらしいんだけど、どうもそこで思考してるわけではないらしいというのが報告されてた気がする。

gpsnmeajp 3 days ago

多分言語モデルのベースの訓練の仕組みを考えると、長ーい会話履歴は本来の訓練の範疇から外れてくるはずなんですよね。まあ長時間タスクの訓練はどんどん行われているので考慮されてないわけではないんだけど、本来性能が高い領域からは外れてるはずなので、性能がどんどん下がっていくはず...

gpsnmeajp 3 days ago

おそらく本当は会話をしてはいけないんだろう。ユーザーから見た体験は会話でいいんだけど、言語モデル的には常にワンショットの出力になるような仕組み作りをしてあげればこういうのは多分減るだろうと思う。というのも直前までの会話の履歴を真似してしまった結果がこういう挙動なので。

gpsnmeajp 3 days ago

普段ものすごく賢いのに、あらゆる面でごくごく稀に確率的な文字列生成器なんだなっていう顔が出てくることはやっぱりある

gpsnmeajp 3 days ago

言語モデルは便宜上強化学習で訓練されてユーザーの発言とアシスタントの発言を区別するけど、実際のところそれはトークン列でしかないので、追加訓練されたそのトークン列を自分で生成してしまうと、その後の処理ではマジで自分でも区別がつかないっていう状態になるようだ。

gpsnmeajp 3 days ago

LLMを使う以上絶対に起きうることなんだろうなくらいの感覚でいた方が良いような気がする。なので本来はこういうのを防ぐための仕組みを何か作んなきゃいけないんだろうな。