LLM Doghouse作成開始
AIサーバーの音声+文字チャット機能を切り出して独自の路を歩ませることにしました。コンソールプログラムからUIに進化させます。といいつつ筆者はUIが苦手なのでデザインはダサダサです。
アプリ名はですね表題のとおり「LLM Doghouse」です。LM Studioと比べたら貧相な名前です。
一応動くところまで作ったのですが文字を入れた時の挙動であったりとか音声チャットの結果がメッセージの一覧に反映されないだとか、まだまだ改良の余地があるので今回はソースコードは載せません。
字の大きさがめちゃくちゃです。メッセージ一覧は、datagridviewを使っています。画面上部のドロップダウンリストで複数のチャット切替ができます。メッセージ入力は一番下のテキストボックスから入力してEnterを押すとAIとチャットします。このあたりはコンソールと同じです。Awake、Asleep機能をなくして「mic」ボタンを付けました。小さすぎて見にくいのですがメッセージ入力の右横についています。このボタンを一度押すと音声会話モードになります。話すたびに押す必要はありません。
メイン画面のeditボタンを押すとダイアログが表示されてチャットの変数を設定できます。LLMの場所とかも指定できます。音声は、Cevio AIとVOICEVOXです。音声会話するのでレスポンスのいいGPUモードが必須になっています。
マイさん(AI)との会話で「オレってどんなイメージかstablediffusionのプロンプトで描いてみて」と言ったらいけそうだったので、AI発言からstablediffusionを起動させて遊べるような機能も付けたいなと考えています。gemmaが画像を読めるようになったらカメラ映像(静止画)とか写真などAIに見せられるようにしたいななど。
これはまだ計画外ですが複数キャラとの会話も実現したいかなと考えています(技術的には難しくない)