画像生成AIは悪か→さらなる潜在的問題への応援コメント
8KB以上にもなるプロンプトで詳細に指示を書けるようになってから、再評価した方がいいですよ。確かに限界もあるし、指示を無視してもくれますから、高評価もできませんがね。
作者からの返信
今回ウラで画像生成実験をしております。
私が描いた絵の絵画的特徴を述べて生成させる。
私が実際に描いた絵を見せて、違いを分析させる。
その実験に使ったプロンプトは814文字ですね。
ここでの生成画像の違いは想定の範囲内です。
しかし違いの分析で、問題が発生しました。
一本一本の手描きの軌跡を重視し、中央形状の幾何学性を軽視。
また、より本質的な問題としては、表情の大きな特徴をより重視し、付けられたニュアンスはほとんど無視。
しかし絵描きの意図は表情の大分類より、そこに付けられたニュアンス、それにより立ち上がる人間性にある。
追加のプロンプトで修正を加えようとしても、内部アルゴリズムに引きずられる。
結果、手描き感のみを個性と結論。
この結果はそのうち、Qiitaにでもまとめようかと思っています。カクヨム読者向きではないのではと。
で、どっちがいいの?への応援コメント
やっぱり使い方を理解していないように感じる。
小説自動執筆には数多くの「作者が持っていない前提」を導入することが必要なのは当然で、Webで検索して情報を補えと指示すれば、一般的な情報であれば情報を補って、使ってくれます。ある程度は、ロール指定で自動的に補ってくれる場合もある。
例えば、まともにプロンプトで指示してあれば、神道の事なんか知らなくても、神職の階位とか、神職になるための進路なんかを補って、プロットを提案してくれたこともある。必要なのは明示的にプロンプトで指示することです。
もっとも、詳細に、プロンプトの制限長まで細かく指示しても、それを素直に実行してくれない傾向はあります。
勝手に必要なことを忘れてくれるChatGPTと、限界で明確に破綻してくれるGeminiなら、Geminiの方がいいです。ワーキングメモリを使い切って破綻するのは、セッションの切り替えや、一問一答式の運用で避けられます。重要な点を勝手に古いからと忘れる方が使っているストレスが強いです。
作者からの返信
別のコメントで述べておりますが、おそらく改稿作業のプロセスを誤解されていると思います。詳細はそちらのコメントをご覧ください。
また自然言語の性質上、非明示的前提条件が存在するのは当然です。ChatGPTでは前提条件の管理がより厳密、Geminiではより広く非限定的、作者の望まない前提をより広いデータ領域から暗黙に引っ張ってくる傾向があるという話です。
編集済
結びへの応援コメント
抄録を書かせるには便利なのですが、改稿に使うのは怖いですね。いくら詳細に指示しても、無視して勝手に抄録にして、中身を変えてくれることが多いですから、かえって不便です。2000文字から4000文字ぐらいまでに分割して、一度に扱う文章量を減らすとか、回避する対処法はあるのですが、面倒です。
学習機能というのは、自分の利用履歴である過去ログを資料として参照して使う機能のことです。会話機能を重視している利用者にとっては、ある程度自分用にカスタマイズされたと感じられる程度の結果しかありません。ましてや、創作に使っている場合には、役に立つものではありません。
作者からの返信
コメントありがとうございます、が……おそらく、文意に誤解があるかなと。
「この文章をいい感じに差し替えて」という指定は一切しません。
「アウトプットする文章」を書かせることはそもそもしません。
まずは原稿を読ませてから、
・作者が気になっている気になる点
・それを踏まえて「論理構造の」まとめと再分析。文章を書かせることが目的ではありません。
・それを受けて、作者が改稿し、再分析
・それを分析させ、改善された点と、新しく導入された観点での再分析
これを繰り返します。人間の作業量は感覚的な改稿の数倍です。