生成AI大衆化の準備は整った

 2023年には生成AI関連の新しいニュースが毎日のように流れてきて、とても全部は追いかけ切れないとため息をついた人も少なくないだろう。先端技術に明るい一部の人が話題にしているが、まだ自分には関係ないからと試してみようとしなかった人も多いだろう。
 しかし、今年はそんなことは言っていられない。2024年は生成AI大衆化元年であり、誰もが生成AIのメリットを享受できるようになる。
 生成AIのトップを走るOpenAIは1月にGPT Storeをオープンし、特定の利用目的にカスタマイズしたChat GPTが売買できるようになった。これはApp StoreやMicrosoft StoreのChat GPT版で、自分で一から使い方を考えなくても、使用目的に合うものをここで見つければ簡単に使える。一方、制作サイドにはGPTsを提供し、ノーコードで自分なりのChat GPTをカスタマイズできるようにした。作り手側に求められるのは、プログラム能力ではなく独自のアイデアだ。

OpenAIはGPT Storeをオープンした https://openai.com/blog/introducing-the-gpt-store

OpenAIはGPT Storeをオープンした https://openai.com/blog/introducing-the-gpt-store

 同じく1月だが、Microsoftは同社のAIサービスブランドのCopilotに一般向け有料モデルのCopilot Proを追加した。こちらの最大の特徴は、Microsoft 365で利用できることで、たとえばExcelに「ピボットテーブルを作って」と言った指示が可能になる。こちらもCopilot GPT Builderが近々アップデートされ、カスタマイズが容易になる予定だ。

MicrosoftはCopilot Proを発表した https://www.microsoft.com/ja-jp/store/b/copilotpro

MicrosoftはCopilot Proを発表した https://www.microsoft.com/ja-jp/store/b/copilotpro

 普段使いのアプリで生成AIが活用できるわけで、大衆化の準備は整ったと言えるだろう。しかし、誰もが使えるとは言っても、皆が望みの出力結果を得られるとは限らない。これまでも、Googleで効果的な検索結果を得ている人や、ExcelやPowerPointで良好なビジネス成果を上げている人がいたように、生成AIというツールで満足できる出力結果を得られる人とそうでない人が出てくる。

プロンプトの基本を知ろう

 利用する上で生成AIとはどんなツールなのかを理解している必要がある。生成AIとは、利用者にとっては、対話的なインターフェースで、検索やドキュメントの生成などを実行するツールだ。「対話」をいかに操れるかで、得られる成果は異なってくる。そのために重要になるのがプロンプトだ。プロンプトは生成AIに対して与える指示で、最初に出力された結果に満足がいかなければ、次々指示を重ねて、成果への到達を目指す。この作業をプロンプトエンジニアリングと呼ぶ。
 従来のGoogle検索では、検索語を追加したAND検索で検索内容を絞り込むのが普通だったが、生成AIは対話型なので、最初のプロンプトで出た結果に対して、次のプロンプトで指示を与え、出力結果をブラッシュアップしていくことが可能だ。たとえば「Webマーケティングで効果的な手法を5つ挙げて」という指示の次に「結果の2番についてもっと詳しく」というように掘り進めていくことができる。
 生成AIのプロンプトエンジニアリングは当初利用者の手探りで、SNS上でも多くの研究グループが、どんな指示を与えるとうまく結果が出るかを報告しあっていた。しかし、現在では、各生成AIベンダーが、プロンプトエンジニアリングの解説をサイトで公開している。それらの中から初心者でもプロンプト活用に役立ちそうなヒントをいくつかピックアップしていこう。

社名       解説ページ
OpenAI      Prompt Engineering
Microsoft    プロンプトエンジニアリングの概要
Google     プロンプト設計戦略
AWS      プロンプトエンジニアリングとは何ですか?

大衆化生成AIのプロンプトのコツ

 生成AIの出力に対して指示を重ねていくプロンプトエンジニアリングの手順を知るには、OpenAIの「Prompt Engineering」が役立つだろう。このページでは「より良い結果を得るための6つの戦略」として、「明確な指示を書く」「参考テキストを提供する」「複雑なタスクをより単純なサブタスクに分割する」など、6つを挙げている(後半にはテキスト生成ではなくプログラムコード生成にも触れているがここでは割愛する)。
 最初の「明確な指示を書く」は、他のベンダーのページでも重要だと述べられている。生成AIはLLM(大規模言語モデル)を使用して、単語のつながりの確からしさを探って文章を生成するが、端的な指示や曖昧な指示では、モデルの中の探索範囲が広大になってしまうので、指示を明確にして、対象範囲を絞ってやることで、望む出力を効率的に探せるようになる。

プロンプトによるLLM(大規模言語モデル)探索範囲の絞り込み

プロンプトによるLLM(大規模言語モデル)探索範囲の絞り込み

 たとえば、「電子帳簿保存法について教えて」より、「電子帳簿保存法に対応するために、企業の経営者、経理部門、システム部門、一般社員のそれぞれに担当すべき役割は何?」の方が具体的な指示になり、目的に沿った出力を得られる。
 明確な指示以外では、出力の専門性や文章の難易度をコントロールするために、生成AIに語り手の指定(ロールプレイ)をするのが有効だ。プロンプトの具体的な指示の前に「あなたは優秀なマーケッターです」などの役割を与えることで、文章の専門性を獲得できる。Googleの「プロンプト設計戦略」では、例として量子コンピュータ関連のテキストの要約を指示している。1度実行した上で、「小学5年生が理解できるように」という文言を入れて、より理解しやすい解答を得ている。これは、テキストの作り手の専門性を指定するのとは逆に読み手の理解度を指定する方法で、目的に応じて使い分けるといい。
 Microsoft「プロンプトエンジニアリングの概要」のページは初心者には用語などが少し専門的だが、豊富なプロンプトエンジニアリングの手法が紹介されている。「回答がない場合は、“見つかりませんでした”と応答してください」というプロンプトで、生成AIがよく創作する誤った出力結果を回避する方法などは、安全性の確保のために参考になる。
 最初の指示で目的に沿った出力が得られるに越したことはないが、指示の文章が長くなりすぎると、生成AIが指示を間違って解釈する可能性も出てくる。こうした時に役立つのがプロンプトの分割や、参考テキストの提供だ。
 プロンプトの指示を分割することで、生成AIは一気に解答しようとせず、段階を追って出力に到達しようとするので、正確性が増す。参考テキストを提供すれば、生成AIはそのテキストの流れなどを真似ようとするため、使用者がイメージするテキストの方向性をリードできる。
 AWSの「プロンプトエンジニアリングとは何ですか?」では、ベストプラクティスとして「プロンプトの簡潔さと複雑さのバランスを取り、曖昧な回答や無関係な回答、予測しない解答を避けるようにします。単純すぎるプロンプトはコンテキストが不足している可能性があり、複雑すぎるプロンプトはAIを混乱させる可能性があります」と述べている。プロンプトは明確化と複雑性回避のバランスが重要なのだ。
 また、一連の指示を生成AIが間違えないように、「###Instruction###」を文頭に置いて指示を開始したり、「###Example###」で例を示すなど、スクリプト的な構成にして正確に指示を読み取らせる方法もある。

まず初心者が取り組みたい3つのポイント

 プロンプトのヒントをピックアップしてきたが、最初から完璧に近いプロンプトを目指すのは難しい。まず、プロンプトのビギナーに取り組んでほしいのは以下の3点だ。

  1. 探索範囲を絞り込むための、明確で丁寧な説明
  2. テキストを安定させ一貫性を持たせるための、話者(ロールプレイ)や読者の設定
  3. AIの誤解を防ぐための参考テキスト提供やプロンプト分割

 この3点に注意することで、生成AIの出力結果は確実に向上するはずだ。もちろん、プロンプトの技法は他にもたくさんあり、ネット上にも情報が溢れている。生成AIが希望通りの出力を解答した場合の報酬を保証したり、悪ければペナルティを与えるというフレーズを入れると出力が向上するとも言われている。基本的なプロンプト使いができるようになったら、いろいろ試してみて、自分なりのプロンプト作法を構築し、さらに良好な出力を引き出してほしい。

著者プロフィール

狐塚 淳(こづか じゅん)

スマートワーク総研編集長。コンピュータ系出版社の雑誌・書籍編集長を経て、フリーランスに。インプレス等の雑誌記事を執筆しながら、キャリア系の週刊メールマガジン編集、外資ベンダーのプレスリリース作成、ホワイトペーパーやオウンドメディアなど幅広くICT系のコンテンツ作成に携わる。現在の中心テーマは、スマートワーク、生成系AI、ロボティクス、IoT、クラウド、データセンターなど。