Gemini 1.5 Pro の 2M コンテキストウィンドウ、コード実行機能、Gemma 2 を利用できるようになりました。詳細

このページは Cloud Translation API によって翻訳されました。

生成モデルについて

生成 AI モデル（Gemini ファミリーなど）は、モデルは、さまざまなタイプのデータ入力からコンテンツを作成できます。たとえば、テキスト、画像、音声などです最も基本的なレベルでは、これらのモデルは高機能な予測入力アプリケーションに最適です与えられた入力テキスト（「馬を導くことができます」）というテキスト）を生成すると、生成モデルは、入力テキストが次の条件に基づいて、統計的に「飲みに行かない」パターンを学習します。この基本的なプロパティを使用して、生成モデルの例を紹介します。

詩、短編小説、たとえ話、ブログ投稿
構造化データを自由形式のテキストに変換する
自由形式のテキストから情報を抽出して要約する
コードを生成する
言語間の翻訳

生成モデルを使用してこれらの機能を構築するのに、マシン学習（ML）の専門知識が必要です。大規模なデータセットを収集したり、モデルをモデルです。作成したい内容を記述するだけで、最初のプロトタイプを作成できます。数文で予測します。

テキストの入力と出力のみを処理する生成モデルは、 大規模言語モデル（LLM）。Gemini ファミリーのモデルは、より多くの LLM の機能を実行することはできますが、 生成モデルとしてよく知られています。

サンプルアプリケーション

次の例は、一般的なテキスト入力と出力を示しています。説明します。

詩を生成する

ユーザー入力: Write me a four-line poem about puppies and Android phones. Make sure it rhymes.

モデル出力:

Puppies are cute,
Android phones are neat,
They both bring joy,
And make life complete.

リストを生成する

ユーザー入力: Generate a bulleted list of items I need to pack for a three-day camping trip.

モデル出力:

*   Tent
*   Sleeping bag
*   Sleeping pad
*   Camp stove
*   Pots and pans
*   Utensils
*   Food
*   Water
*   First-aid kit
*   Sunscreen
*   Insect repellent
*   ...

生成モデルでは、さまざまな有用な動作を生成できます。たとえば、これは、適切な入力テキスト（プロンプトとも呼ばれる）を作成するだけです。アート生成モデルに期待する適切な言い回しを見極めるための「プロンプトエンジニアリング」とも呼ばれる、プロンプト設計です。単純な「プロンプト」など）です。

プロンプト設計入門

前のセクションでは、Terraform の記述を含むプロンプトの例をいくつか「詩を書いて」のような指示を与えます。このような手順が適しているのは行うこともできます。ただし、その他のアプリケーションでは、 少数ショットプロンプトと呼ばれる手法の方が効果的な場合もあります。少数ショットプロンプトは大規模言語モデルは、非常に優れた処理能力、テキストデータのパターンを認識して複製します考え方としては、テキストパターンを学習して完成させます。たとえば、国名を入力として受け取り、その国の名前を出力するあります次のテキストプロンプトは、そのために設計されています。

Italy : Rome
France : Paris
Germany :

このプロンプトでは、パターン [country] : [capital] を指定します。Google プロンプトを大規模言語モデルに渡すと、パターンが予測入力され、次のようなコードが返されます。

     Berlin
Turkey : Ankara
Greece : Athens

このモデルのレスポンスは少し奇妙に見えるかもしれません。モデルは、ラベルだけでなく、ドイツの首都（手書きメッセージの最後の国）に加え、追加の国と資本のペアの完全なリスト。なぜなら、「パターンを継続」することです。やりたいことが入力国の首都を調べる関数（「Germany : Berlin」）では、おそらく、モデルのテキストは「Berlin」の後に生成されます。実際、アプリケーション設計者は、余分な例を切り捨てますさらに入力をパラメータ化して、ドイツが固定文字列ではなく変数になるようにするエンドユーザーが提供します。

Italy : Rome
France : Paris
<user input here> :

今度は、国の首都を生成するための少数ショットプロンプトを作成しました。

この少数ショットプロンプトに従うことで、多くのタスクを実行できます。使用します。この少数ショットプロンプトは、形式が少し異なり、 Python を JavaScript に変換します。

Convert Python to JavaScript.
Python: print("hello world")
JavaScript: console.log("hello world")
Python: for x in range(0, 100):
JavaScript: for(var i = 0; i < 100; i++) {
Python: ${USER INPUT HERE}
JavaScript:

または、この「逆辞書」を表示されます。定義を指定すると、定義できます。

Given a definition, return the word it defines.
Definition: When you're happy that other people are also sad.
Word: schadenfreude
Definition: existing purely in the mind, but not in physical reality
Word: abstract
Definition: ${USER INPUT HERE}
Word:

お気づきかもしれませんが、これらの少数ショットプロンプトの正確なパターンは、わずかに下回ります。サンプルを含めるだけでなく、プロンプトは、独自のプロンプトを記述する際に考慮すべき追加の戦略です。意図をモデルに伝えるのに役立ちます。

プロンプトと従来のソフトウェア開発の比較

入念に書かれた仕様に従って設計された従来のソフトウェアとは異なり、生成モデルの動作は、モデルトレーナーにとってもおおむね不透明です。デバイス名: どのようなプロンプト構造がどのような構造に変化し、特定のモデルに最適な動作を検出できますさらに、生成 AI のモデルの大部分はトレーニングデータによって新しいデータセットで継続的にチューニングが行われると、最適なプロンプト構造を誤って変更してしまう場合があります。具体的には？試行錯誤を繰り返す。さまざまなプロンプト形式を試します。

モデルパラメータ

モデルに送信するすべてのプロンプトには、モデルにどのようにモデルがレスポンスを生成します。このモデルは、パラメータ値によって異なる結果を生成できます。最も一般的なモデルパラメータは次のとおりです。

最大出力トークン: 出力トークンの最大数を指定します。レスポンスで生成されます。トークンは約 4 文字です。100 人約 60 ～ 80 語に相当します。
Temperature: 温度は、トークンのランダム性の度合いを制御します。選択します。温度は、レスポンス生成時のサンプリングに使用されます。これは、topP と topK が適用された場合に発生します。温度を低くするといいより決定的なレスポンスや自由度の低いレスポンスが求められるプロンプトの場合は、温度を高くすると、より多様で創造的な結果を導くことができます。温度 0 は決定論的であり、最も高い確率で常に選択されます。
topK: topK パラメータは、モデルが次のトークンを選択する方法を変更します。出力です。topK が 1 の場合、選択されたトークンがすべてのトークンを特徴量として扱うため（グリーディデコードとも呼ばれます）、 topK が 3 の場合は、3 つの中から次のトークンが選択されることを意味します。 temperature を使って最も確率が高いデータです。トークン選択のそれぞれのステップで、確率が最も高い topK のトークンがサンプリングされます。トークンは topP に基づいてさらにフィルタリングされ、最終的なトークンが次のように選択されます。温度サンプリングを使用します。
topP: topP パラメータは、モデルが次のトークンを選択する方法を変更します。出力です。最も確率の高いものから順に選択され、確率は topP 値と等しくなります。たとえばトークン A、B、 C の確率は 0.3、0.2、0.1 で、topP の値は 0.5 です。その場合、モデルは次のトークンとして A または B を候補として C を除外しますtopP のデフォルト値は 0.95 です。
stop_sequences: 停止シーケンスをコンテンツの生成を停止するようモデルに指示します。停止シーケンスには任意の文字列を指定できます。使用します。同じ文字列を連続的に使用しないでください。動画内に表示される可能性があります。

プロンプトの種類

含まれているコンテキスト情報のレベルに応じて、プロンプトは大きく 3 つに分類できます

ゼロショットプロンプト

これらのプロンプトには、モデルを複製する例は含まれません。ゼロショットプロンプトとは基本的に、モデルに入力なしでプロンプトを完了する能力を示すものです追加の例や情報を提供します。つまり、モデルは入力文の既存の知識を用いて、妥当な回答を生成します。

よく使用されるゼロショットプロンプトパターンは次のとおりです。

手順コンテンツ

<Overall instruction>
<Content to operate on>

次に例を示します。

Summarize the following into two sentences at the third-grade level:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds.

Hummingbirds are made up of three main parts: the head, the body, and the tail.
The head is small and round, and it contains the eyes, the beak, and the brain.
The body is long and slender, and it contains the wings, the legs, and the
heart. The tail is long and forked, and it helps the hummingbird to balance
while it is flying.

Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color!

Hummingbirds are very active creatures. They spend most of their time flying,
and they are also very good at hovering. Hummingbirds need to eat a lot of food
in order to maintain their energy, and they often visit flowers to drink nectar.

Hummingbirds are amazing creatures. They are small, but they are also very
powerful. They are beautiful, and they are very important to the ecosystem.

指示、コンテンツ、指示

<Overall instruction or context setting>
<Content to operate on>
<Final instruction>

次に例を示します。

Here is some text I'd like you to summarize:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds. Hummingbirds
are made up of three main parts: the head, the body, and the tail. The head is
small and round, and it contains the eyes, the beak, and the brain. The body is
long and slender, and it contains the wings, the legs, and the heart. The tail
is long and forked, and it helps the hummingbird to balance while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color! Hummingbirds are very active creatures. They spend most
of their time flying, and they are also very good at hovering. Hummingbirds need
to eat a lot of food in order to maintain their energy, and they often visit
flowers to drink nectar. Hummingbirds are amazing creatures. They are small, but
they are also very powerful. They are beautiful, and they are very important to
the ecosystem.

Summarize it in two sentences at the third-grade reading level.

継続。場合によっては、何も入力せずにモデルにテキストをできます。たとえばこのゼロショットプロンプトでは、モデルのは、提供された入力を継続します。

Once upon a time, there was a little sparrow building a nest in a farmer's
barn. This sparrow

ゼロショットプロンプトを使用して、詩、コード、スクリプト、音楽、メール、手紙。

ワンショットプロンプト

これらのプロンプトは、複製して続行するための 1 つの例をモデルに提供します。パターンを認識しません。これにより、モデルから予測可能な応答を生成できます。モデルです。

たとえば、次のような食品の組み合わせを生成できます。

Food: Apple
Pairs with: Cheese
Food: Pear
Pairs with:

少数ショットプロンプト

これらのプロンプトは、複製する複数の例をモデルに提供します。使用少数ショットプロンプトを使用して、複雑なタスクを完了させるパターンに合わせます

プロンプトの例:

Generate a grocery shopping list for a week for one person. Use the JSON format
given below.
{"item": "eggs", "quantity": "6"}
{"item": "bread", "quantity": "one loaf"}

生成モデルの仕組み

このセクションは、「生成 AI にランダム性はあるかモデルのそれとも決定論的なものですか？

簡潔に言うと、どちらでもかまいません。生成モデルにプロンプトを入力すると、テキストがレスポンスは 2 段階で生成されます。最初のステージでは、生成モデルは入力プロンプトを処理し、確率分布を生成します。トークン（単語）の候補を表示します。たとえば、プロンプトに対してという入力テキストが入力されている場合、生成モデルは次に続く可能性が高い単語の配列を生成します。

[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]

このプロセスは決定論的です。生成モデルでは、これと同じものが予測と分布を示します。

第 2 段階では、生成モデルがこれらの分布をテキストレスポンスをデコードします。シンプル最も可能性の高いトークンを時間ステップごとに選択します。この決定論的になります。代わりに Google Meet を使用してによって返された分布に対してランダムサンプリングを行い、レスポンスを生成するモデルです。このプロセスは確率的（ランダム）です。レベルの制御温度を設定することで、このデコードプロセスで許容されるランダム性の度合いを高めることができます。 Temperature 0 は、最も確率が高いトークンのみが選択され、ランダム性です。逆に、温度を高くすると、ランダム性が高くなります。トークンに変換されるため、より予想外の驚くべき結果に学習します。

生成モデルについて

サンプル アプリケーション

詩を生成する

リストを生成する

プロンプト設計入門

プロンプトと従来のソフトウェア開発の比較

モデル パラメータ

プロンプトの種類

ゼロショット プロンプト

ワンショット プロンプト

少数ショット プロンプト