जनरेटिव मॉडल के बारे में जानकारी

जनरेटिव आर्टिफ़िशियल इंटेलिजेंस (एआई) मॉडल, जैसे कि Gemini मॉडल अलग-अलग तरह के डेटा इनपुट से कॉन्टेंट बना सकते हैं. इनमें ये शामिल हैं टेक्स्ट, इमेज, और ऑडियो वगैरह. अपने बुनियादी स्तर पर, ये मॉडल इस तरह काम करते हैं ऑटोकंप्लीट की सुविधा वाले बेहतर ऐप्लिकेशन. इनपुट टेक्स्ट दिया गया है ("आप घोड़े को ले जा सकते हैं पानी,"), जनरेटिव मॉडल अनुमान लगा सकता है कि आउटपुट टेक्स्ट के अनुसार उनके ट्रेनिंग डेटा से सीखे गए पैटर्न. आप इसकी बुनियादी प्रॉपर्टी का इस्तेमाल कर सकते हैं अलग-अलग ऐप्लिकेशन के लिए जनरेटिव मॉडल:

  • कविता, छोटी-छोटी कहानियाँ, और उपमाओं जैसे रचनात्मक लेखन तैयार करने के साथ-साथ ब्लॉग पोस्ट
  • स्ट्रक्चर्ड डेटा को फ़्रीफ़ॉर्म टेक्स्ट में बदलना
  • फ़्रीफ़ॉर्म टेक्स्ट से जानकारी निकालें और उसे छोटा करें
  • कोड जनरेट करें
  • एक भाषा से दूसरी भाषा में अनुवाद करना

इन सुविधाओं को बनाने के लिए जनरेटिव मॉडल का इस्तेमाल करने के लिए, किसी मशीन की ज़रूरत नहीं पड़ती लर्निंग (एमएल) में विशेषज्ञता. आपको कोई बड़ा डेटासेट इकट्ठा करने या मॉडल. अपना पहला प्रोटोटाइप शुरू करने के लिए, आपको बस यह बताना होता है कि आपको किस तरह का कॉन्टेंट बनाना है मॉडल को कुछ वाक्यों में समझाना है.

जनरेटिव मॉडल जो सिर्फ़ टेक्स्ट इनपुट और आउटपुट हैंडल करते हैं उन्हें यह भी कहा जाता है बड़े लैंग्वेज मॉडल (एलएलएम). Gemini की मदद से काम करने वाले मॉडल ज़्यादा प्रोसेस कर सकते हैं एलएलएम के काम करने के लिए इस्तेमाल किया जाता है. जनरेटिव मॉडल के नाम से ज़्यादा लोकप्रिय हैं.

ऐप्लिकेशन के उदाहरण

नीचे दिए गए उदाहरणों में, एक जनरेटिव मॉडल.

एक कविता जनरेट करो

उपयोगकर्ता का इनपुट: Write me a four-line poem about puppies and Android phones. Make sure it rhymes.

मॉडल आउटपुट:

Puppies are cute,
Android phones are neat,
They both bring joy,
And make life complete.

सूची जनरेट करें

उपयोगकर्ता का इनपुट: Generate a bulleted list of items I need to pack for a three-day camping trip.

मॉडल आउटपुट:

*   Tent
*   Sleeping bag
*   Sleeping pad
*   Camp stove
*   Pots and pans
*   Utensils
*   Food
*   Water
*   First-aid kit
*   Sunscreen
*   Insect repellent
*   ...

जनरेटिव मॉडल की मदद से, अलग-अलग तरह के काम किए जा सकते हैं. जैसे, इसे बस सही इनपुट टेक्स्ट तैयार करके, प्रॉम्प्ट भी कहा जाता है. द आर्ट इसके लिए, सही शब्दों का पता लगाने की तकनीक का इस्तेमाल करके जनरेटिव मॉडल बनाना आपको जिस चीज़ की ज़रूरत है उसे प्रॉम्प्ट डिज़ाइन कहा जाता है (इसे "प्रॉम्प्ट इंजीनियरिंग" भी कहा जाता है या सिर्फ़ "प्रॉम्प्ट करना").

प्रॉम्प्ट डिज़ाइन 101

पिछले सेक्शन में, ऐसे प्रॉम्प्ट के कुछ उदाहरण दिखाए गए हैं जिनमें जैसे, 'मेरे लिए कोई कविता लिखो'. इस तरह के निर्देश का काम करने का यह तरीका कुछ खास तरह के टास्क होते हैं. हालांकि, अन्य एप्लिकेशन के लिए, एक अन्य प्रॉम्प्ट फ़्यू-शॉट प्रॉम्प्टिंग नाम की तकनीक बेहतर तरीके से काम कर सकती है. कुछ शॉट लेने के लिए यह तथ्य का फ़ायदा है कि लार्ज लैंग्वेज मॉडल जटिल रूप से यह सुविधा, टेक्स्ट डेटा में पैटर्न की पहचान करने और उसे बार-बार दोहराने की सुविधा देती है. आइडिया यह है कि जनरेटिव मॉडल एक टेक्स्ट पैटर्न है, जिसे यह अपने-आप पूरा करता है. उदाहरण के लिए, मान लें कि एक ऐसा ऐप्लिकेशन बनाना चाहते हैं जो इनपुट के रूप में देश का नाम लेता है और आउटपुट राजधानी शहर. यहां एक टेक्स्ट प्रॉम्प्ट दिया गया है, जिसे इसी काम के लिए डिज़ाइन किया गया है:

Italy : Rome
France : Paris
Germany :

इस प्रॉम्प्ट में, आपने एक पैटर्न सेट किया है: [country] : [capital]. अगर आपने इस प्रॉम्प्ट को एक बड़े लैंग्वेज मॉडल पर ले जाते हैं, तो यह पैटर्न को अपने-आप पूरा कर देगा और कुछ ऐसा दिखाएं:

     Berlin
Turkey : Ankara
Greece : Athens

मॉडल का यह रिस्पॉन्स कुछ अजीब लग सकता है. मॉडल ने न केवल जर्मनी की राजधानी (आपके हाथ से लिखे गए प्रॉम्प्ट में आखिरी देश), लेकिन अतिरिक्त देश और पूंजी जोड़े की पूरी सूची. ऐसा इसलिए होता है, क्योंकि जनरेटिव मॉडल "पैटर्न को जारी रख रहा है." अगर आपको बस इतना ही करना है एक ऐसा फ़ंक्शन बनाएं जो आपको किसी इनपुट देश की राजधानी की जानकारी दे ("जर्मनी : बर्लिन"), तो शायद आप उस मॉडल के किसी भी टेक्स्ट पर ध्यान नहीं देते "बर्लिन" के बाद जनरेट होता है. ऐप्लिकेशन डिज़ाइनर के तौर पर, शायद आपको का इस्तेमाल करें. इसके अलावा, शायद आपको यह भी पसंद आए पैरामीटर का इस्तेमाल कर सकते हैं, ताकि जर्मनी तय स्ट्रिंग न हो, बल्कि वैरिएबल जो असली उपयोगकर्ता उपलब्ध कराता है:

Italy : Rome
France : Paris
<user input here> :

आपने देश के हिसाब से कैपिटल लेटर जनरेट करने के लिए, कुछ शब्दों में प्रॉम्प्ट लिखा है.

कुछ शॉट में बदलाव करने की सुविधा का इस्तेमाल करके, कई टास्क पूरे किए जा सकते हैं टेम्प्लेट. यह रहा थोड़े अलग फ़ॉर्मैट के साथ कुछ शॉट Python को JavaScript में बदलता है:

Convert Python to JavaScript.
Python: print("hello world")
JavaScript: console.log("hello world")
Python: for x in range(0, 100):
JavaScript: for(var i = 0; i < 100; i++) {
Python: ${USER INPUT HERE}
JavaScript:

या इस "रिवर्स शब्दकोश" को लें प्रॉम्प्ट. परिभाषा देने पर, यह वह शब्द जो इस परिभाषा के अनुरूप है:

Given a definition, return the word it defines.
Definition: When you're happy that other people are also sad.
Word: schadenfreude
Definition: existing purely in the mind, but not in physical reality
Word: abstract
Definition: ${USER INPUT HERE}
Word:

आपने देखा होगा कि कुछ शॉट वाले इन प्रॉम्प्ट का सटीक पैटर्न अलग-अलग होता है थोड़ा. उदाहरण के अलावा, अपने 'प्रॉम्प्ट' एक अतिरिक्त रणनीति है, जिसे अपना प्रॉम्प्ट लिखते समय इस पर ध्यान देना चाहिए, क्योंकि इससे मॉडल को अपने मकसद के बारे में बताने में मदद मिलती है.

प्रॉम्प्टिंग बनाम ट्रेडिशनल सॉफ़्टवेयर डेवलपमेंट

सावधानी से लिखित विशेषताओं के लिए डिज़ाइन किए गए पारंपरिक सॉफ़्टवेयर के उलट, जनरेटिव मॉडल के काम करने के तरीके के बारे में पूरी जानकारी नहीं है. यहां तक कि मॉडल ट्रेनर भी इस बारे में ज़्यादा जानकारी नहीं दे सकते. बतौर जिसके नतीजे, अक्सर पहले से यह अनुमान नहीं लगाया जा सकता कि किस तरह के प्रॉम्प्ट स्ट्रक्चर किसी मॉडल के लिए सबसे अच्छा काम करता है. इसके अलावा, जनरेटिव एआई का इस्तेमाल कैसे होता है मॉडल को ट्रेनिंग डेटा से काफ़ी हद तक तय किया जाता है. मॉडल को हमारे डेटासेट को लगातार ट्यून किया जाता है, तो कभी-कभी मॉडल इतना बदल जाता है कि वह अनजाने में उस प्रॉम्प्ट स्ट्रक्चर में बदलाव कर देते हैं जो सबसे अच्छा काम करता है. इसका क्या मतलब है आप? Experiment! प्रॉम्प्ट के अलग-अलग फ़ॉर्मैट आज़माएं.

मॉडल पैरामीटर

मॉडल को भेजे जाने वाले हर प्रॉम्प्ट में पैरामीटर की वैल्यू शामिल होती हैं. इनकी मदद से, यह तय किया जाता है कि तो मॉडल जवाब जनरेट करता है. मॉडल, GA4 प्रॉपर्टी के लिए अलग-अलग नतीजे जनरेट कर सकता है पैरामीटर वैल्यू अलग-अलग हैं. सबसे सामान्य मॉडल पैरामीटर हैं:

  1. मैक्स आउटपुट टोकन: इससे तय होता है कि ज़्यादा से ज़्यादा कितने टोकन मिल सकते हैं जनरेट किया गया है. एक टोकन में करीब चार वर्ण होते हैं. 100 टोकन करीब 60 से 80 शब्दों के होते हैं.

  2. तापमान: तापमान यह कंट्रोल करता है कि टोकन में कोई कितनी गड़बड़ी हो सकती है चुनें. इस तापमान का इस्तेमाल, प्रतिक्रिया जनरेट करने के दौरान सैंपलिंग के लिए किया जाता है. जो topP और topK लागू होने पर लागू होती है. कम तापमान अच्छा है ऐसे प्रॉम्प्ट के लिए जिनका जवाब विस्तार से देना होता है या जिनका जवाब विस्तार से देना होता है, जिनका जवाब विस्तार से देना होता है. वहीं, ज़्यादा तापमान से ज़्यादा अलग-अलग तरह के या क्रिएटिव नतीजे मिलते हैं. ऐप्लिकेशन 0 का तापमान डिटरमिनिस्टिक है, यानी सबसे ज़्यादा प्रॉबबिलिटी जवाब हमेशा चुना जाता है.

  3. topK: topK पैरामीटर, मॉडल के लिए टोकन चुनने का तरीका बदलता है आउटपुट. 1 में से topK का मतलब है कि चुने गए टोकन की संभावना सबसे ज़्यादा है मॉडल के शब्दावली में मौजूद सभी टोकन (इसे ग्रीडी डिकोडिंग भी कहा जाता है), तीन में से topK का मतलब है कि अगला टोकन, तीनों में से चुना गया है जिनमें तापमान की सबसे ज़्यादा संभावना होती है. टोकन चुनने के हर चरण के लिए, सबसे ज़्यादा संभावना वाले topK टोकन का सैंपल लिया जाता है. इसके बाद, टोकन इसे topP के आधार पर और फ़िल्टर करके, फ़ाइनल टोकन का इस्तेमाल करके चुना गया तापमान का सैंपल.

  4. topP: topP पैरामीटर, मॉडल के लिए टोकन चुनने का तरीका बदलता है आउटपुट. टोकन सबसे ज़्यादा और सबसे कम संभावना वाले फ़ील्ड में से चुने जाते हैं. ऐसा तब तक किया जाता है, जब तक उनकी प्रायिकता topP मान के बराबर होती है. उदाहरण के लिए, अगर टोकन A, B, और C की वैल्यू 0.3, 0.2, और 0.1 है, और topP की वैल्यू 0.5 है. तो मॉडल, A या B को अगले टोकन के तौर पर चुनेगा. इसके लिए, और C को उम्मीदवार के तौर पर शामिल न करें. topP की डिफ़ॉल्ट वैल्यू 0.95 है.

  5. stop_sequences: इसके लिए स्टॉप का क्रम सेट करें मॉडल को कॉन्टेंट जनरेट करने से रोकने के लिए कहें. स्टॉप का क्रम कोई भी हो सकता है वर्णों का क्रम. वर्णों के ऐसे क्रम का इस्तेमाल करने से बचें जो जनरेट किए गए कॉन्टेंट में दिख सकता है.

प्रॉम्प्ट के टाइप

प्रॉम्प्ट में संदर्भ के हिसाब से किस लेवल की जानकारी दी गई है, इस आधार पर उन्हें इन्हें तीन कैटगरी में बांटा गया है.

ज़ीरो-शॉट प्रॉम्प्ट

इन प्रॉम्प्ट में ऐसे उदाहरण शामिल नहीं होते हैं जिन्हें मॉडल को दोहराना है. ज़ीरो-शॉट प्रॉम्प्ट से पता चलता है कि मॉडल, प्रॉम्प्ट को बिना किसी रुकावट के पूरा कर सकता है अतिरिक्त उदाहरण या जानकारी. इसका मतलब है कि मॉडल को अपनी ट्रैकिंग आपके पास पहले से मौजूद जानकारी होती है. इससे, एक सटीक जवाब जनरेट किया जा सकता है.

आम तौर पर, ज़ीरो-शॉट प्रॉम्प्ट पैटर्न का इस्तेमाल किया जाता है, जैसे:

  • निर्देश-कॉन्टेंट
<Overall instruction>
<Content to operate on>

उदाहरण के लिए,

Summarize the following into two sentences at the third-grade level:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds.

Hummingbirds are made up of three main parts: the head, the body, and the tail.
The head is small and round, and it contains the eyes, the beak, and the brain.
The body is long and slender, and it contains the wings, the legs, and the
heart. The tail is long and forked, and it helps the hummingbird to balance
while it is flying.

Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color!

Hummingbirds are very active creatures. They spend most of their time flying,
and they are also very good at hovering. Hummingbirds need to eat a lot of food
in order to maintain their energy, and they often visit flowers to drink nectar.

Hummingbirds are amazing creatures. They are small, but they are also very
powerful. They are beautiful, and they are very important to the ecosystem.
  • निर्देश-कॉन्टेंट-निर्देश
<Overall instruction or context setting>
<Content to operate on>
<Final instruction>

उदाहरण के लिए,

Here is some text I'd like you to summarize:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds. Hummingbirds
are made up of three main parts: the head, the body, and the tail. The head is
small and round, and it contains the eyes, the beak, and the brain. The body is
long and slender, and it contains the wings, the legs, and the heart. The tail
is long and forked, and it helps the hummingbird to balance while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color! Hummingbirds are very active creatures. They spend most
of their time flying, and they are also very good at hovering. Hummingbirds need
to eat a lot of food in order to maintain their energy, and they often visit
flowers to drink nectar. Hummingbirds are amazing creatures. They are small, but
they are also very powerful. They are beautiful, and they are very important to
the ecosystem.

Summarize it in two sentences at the third-grade reading level.
  • जारी है. कभी-कभी, आप मॉडल को किसी भी समय निर्देश. उदाहरण के लिए, यहां ज़ीरो-शॉट प्रॉम्प्ट दिया गया है, जिसमें मॉडल दिए गए इनपुट को जारी रखने के लिए लक्षित है:
Once upon a time, there was a little sparrow building a nest in a farmer's
barn. This sparrow

कविताओं, कोड, स्क्रिप्ट, संगीत के नमूने, ईमेल या अक्षर.

एक बार में कई प्रॉम्प्ट

इन प्रॉम्प्ट की मदद से, मॉडल को एक उदाहरण दिया जाता है, ताकि उसे फिर से कॉपी किया जा सके और जारी रखा जा सके पैटर्न. इसकी मदद से, ऑडियंस की मदद करने के लिए, मॉडल.

उदाहरण के लिए, इस तरह के खाने के पेयर जनरेट किए जा सकते हैं:

Food: Apple
Pairs with: Cheese
Food: Pear
Pairs with:

कुछ शॉट प्रॉम्ट

ये प्रॉम्प्ट, मॉडल को दोहराने के लिए कई उदाहरण देते हैं. इस्तेमाल की जाने वाली चीज़ें कुछ शब्दों में ही मुश्किल से मुश्किल टास्क पूरे किए जा सकते हैं. जैसे, डेटा को इकट्ठा करना किसी पैटर्न के हिसाब से होता है.

उदाहरण के लिए, यह प्रॉम्प्ट यह हो सकता है:

Generate a grocery shopping list for a week for one person. Use the JSON format
given below.
{"item": "eggs", "quantity": "6"}
{"item": "bread", "quantity": "one loaf"}

हुड के तहत जनरेटिव मॉडल

इस सेक्शन में, इस सवाल का जवाब दिया गया है - क्या जनरेटिव एआई में कोई गड़बड़ी है मॉडल' जवाब या वे अलग-अलग हैं?

छोटा जवाब - दोनों के लिए हां. जब जनरेटिव मॉडल को प्रॉम्प्ट किया जाता है, तो टेक्स्ट यह जवाब दो चरणों में जनरेट होता है. पहले चरण में, जनरेटिव मॉडल इनपुट प्रॉम्प्ट को प्रोसेस करता है और प्रॉबबिलिटी डिस्ट्रिब्यूशन को जनरेट करता है संभावित टोकन (शब्द) इस्तेमाल करना शुरू कर सकते हैं. उदाहरण के लिए, अगर आपने लोगों से "कुत्ते ने ... पर कूदकर ... " इनपुट टेक्स्ट के साथ, जनरेटिव मॉडल संभावित अगले शब्दों की कैटगरी बनाओ:

[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]

यह प्रोसेस डेटरमिनिस्टिक है; जनरेटिव मॉडल एआई की मदद से डिस्ट्रिब्यूशन को उतनी बार किया जा सकता है जितनी बार एक ही प्रॉम्प्ट टेक्स्ट को डाला जाता है.

दूसरे चरण में, जनरेटिव मॉडल इन डिस्ट्रिब्यूशन को कई डिकोडिंग रणनीतियों में से एक के ज़रिए, असल टेक्स्ट पर मिले जवाब. आसान ऐसा हो सकता है कि डिकोड करने की रणनीति, हर बार पर सबसे ज़्यादा संभावना वाले टोकन को चुने. यह प्रक्रिया हमेशा सारणिक होगी. हालांकि, आपके पास रैंडम तरीके से सैंपलिंग करके, रिस्पॉन्स के तौर पर जो डिस्ट्रिब्यूशन दिखाया जाता है उसे जनरेट किया जा सकता है. मॉडल. यह प्रोसेस स्टोकैस्टिक (रैंडम) होगी. इसकी डिग्री को कंट्रोल करें रैंडमनेस की अनुमति देता है. ऐप्लिकेशन टेंपरेचर 0 होने का मतलब है कि सबसे ज़्यादा संभावना वाले टोकन ही चुने जाएंगे. साथ ही, यहां कोई टोकन नहीं चुना जाएगा रैंडमनेस. इसके ठीक उलट, ज़्यादा तापमान होने पर कई नतीजे अलग-अलग हो सकते हैं यह मॉडल के चुने हुए टोकन में हिस्सा लेता है. इससे ज़्यादा चौंकाने वाला और मॉडल के जवाब.

इसके बारे में और पढ़ें

  • अब आपको प्रॉम्प्ट और जनरेटिव मॉडल के बारे में अच्छी तरह से समझ आ गया है, इसका इस्तेमाल करके अपने प्रॉम्ट लिखने की कोशिश करें Google AI Studio.
  • जानने के लिए, प्रॉम्प्ट से जुड़े दिशा-निर्देश देखें प्रॉम्प्ट बनाने के सबसे सही तरीकों के बारे में ज़्यादा जानें.