मीडिया फ़ाइलों से सूचना देना


ai.google.dev पर देखें Google Colab में चलाएं GitHub पर सोर्स देखें

Gemini API के साथ टेक्स्ट, इमेज, ऑडियो, और वीडियो डेटा के साथ प्रॉम्प्ट देने की सुविधा भी काम करती है. इसे मल्टीमोडल प्रॉम्प्टिंग के नाम से जाना जाता है. इसका मतलब है कि आप उस तरह के मीडिया को शामिल कर सकते हैं फ़ाइलें शामिल की जा सकती हैं. छोटी फ़ाइलों के लिए, सीधे Gemini मॉडल की मदद ली जा सकती है स्थानीय फ़ाइल में जोड़ दें. फ़ाइल के साथ बड़ी फ़ाइलें अपलोड करें एपीआई में उन्हें शामिल करने से पहले प्रॉम्प्ट.

File API आपको हर प्रोजेक्ट में 20 जीबी तक की फ़ाइलें सेव करने की सुविधा देता है. हर फ़ाइल में साइज़ 2 जीबी से ज़्यादा होना चाहिए. फ़ाइलें 48 घंटों तक सेव रहती हैं और इन्हें आपकी एपीआई पासकोड को तय समयावधि में जनरेट करने के लिए, उसे डाउनलोड नहीं किया जा सकता को एपीआई से हटाएं. Files API उन सभी इलाकों में बिना किसी शुल्क के उपलब्ध है जहां Gemini API उपलब्ध है.

File API, ऐसे इनपुट मैनेज करता है जिनका इस्तेमाल करके, कॉन्टेंट जनरेट किया जा सकता है model.generateContent या model.streamGenerateContent. इस पर जानकारी के लिए मान्य फ़ाइल फ़ॉर्मैट (MIME प्रकार) और काम करने वाले मॉडल, इस्तेमाल की जा सकने वाली फ़ाइल देखें फ़ॉर्मैट.

इस गाइड में, File API का इस्तेमाल करके मीडिया फ़ाइलों को अपलोड करने और उन्हें शामिल करने का तरीका बताया गया है Gemini API को GenerateContent कॉल में किया जाएगा. ज़्यादा जानकारी के लिए, देखें कोड सैंपल.

इस्तेमाल किए जा सकने वाले फ़ाइल फ़ॉर्मैट

Gemini के मॉडल में, कई फ़ाइल फ़ॉर्मैट वाले प्रॉम्प्ट काम किए जा सकते हैं. इस सेक्शन पर प्रॉम्प्ट के लिए सामान्य मीडिया फ़ॉर्मैट का इस्तेमाल करते समय, ध्यान देने वाली बातों के बारे में बताता है. खास तौर पर, इमेज, ऑडियो, वीडियो, और सामान्य टेक्स्ट वाली फ़ाइलें. मीडिया फ़ाइलों का इस्तेमाल किया जा सकता है केवल विशिष्ट मॉडल वर्शन के साथ प्रॉम्प्ट के लिए, जैसा कि नीचे दिखाया गया है टेबल.

मॉडल इमेज ऑडियो वीडियो सामान्य टेक्स्ट
Gemini 1.5 Pro (रिलीज़ 008 और उसके बाद के वर्शन) ✔ (ज़्यादा से ज़्यादा 3,600 इमेज फ़ाइलें)

इमेज फ़ॉर्मैट

Gemini के 1.5 मॉडल से प्रॉम्प्ट देने के लिए, इमेज के डेटा का इस्तेमाल किया जा सकता है. जब आप इमेज का इस्तेमाल करते हैं प्रॉम्प्ट के लिए, इन सीमाओं और शर्तों को पूरा किया जा सकता है:

  • चित्र निम्न में से किसी एक चित्र डेटा MIME में होने चाहिए टाइप:
    • PNG - इमेज/png
    • JPEG - Image/jpeg
    • WebP - इमेज/webp
    • HEIC - इमेज/हीक
    • एचईआईएफ़ - इमेज/हीफ़
  • Gemini के 1.5 मॉडल के लिए, ज़्यादा से ज़्यादा 3,600 इमेज.
  • किसी इमेज में पिक्सल की संख्या के लिए कोई तय सीमा नहीं है; हालांकि, बड़ा इमेज का साइज़ छोटा किया जाता है, ताकि वे ज़्यादा से ज़्यादा 3072 x 3072 के रिज़ॉल्यूशन में फ़िट हो सकें. वीडियो के ओरिजनल आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) में कोई बदलाव न करें.

ऑडियो फ़ॉर्मैट

Gemini के 1.5 मॉडल से प्रॉम्प्ट देने के लिए, ऑडियो डेटा का इस्तेमाल किया जा सकता है. जब आप इस्तेमाल करें प्रॉम्प्ट भेजने के लिए, उन पर ये सीमाएं लागू होती हैं. ज़रूरतें:

  • ऑडियो डेटा, इन सामान्य ऑडियो फ़ॉर्मैट MIME में काम करता है टाइप:
    • WAV - ऑडियो/wav
    • एमपी3 - ऑडियो/mp3
    • एआईएफ़एफ़ - ऑडियो/आइफ़
    • AAC - ऑडियो/aac
    • OGG वोर्बिस - ऑडियो/ogg
    • FLAC - ऑडियो/flac
  • एक प्रॉम्प्ट में ज़्यादा से ज़्यादा 9.5 घंटे का ऑडियो डेटा इस्तेमाल किया जा सकता है.
  • ऑडियो फ़ाइलों को 16 केबीपीएस डेटा रिज़ॉल्यूशन तक रीसैंपल किया जाता है. साथ ही, इन्हें कई ऑडियो के कई चैनल एक ही चैनल में जोड़ दिए जाते हैं.
  • एक प्रॉम्प्ट में ऑडियो फ़ाइलों की संख्या के लिए कोई तय सीमा नहीं है; हालांकि, एक प्रॉम्प्ट में सभी ऑडियो फ़ाइलों की कुल लंबाई 9.5 घंटे से ज़्यादा नहीं हो सकता.

वीडियो फ़ॉर्मैट

Gemini के 1.5 मॉडल से प्रॉम्प्ट देने के लिए, वीडियो डेटा का इस्तेमाल किया जा सकता है.

  • वीडियो डेटा, इन सामान्य वीडियो फ़ॉर्मैट MIME में काम करता है टाइप:

    • video/mp4
    • video/mpeg
    • वीडियो/मूव
    • वीडियो/एवी
    • वीडियो/x-flv
    • वीडियो/एमपीजी
    • वीडियो/वेबम
    • वीडियो/WMv
    • वीडियो/3gpp
  • File API सेवा, वीडियो के सैंपल को एक फ़्रेम प्रति सेकंड (एफ़पीएस) पर इमेज में बदल देती है इसमें बदलाव किया जा सकता है, ताकि सबसे सटीक अनुमान लगाया जा सके. अलग-अलग इमेज का रिज़ॉल्यूशन भले ही 258 टोकन होता है क्वालिटी.

सादे टेक्स्ट के फ़ॉर्मैट

File API इन MIME टाइप वाली सामान्य टेक्स्ट वाली फ़ाइलें अपलोड करने में मदद करता है:

  • टेक्स्ट/सादा
  • टेक्स्ट/html
  • टेक्स्ट/सीएसएस
  • टेक्स्ट/JavaScript
  • application/x-javascript
  • text/x-typescript
  • application/x-typescript
  • टेक्स्ट/csv
  • टेक्स्ट/मार्कडाउन
  • text/x-python
  • application/x-python-code
  • application/json
  • टेक्स्ट/एक्सएमएल
  • application/rtf
  • टेक्स्ट/आरटीएफ़

जिन सादे टेक्स्ट वाली फ़ाइलों का MIME टाइप सूची में नहीं है उनके लिए, आपके पास बताया जा सकता है ऊपर दिए गए MIME प्रकारों को मैन्युअल रूप से कॉपी कर सकते हैं.