미디어 파일로 메시지 표시


ai.google.dev에서 보기 Google Colab에서 실행 GitHub에서 소스 보기

Gemini API는 텍스트, 이미지, 오디오, 동영상 데이터의 프롬프팅을 지원하며 멀티모달 프롬프팅이라고 합니다. 즉, 이러한 유형의 미디어를 파일을 찾을 수 있습니다 작은 파일의 경우 Gemini 모델을 직접 가리킬 수 있습니다. 로컬 파일로 변환해야 합니다 파일 API에 포함해야 합니다. 표시됩니다

File API를 사용하면 프로젝트당 최대 20GB의 파일을 저장할 수 있으나 2GB를 초과해서는 안 됩니다. 파일은 48시간 동안 저장되며 해당 기간 내에 생성할 API 키이며 다운로드할 수 없습니다. 가져올 수 있습니다. Files API는 Gemini API를 사용할 수 있습니다.

File API는 model.generateContent 또는 model.streamGenerateContent 자세한 내용은 유효한 파일 형식 (MIME 유형) 및 지원되는 모델은 지원되는 파일 형식을 참고하세요.

이 가이드에서는 File API를 사용하여 미디어 파일을 업로드하고 포함하는 방법을 보여줍니다. Gemini API에 대한 GenerateContent 호출 자세한 내용은 코드 샘플을 참고하세요.

지원되는 파일 형식

Gemini 모델은 다양한 파일 형식을 이용한 프롬프팅을 지원합니다. 이 섹션 프롬프트에 일반적인 미디어 형식을 사용할 때의 고려사항은 특히 이미지, 오디오, 동영상 및 일반 텍스트 파일로 구성됩니다. 미디어 파일 사용 가능 특정 모델 버전에만 메시지가 표시되도록 하려면 표에서 볼 수 있습니다.

모델 이미지 오디오 동영상 일반 텍스트
Gemini 1.5 Pro (버전 008 이상) ✔ (최대 3,600개의 이미지 파일)

이미지 형식

Gemini 1.5 모델의 프롬프트에 이미지 데이터를 사용할 수 있습니다. 이미지를 사용하는 경우 을 사용하는 경우 다음과 같은 제한사항 및 요구사항이 적용됩니다.

  • 이미지는 다음 이미지 데이터 중 하나에 있어야 합니다. MIME 유형:
    • PNG - image/png
    • JPEG - image/jpeg
    • WEBP - image/webp
    • HEIC - image/heic
    • HEIF - image/heif
  • Gemini 1.5 모델의 경우 최대 3,600개의 이미지
  • 이미지의 픽셀 수에는 특정한 제한이 없습니다. 더 클수록 이미지는 최대 해상도인 3072x3072에 맞게 원래 가로세로 비율을 유지하는 것이 좋습니다.

오디오 형식

Gemini 1.5 모델의 프롬프트에 오디오 데이터를 사용할 수 있습니다. 사용하는 경우 프롬프트에 사용할 오디오에는 다음과 같은 제한사항이 적용됩니다. 요구사항:

  • 오디오 데이터는 다음과 같은 일반적인 오디오 형식 MIME로 지원됩니다. 유형:
    • WAV - 오디오/wav
    • MP3 - 오디오/mp3
    • AIFF - 오디오/AIFF
    • AAC - 오디오/aac
    • OGG Vorbis - 오디오/ogg
    • FLAC - 오디오/flac
  • 단일 프롬프트에서 지원되는 최대 오디오 데이터 길이는 9.5시간입니다.
  • 오디오 파일은 16Kbps 데이터 해상도로 리샘플링되며 오디오 채널은 단일 채널로 결합됩니다.
  • 단일 프롬프트의 오디오 파일 수에는 특정한 제한이 없습니다. 프롬프트에 표시된 모든 오디오 파일의 총 길이를 9.5시간을 초과할 수 없습니다.

동영상 형식

Gemini 1.5 모델의 프롬프트에 동영상 데이터를 사용할 수 있습니다.

  • 동영상 데이터는 다음과 같은 일반적인 동영상 형식 MIME에서 지원됩니다. 유형:

    • video/mp4
    • video/mpeg
    • 동영상/mov
    • 동영상/avi
    • 동영상/x-flv
    • 동영상/mpg
    • 동영상/webm
    • 동영상/wmv
    • 동영상/3gpp
  • File API 서비스는 초당 1프레임 (FPS) 속도로 동영상을 이미지로 샘플링합니다. 최상의 추론 품질을 제공하기 위해 변경될 수 있습니다. 해상도 및 해상도에 상관없이 개별 이미지는 있습니다.

일반 텍스트 형식

File API는 다음 MIME 유형을 사용하는 일반 텍스트 파일의 업로드를 지원합니다.

  • text/plain
  • text/html
  • text/css
  • 텍스트/자바스크립트
  • application/x-javascript
  • text/x-typescript
  • application/x-typescript
  • text/csv
  • 텍스트/마크다운
  • text/x-python
  • application/x-python-code
  • application/json
  • 텍스트/XML
  • application/rtf
  • 텍스트/rtf

MIME 유형이 목록에 없는 일반 텍스트 파일의 경우 위의 MIME 유형 중 하나를 수동으로 지정해야 합니다.