Hiện đã có cửa sổ ngữ cảnh Gemini 1.5 Pro 2M, khả năng thực thi mã và Gemma 2. Tìm hiểu thêm

Trang này được dịch bởi Cloud Translation API.

Tạo văn bản bằng API Gemini

Gemini API có thể tạo văn bản đầu ra từ nhiều loại dữ liệu đầu vào, bao gồm văn bản, hình ảnh, video và âm thanh. Bạn có thể sử dụng tính năng tạo văn bản cho nhiều ứng dụng, bao gồm:

Viết mẫu quảng cáo
Mô tả hoặc diễn giải tài sản đa phương tiện
Hoàn tất văn bản
Tóm tắt văn bản dạng tự do
Dịch giữa các ngôn ngữ
Chatbots
Các trường hợp sử dụng mới của riêng bạn

Hướng dẫn này chỉ cho bạn cách tạo văn bản bằng generateContent và streamGenerateContent và SDK phía máy chủ mà bạn chọn. Tiêu điểm là đầu ra văn bản từ phương thức nhập chỉ có văn bản và văn bản và hình ảnh. Để tìm hiểu thêm về việc nhắc đa phương thức có tệp video và âm thanh, hãy xem Lời nhắc bằng tệp nội dung nghe nhìn.

Các bước tiếp theo

Hướng dẫn này trình bày cách sử dụng generateContent và streamGenerateContent để tạo kết quả đầu ra văn bản từ đầu vào chỉ có văn bản cũng như văn bản và hình ảnh. Để tìm hiểu thêm về cách tạo văn bản bằng Gemini API, hãy xem các tài nguyên sau:

Lời nhắc bằng tệp nội dung nghe nhìn: Gemini API hỗ trợ tính năng nhắc bằng dữ liệu văn bản, hình ảnh, âm thanh và video, đồng thời được gọi là nhắc đa phương thức.
Hướng dẫn về hệ thống: Hệ thống cho phép bạn định hướng hành vi của mô hình dựa trên và trường hợp sử dụng.
Hướng dẫn an toàn: Đôi khi có thể sử dụng AI tạo sinh các mô hình tạo ra kết quả không mong muốn, chẳng hạn như kết quả đầu ra không chính xác, thiên kiến hoặc phản cảm. Quy trình hậu xử lý và quy trình đánh giá thủ công có vai trò thiết yếu đối với việc hạn chế rủi ro thiệt hại từ các dữ liệu đầu ra đó.