Üretken modeller hakkında

Gemini ailesi gibi üretken yapay zeka (AI) modelleri modellerimiz çeşitli veri girişlerinden içerik oluşturabiliyor. metin, resim ve ses. Bu modeller, en temel düzeylerinde, gelişmiş otomatik tamamlama uygulamaları kullanıyor. Giriş metni ("You can lead a horse" (Bir atı liderlik edebilirsiniz) ), üretken bir model ise kaplumbağanın suya istatistiksel açıdan olası ("ancak içmeyi sağlayamazsınız") öğrenmeye çalıştığınız örüntüleri ifade eder. Bu temel özelliği kullanarak üretken yapay zeka modellerinin yanı sıra

  • Şiir, kısa öykü, benzetme ve öykü gibi yaratıcı metinler üretmek blog yayınları
  • Yapılandırılmış verileri serbest biçimli metne dönüştürme
  • Serbest biçimli metindeki bilgileri ayıklama ve özetleme
  • Kod oluşturma
  • Diller arasında çeviri yapın

Bu özellikleri oluşturmak için üretken modelleri kullanmak için makine gerekmez öğrenme (ML) uzmanlığı. Büyük bir veri kümesi toplamanız veya modeli. İlk prototipinizi oluşturmak için gereken tek şey ne istediğinizi açıklamaktır. anlatacağım.

Yalnızca metin giriş ve çıkışını işleyen üretken modeller büyük dil modelleri (LLM) olarak değiştirin. Gemini model ailesi daha fazla metin verilerinden daha iyidir ve bir LLM'nin işlevlerini yerine getirebilseler de, üretken modeller olarak adlandırılır.

Örnek uygulamalar

Aşağıdaki örneklerde, bir üretken modelimizdir.

Şiir oluştur

Kullanıcı girişi: Write me a four-line poem about puppies and Android phones. Make sure it rhymes.

Model çıkışı:

Puppies are cute,
Android phones are neat,
They both bring joy,
And make life complete.

Liste oluştur

Kullanıcı girişi: Generate a bulleted list of items I need to pack for a three-day camping trip.

Model çıkışı:

*   Tent
*   Sleeping bag
*   Sleeping pad
*   Camp stove
*   Pots and pans
*   Utensils
*   Food
*   Water
*   First-aid kit
*   Sunscreen
*   Insect repellent
*   ...

Üretken modellerden yararlanarak her türlü faydalı davranışı üretebilirsiniz. Örneğin, istem olarak da adlandırılan doğru giriş metnini oluşturarak bunu yapabilirsiniz. Sanat üretken modeller için doğru ifadeleri bulma bilimi ve istem tasarımı ("istem mühendisliği" veya "istem mühendisliği" olarak da adlandırılır) sadece "istemde bulunmak").

İstem tasarımı 101

Önceki bölümde, "Bana bir şiir yaz" gibi komutlar verebilirsiniz. Bu tür bir talimat ekip üyelerinde teşvik edebilirsiniz. Ancak diğer uygulamalar için başka bir istem az sayıda çekim isteme adlı bir teknik daha iyi sonuç verebilir. Birkaç çekim istemi büyük dil modellerinin son derece başarılı metin verilerindeki kalıpları fark edip çoğaltmak için bir fırsattır. Burada amaç, tamamlamayı öğrendiği bir metin kalıbı üretken model oluşturmak için kullanır. Örneğin, giriş olarak bir ülke adı alan ve başkent. Aşağıda bunu yapmak üzere tasarlanmış bir metin istemi verilmiştir:

Italy : Rome
France : Paris
Germany :

Bu istemde bir kalıp oluşturuyorsunuz: [country] : [capital]. Örneğin büyük dil modeline eklerseniz kalıbı otomatik olarak tamamlar ve şuna benzer bir sonuç döndür:

     Berlin
Turkey : Ankara
Greece : Athens

Bu model yanıtı biraz tuhaf görünebilir. Model yalnızca (el ile yazılmış isteminizdeki son ülke) değil, aynı zamanda ek ülke ve sermaye çiftlerinin tam listesi. Çünkü üretken model "kalıbın devam etmesini" oluşturuyor. Tek yapmaya çalıştığınız giriş ülkesinin başkentini ("Almanya : Berlin"), muhtemelen modelin metinlerinin hiçbiri sizin için "Berlin"den sonra oluşturulur. Uygulama tasarımcıları olarak gerçekten de, bu fazlalık örnekleri kolayca kırpabilirsiniz. Bunun yanı sıra, yakın zamanda Almanya sabit bir dize değil, değişken olacak şekilde girişi parametreleştirin. şunları sağlaması gerekir:

Italy : Rome
France : Paris
<user input here> :

Ülke büyük harfleriyle ilgili birkaç çekimlik bir istem yazdınız.

Bu birkaç anlık istemi izleyerek çok sayıda görev gerçekleştirebilirsiniz tıklayın. Burada biraz farklı bir biçime sahip olan birkaç çekim Python'u JavaScript'e dönüştürür:

Convert Python to JavaScript.
Python: print("hello world")
JavaScript: console.log("hello world")
Python: for x in range(0, 100):
JavaScript: for(var i = 0; i < 100; i++) {
Python: ${USER INPUT HERE}
JavaScript:

Veya "ters sözlüğü" alın tıklayın. Bir tanım verildiğinde, şu tanıma uyan bir kelimeden bahsedelim:

Given a definition, return the word it defines.
Definition: When you're happy that other people are also sad.
Word: schadenfreude
Definition: existing purely in the mind, but not in physical reality
Word: abstract
Definition: ${USER INPUT HERE}
Word:

Birkaç denemelik bu istemlerin tam olarak nasıl değiştiğini fark etmiş olabilirsiniz. biraz zaman alıyor. Örnekleri açıklamaya ek olarak, kendi istemlerinizi yazarken göz önünde bulundurmanız gereken ek bir stratejidir, niyetinizi modele iletmenize yardımcı olur.

İstem yapma ve geleneksel yazılım geliştirme

Dikkatli bir şekilde yazılmış bir spesifikasyona göre tasarlanmış geleneksel yazılımların aksine, üretken modellerin davranışı model eğitmenleri için bile büyük ölçüde opaktır. Kullanıcı çoğu zaman ne tür istem yapılarının doğru bir şekilde daha iyi sonuç verip vermediğini öğrenin. Dahası, üretken yapay zekanın modeli, büyük ölçüde eğitim verileri tarafından belirlenir ve modeller, yeni veri kümeleri üzerinde sürekli olarak ayarlamalar yapıyorsa bazen model, istemeden de olsa hangi istem yapılarının en iyi performansı gösterdiğini değiştirir. Bu ne anlama geliyor? sen? Deneme yapın! Farklı istem biçimlerini deneyin.

Model parametreleri

Modele gönderdiğiniz her istem, model bir yanıt oluşturur. Model, arama sonuçları sayfası için farklı parametre değerleri. En yaygın model parametreleri şunlardır:

  1. Maksimum çıkış jetonları: Eklenebilecek maksimum jeton sayısını belirtir oluşturuldu. Jeton yaklaşık dört karakterden oluşur. 100'ler jetonlar yaklaşık 60-80 kelimeye karşılık gelir.

  2. Sıcaklık: Sıcaklık, jetondaki rastgelelik derecesini kontrol eder seçim. Sıcaklık, yanıt üretimi sırasında örnekleme için kullanılır. Bu işlem, topP ve topK uygulandığında meydana gelir. Düşük sıcaklıklar iyidir daha belirgin veya daha az açık uçlu yanıt gerektiren istemler için daha yüksek sıcaklıklar ise daha çeşitli veya yaratıcı sonuçlar doğurabilir. CEVAP 0 sıcaklığı deterministiktir, yani en yüksek olasılık her zaman seçilidir.

  3. topK: topK parametresi, modelin jeton seçme şeklini değiştirir. çıktı. topK/1, diğer seçenekler arasından seçilen jetonun en olası olduğu anlamına gelir. modelin kelime hazinesindeki tüm göstergeleri (açkanlı kod çözme olarak da bilinir) topK ise 3 ise bir sonraki jetonun 3 simge arasından seçileceği anlamına gelir sıcaklığı kullanma ihtimali vardır. Her jeton seçimi adımında En yüksek olasılığa sahip topK jeton örneklenir. Bu durumda jetonlar Son jeton ise topP kullanılarak daha fazla filtrelendi sıcaklık örneklemesi.

  4. topP: topP parametresi, modelin jeton seçme şeklini değiştirir. çıktı. Jetonlar, en yüksek olasılıktan en az olası olana doğru olasılıkları topP değerine eşittir. Örneğin, A, B jetonları ve C'nin olasılığı 0,3, 0,2 ve 0,1'dir ve topP değeri 0,5'tir. bu durumda model, C'yi aday olarak gösterebilir. Varsayılan topP değeri 0,95'tir.

  5. stop_sequences: Durdurma sırasını şu şekilde ayarla: modele içerik oluşturmayı durdurmasını söyleyin. Durdurma dizisi, girin. Kapsamlı olmayan bir karakter dizisi kullanmaktan gösterilebilir.

İstem türleri

İstemler, içerdikleri bağlamsal bilgilerin düzeyine bağlı olarak, üç türe ayrılır.

Sıfır çekim istemleri

Bu istemler, modelin çoğaltılacağı örnekler içermez. Sıfır Çekim istemler, temelde modelin herhangi bir sorun yaşamadan istemi tamamlama kabiliyetini gösterir veya ek örnek veya bilgi içerebilir. Bu, modelin kendi sürece ve mevcut bilgileri kullanarak makul bir yanıt üretebilirsiniz.

Yaygın olarak kullanılan bazı sıfır çekim istemi kalıpları şunlardır:

  • Talimat-içeriği
<Overall instruction>
<Content to operate on>

Örneğin,

Summarize the following into two sentences at the third-grade level:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds.

Hummingbirds are made up of three main parts: the head, the body, and the tail.
The head is small and round, and it contains the eyes, the beak, and the brain.
The body is long and slender, and it contains the wings, the legs, and the
heart. The tail is long and forked, and it helps the hummingbird to balance
while it is flying.

Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color!

Hummingbirds are very active creatures. They spend most of their time flying,
and they are also very good at hovering. Hummingbirds need to eat a lot of food
in order to maintain their energy, and they often visit flowers to drink nectar.

Hummingbirds are amazing creatures. They are small, but they are also very
powerful. They are beautiful, and they are very important to the ecosystem.
  • Talimat-icerik-talimat
<Overall instruction or context setting>
<Content to operate on>
<Final instruction>

Örneğin,

Here is some text I'd like you to summarize:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds. Hummingbirds
are made up of three main parts: the head, the body, and the tail. The head is
small and round, and it contains the eyes, the beak, and the brain. The body is
long and slender, and it contains the wings, the legs, and the heart. The tail
is long and forked, and it helps the hummingbird to balance while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color! Hummingbirds are very active creatures. They spend most
of their time flying, and they are also very good at hovering. Hummingbirds need
to eat a lot of food in order to maintain their energy, and they often visit
flowers to drink nectar. Hummingbirds are amazing creatures. They are small, but
they are also very powerful. They are beautiful, and they are very important to
the ecosystem.

Summarize it in two sentences at the third-grade reading level.
  • Devam'ı tıklayın. Bazen modelin herhangi bir metin içermeyen ve bakın. Örneğin, burada modelin devam etmesini amaçlıyor:
Once upon a time, there was a little sparrow building a nest in a farmer's
barn. This sparrow

Şiirler, kod metinleri ve hatta metin gibi yaratıcı metin biçimleri oluşturmak için metinler, müzik parçaları, e-postalar veya mektuplar.

Tek seferlik istemler

Bu istemler, modele çoğaltılıp devam edecek tek bir örnek sağlar görebilirsiniz. Bu sayede istekli kullanıcılardan tahmin edilebilir modeli.

Örneğin, aşağıdaki gibi yiyecek eşlemeleri oluşturabilirsiniz:

Food: Apple
Pairs with: Cheese
Food: Pear
Pairs with:

Birkaç hızlı istem

Bu istemler, modele çoğaltılabilecek birden fazla örnek sağlar. Tekliflerinizi otomatikleştirmek ve optimize etmek için veya bilgilere dayalı olarak verileri sentezlemek gibi karmaşık görevleri görebilirsiniz.

Örnek istem:

Generate a grocery shopping list for a week for one person. Use the JSON format
given below.
{"item": "eggs", "quantity": "6"}
{"item": "bread", "quantity": "one loaf"}

Üretken modeller

Bu bölümde şu soruyu yanıtlamalısınız: Üretken yapay zekada rastgelelik var mı? modeller yoksa deterministik mi?

Kısa yanıt, her ikisi için de evet. Üretken model istemini gördüğünüzde metinle yanıt iki aşamada üretilir. İlk aşamada, üretken model giriş istemini işler ve bir olasılık dağılımı daha sonra büyük olasılıkla kullanılması mümkün olan işaretleri (kelimeler) kapsar. Örneğin, bir görev için "Köpek köpek şey ... üzerinden atladı." giriş metniyle birlikte, üretken model olası sonraki kelimelerden oluşan bir dizi üretir:

[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]

Bu süreç deterministiktir. üretken model de bunu üretir aynı istem metni her girildiğinde dağıtım yapar.

İkinci aşamada, üretken model bu dağılımları birkaç kod çözme stratejisinden birini uygulayarak gerçek metin yanıtları hazırlayın. Basit bir stratejisi, her zaman adımında en olası jetonu seçebilir. Bu her zaman deterministik olacaktır. Ancak isterseniz tarafından döndürülen dağılımdan rastgele örnekleme yoluyla bir yanıt üretmesi modeli. Bu süreç stokastik (rastgele) olacaktır. Bağlantının derecesini renk değerini ayarlayarak bu kod çözme sürecinde izin verilen rastgelelik durumuna getirilebilir. CEVAP sıcaklık 0 ise yalnızca en olası jetonların seçildiği anlamına gelir ve rastgelelik. Buna karşılık, yüksek sıcaklık yüksek derecede rastgelelik yerleştirir ve bu da daha beklenmedik, şaşırtıcı sonuçlar doğurabilir. model yanıtları.

Daha fazla bilgi

  • Artık istemleri ve üretken modelleri daha iyi anladığınıza göre şunu kullanarak kendi istemlerinizi yazmayı deneyin: Google AI Studio.
  • Öğrenmek için İstem yönergeleri'ne bakın. daha fazla bilgi edinin.