ลองดูที่เก็บ Gemma Cookbook เพื่อฟังตัวอย่างการสร้างและปรับแต่ง ดูข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

Gemma Open Models

กลุ่มโมเดลแบบเปิดที่ทันสมัยและน้ำหนักเบาซึ่งสร้างขึ้นจากการวิจัยและเทคโนโลยีเดียวกันกับที่ใช้สร้างโมเดล Gemini

ออกแบบอย่างรับผิดชอบ

โมเดลเหล่านี้มีมาตรการความปลอดภัยที่ครอบคลุม ซึ่งช่วยให้มั่นใจได้ว่าโซลูชัน AI ที่มีความรับผิดชอบและเชื่อถือได้ผ่านชุดข้อมูลที่คัดสรรมาและการปรับแต่งอย่างเข้มงวด

มีประสิทธิภาพที่เหนือกว่าทุกขนาด

โมเดล Gemma ได้ผลลัพธ์การเปรียบเทียบที่ยอดเยี่ยมที่ขนาด 2B, 7B, 9B และ 27B ซึ่งมีประสิทธิภาพสูงกว่าโมเดลแบบเปิดที่มีขนาดใหญ่กว่าบางโมเดล

เฟรมเวิร์กที่ยืดหยุ่น

Keras 3.0 ให้ความสามารถในการใช้งานร่วมกันอย่างราบรื่นกับ JAX, TensorFlow และ PyTorch ทำให้คุณเลือกและเปลี่ยนเฟรมเวิร์กได้อย่างง่ายดายตามงานที่ทำ

ขอแนะนำ
Gemma 2

Gemma 2 ออกแบบมาเพื่อประสิทธิภาพที่เหนือระดับและประสิทธิภาพที่เหนือระดับ โดยเพิ่มประสิทธิภาพให้การอนุมานของฮาร์ดแวร์ที่หลากหลายได้อย่างรวดเร็ว

ลองใช้ Gemma 2 ใน Google AI Studio

5 นัด

MMLU

การเปรียบเทียบ MMLU เป็นการทดสอบที่วัดความรู้และความสามารถในการแก้ปัญหาที่โมเดลภาษาขนาดใหญ่ได้รับในระหว่างการฝึกล่วงหน้า

25 ช็อต

ARC-C

การเปรียบเทียบ ARC-c คือชุดย่อยของชุดข้อมูล ARC-e ที่โฟกัสมากกว่า ซึ่งมีเฉพาะคำถามที่ตอบไม่ถูกต้องโดยอัลกอริทึมทั่วไป (การดึงข้อมูลจากฐานข้อมูลและคำที่เกิดขึ้นร่วมกัน)

5 นัด

GSM8K

การเปรียบเทียบ GSM8K จะทดสอบความสามารถของโมเดลภาษาในการแก้โจทย์คณิตศาสตร์ระดับชั้นเรียนที่มักต้องมีการให้เหตุผลหลายขั้นตอน

3-5 ช็อต

AGIEval

การเปรียบเทียบ AGIEval ทดสอบความฉลาดทั่วไปของโมเดลภาษา โดยใช้คำถามที่ได้จากการสอบจริงที่ออกแบบมาเพื่อประเมินความสามารถทางปัญญาของมนุษย์

3 ช็อต, CoT

BBH

การเปรียบเทียบ BBH (BIG-Bench Hard) มุ่งเน้นงานที่ถือว่าเหนือกว่าความสามารถของโมเดลภาษาในปัจจุบัน โดยทดสอบขีดจำกัดในโดเมนการให้เหตุผลและความเข้าใจที่หลากหลาย

3 ช็อต, F1

วาง

DROP เป็นเกณฑ์เปรียบเทียบด้านการอ่านที่ต้องมีการให้เหตุผลที่ชัดเจนในย่อหน้าต่างๆ

5 นัด

Winogrande

การเปรียบเทียบ Winogrande จะทดสอบความสามารถของโมเดลภาษาเพื่อแก้ปัญหางานเติมคำในช่องว่างที่ไม่ชัดเจนด้วยไบนารีออปชัน ซึ่งจำเป็นต้องมีการให้เหตุผลทั่วไปสามัญสำนึก

10 นัด

HellaSwag

การเปรียบเทียบ HellaSwag จะท้าทายความสามารถของโมเดลภาษาในการทำความเข้าใจและใช้การให้เหตุผลตามสามัญสำนึกด้วยการเลือกตอนจบที่สมเหตุสมผลที่สุดของเรื่องราว

4 ช็อต

MATH

MATH ประเมินความสามารถของโมเดลภาษาในการแก้โจทย์ปัญหาคณิตศาสตร์ที่ซับซ้อน ซึ่งจำเป็นต้องมีการให้เหตุผล การแก้ปัญหาแบบหลายขั้นตอน และความเข้าใจในแนวคิดทางคณิตศาสตร์

0-ช็อต

ARC-e

การเปรียบเทียบ ARC-e จะทดสอบทักษะการตอบคำถามขั้นสูงของโมเดลภาษาด้วยคำถามวิทยาศาสตร์แบบปรนัยจริงในระดับโรงเรียน

0-ช็อต

PIQA

การเปรียบเทียบ PIQA จะทดสอบความสามารถของโมเดลภาษาเพื่อทำความเข้าใจและนำความรู้ทั่วไปด้านกายภาพไปใช้โดยการตอบคำถามเกี่ยวกับการโต้ตอบทางกายภาพในชีวิตประจำวัน

0-ช็อต

SIQA

การเปรียบเทียบ SIQA จะประเมินความเข้าใจของโมเดลภาษาเกี่ยวกับการโต้ตอบทางสังคมและสามัญสำนึกทางสังคมโดยการถามคำถามเกี่ยวกับการกระทำของผู้คนและนัยทางสังคมของพวกเขา

0-ช็อต

บูลค์

การเปรียบเทียบ BoolQ จะทดสอบความสามารถของโมเดลภาษาในการตอบคำถามแบบใช่/ไม่ใช่ที่เกิดขึ้นตามธรรมชาติ เป็นการทดสอบความสามารถของโมเดลในการทำงานอนุมานภาษาที่เป็นธรรมชาติในโลกแห่งความเป็นจริง

5 นัด

TriviaQA

เกณฑ์มาตรฐาน TriviaQA จะทดสอบทักษะการอ่านทำความเข้าใจด้วยคำถามพร้อมหลักฐานประกอบ 3 ประการ

5 นัด

การเปรียบเทียบ NQ (Natural Questions) จะทดสอบความสามารถของโมเดลภาษาในการค้นหาและทำความเข้าใจคำตอบในบทความ Wikipedia ทั้งหมด ซึ่งจำลองสถานการณ์การตอบคำถามในโลกแห่งความเป็นจริง

บัตร@1

HumanEval

การเปรียบเทียบ HumanEval ทดสอบความสามารถในการสร้างโค้ดของโมเดลภาษาโดยประเมินว่าโซลูชันของโมเดลผ่านการทดสอบหน่วยฟังก์ชันสำหรับปัญหาการเขียนโปรแกรมหรือไม่

3 ช็อต

MBPP

การเปรียบเทียบ MBPP จะทดสอบความสามารถของโมเดลภาษาในการแก้ปัญหาพื้นฐานการเขียนโปรแกรม Python โดยเน้นที่แนวคิดพื้นฐานด้านการเขียนโปรแกรมและการใช้ไลบรารีมาตรฐาน

100%

75%

50%

25%

100%

75%

50%

25%

เจมมา 1

2.5 พันล้าน

42.3

เจมมา 2

2.6 พันล้าน

51.3

Mistral

7 พันล้าน

62.5

LLAMA 3

8 พันล้าน

66.6

เจมมา 1

7 พันล้าน

64.4

เจมมา 2

9 พันล้าน

71.3

เจมมา 2

2.7 หมื่นล้าน

75.2

เจมมา 1

2.5 พันล้าน

48.5

เจมม่า 2

2.6 พันล้าน

55.4

Mistral

7 พันล้าน

60.5

LLAMA 3

8 พันล้าน

59.2

เจมมา 1

7 พันล้าน

61.1

เจมมา 2

9 พันล้าน

68.4

เจมมา 2

2.7 หมื่นล้าน

71.4

เจมมา 1

2.5 พันล้าน

15.1

เจมมา 2

2.6 พันล้าน

23.9

Mistral

7 พันล้าน

39.6

LLAMA 3

8 พันล้าน

45.7

เจมมา 1

7 พันล้าน

51.8

เจมมา 2

9 พันล้าน

68.6

เจมมา 2

2.7 หมื่นล้าน

74.0

เจมมา 1

2.5 พันล้าน

24.2

เจมม่า 2

2.6 พันล้าน

30.6

Mistral

7 พันล้าน

44.0

LLAMA 3

8 พันล้าน

45.9

เจมมา 1

7 พันล้าน

44.9

เจมมา 2

9 พันล้าน

52.8

เจมมา 2

2.7 หมื่นล้าน

55.1

เจมมา 1

2.5 พันล้าน

35.2

เจมมา 2

2.6 พันล้าน

41.9

Mistral

7 พันล้าน

56.0

LLAMA 3

8 พันล้าน

61.1

เจมมา 1

7 พันล้าน

59.0

เจมม่า 2

9 พันล้าน

68.2

เจมมา 2

2.7 หมื่นล้าน

74.9

เจมมา 1

2.5 พันล้าน

48.5

เจมม่า 2

2.6 พันล้าน

52.0

Mistral

7 พันล้าน

63.8

LLAMA 3

8 พันล้าน

58.4

เจมมา 1

7 พันล้าน

56.3

เจมม่า 2

9 พันล้าน

69.4

เจมม่า 2

2.7 หมื่นล้าน

74.2

เจมมา 1

2.5 พันล้าน

66.8

เจมมา 2

2.6 พันล้าน

70.9

Mistral

7 พันล้าน

78.5

LLAMA 3

8 พันล้าน

76.1

เจมมา 1

7 พันล้าน

79.0

เจมมา 2

9 พันล้าน

80.6

เจมมา 2

2.7 หมื่นล้าน

83.7

เจมมา 1

2.5 พันล้าน

71.7

เจมมา 2

2.6 พันล้าน

73.0

Mistral

7 พันล้าน

83.0

LLAMA 3

8 พันล้าน

82.0

เจมมา 1

7 พันล้าน

82.3

เจมมา 2

9 พันล้าน

81.9

เจมมา 2

2.7 หมื่นล้าน

86.4

เจมมา 1

2.5 พันล้าน

11.8

เจมมา 2

2.6 พันล้าน

15.0

Mistral

7 พันล้าน

12.7

เจมมา 1

7 พันล้าน

24.3

เจมมา 2

9 พันล้าน

36.6

เจมมา 2

2.7 หมื่นล้าน

42.3

เจมมา 1

2.5 พันล้าน

73.2

เจมมา 2

2.6 พันล้าน

80.1

Mistral

7 พันล้าน

80.5

เจมมา 1

7 พันล้าน

81.5

เจมมา 2

9 พันล้าน

88.0

เจมมา 2

2.7 หมื่นล้าน

88.6

เจมมา 1

2.5 พันล้าน

77.3

เจมมา 2

2.6 พันล้าน

77.8

Mistral

7 พันล้าน

82.2

เจมมา 1

7 พันล้าน

81.2

เจมมา 2

9 พันล้าน

81.7

เจมมา 2

2.7 หมื่นล้าน

83.2

เจมมา 1

2.5 พันล้าน

49.7

เจมมา 2

2.6 พันล้าน

51.9

Mistral

7 พันล้าน

47.0

เจมมา 1

7 พันล้าน

51.8

เจมมา 2

9 พันล้าน

53.4

เจมมา 2

2.7 หมื่นล้าน

53.7

เจมมา 1

2.5 พันล้าน

69.4

เจมมา 2

2.6 พันล้าน

72.5

Mistral

7 พันล้าน

83.2

เจมมา 1

7 พันล้าน

83.2

เจมมา 2

9 พันล้าน

84.2

เจมมา 2

2.7 หมื่นล้าน

84.8

เจมมา 1

2.5 พันล้าน

53.2

เจมมา 2

2.6 พันล้าน

59.4

Mistral

7 พันล้าน

62.5

เจมมา 1

7 พันล้าน

63.4

เจมมา 2

9 พันล้าน

76.6

เจมมา 2

2.7 หมื่นล้าน

83.7

เจมมา 1

2.5 พันล้าน

12.5

เจมมา 2

2.6 พันล้าน

16.7

Mistral

7 พันล้าน

23.2

เจมมา 1

7 พันล้าน

23.0

เจมมา 2

9 พันล้าน

29.2

เจมม่า 2

2.7 หมื่นล้าน

34.5

เจมมา 1

2.5 พันล้าน

22.0

เจมมา 2

2.6 พันล้าน

17.7

Mistral

7 พันล้าน

26.2

เจมมา 1

7 พันล้าน

32.3

เจมมา 2

9 พันล้าน

40.2

เจมมา 2

2.7 หมื่นล้าน

51.8

เจมมา 1

2.5 พันล้าน

29.2

เจมมา 2

2.6 พันล้าน

29.6

Mistral

7 พันล้าน

40.2

เจมมา 1

7 พันล้าน

44.4

เจมม่า 2

9 พันล้าน

52.4

เจมมา 2

2.7 หมื่นล้าน

62.6

*ข้อมูลเหล่านี้เป็นการเปรียบเทียบสำหรับโมเดลก่อนการฝึก โปรดดูรายละเอียดในรายงานทางเทคนิคเกี่ยวกับประสิทธิภาพร่วมกับวิธีการอื่นๆ

อ่านรายงานทางเทคนิค

ตระกูลโมเดล Gemma

มาใหม่

เจมม่า 2

Gemma 2 มีโมเดลใหม่ ทรงพลัง และมีประสิทธิภาพ 3 รูปแบบ ซึ่งมีให้เลือกในพารามิเตอร์ขนาด 2, 9 และ 27,000 ล้านรายการ โดยทั้งหมดมีความก้าวหน้าด้านความปลอดภัยในตัว

เริ่มต้นใช้งาน

เจมมา 1

โมเดล Gemma เป็นโมเดลภาษาขนาดใหญ่ที่ใช้ตัวถอดรหัสและตัวถอดรหัสที่ใช้ทรัพยากรน้อย ได้รับการฝึกจากชุดข้อมูลข้อความ โค้ด และเนื้อหาทางคณิตศาสตร์จำนวนมหาศาลสำหรับงานประมวลผลภาษาธรรมชาติที่หลากหลาย

เริ่มต้นใช้งาน

RecurrentGemma

RecurrentGemma เป็นโมเดลที่มีเอกลักษณ์ทางเทคนิคซึ่งใช้ประโยชน์จากโครงข่ายประสาทแบบเกิดซ้ำและความสนใจในท้องถิ่นเพื่อปรับปรุงประสิทธิภาพของหน่วยความจำ

เริ่มต้นใช้งาน

PaliGemma

PaliGemma เป็นโมเดลภาษาวิสัยทัศน์แบบเปิดที่ได้รับแรงบันดาลใจจาก PaLI-3 โดยใช้ประโยชน์จาก SigLIP และ Gemma ที่ออกแบบมาให้เป็นโมเดลอเนกประสงค์สำหรับการถ่ายโอนงานภาษาการมองเห็นที่หลากหลาย

เริ่มต้นใช้งาน

CodeGemma

การควบคุมจากรากฐานของโมเดล Gemma ดั้งเดิมก่อนการฝึกของเราทำให้ CodeGemma ได้รับการเขียนโค้ดที่ทรงพลังและความสามารถในการสร้างได้ในขนาดที่เหมาะกับคอมพิวเตอร์ในพื้นที่ของคุณ

เริ่มต้นใช้งาน

สำรวจเครื่องมือของเรา

ShieldGemma

ShieldGemma เป็นชุดโมเดลตัวแยกประเภทเนื้อหาด้านความปลอดภัยที่สร้างขึ้นจาก Gemma 2 เพื่อกรองอินพุตและเอาต์พุตของโมเดล AI และดูแลผู้ใช้ให้ปลอดภัย

ขอบเขตของ Gemma

Gemma Scope ช่วยให้นักวิจัยกระบวนการตัดสินใจของโมเดล Gemma 2 มีความโปร่งใสอย่างที่ไม่เคยมีมาก่อน

คู่มือเริ่มใช้งานฉบับย่อสำหรับนักพัฒนาซอฟต์แวร์

สำรวจการเริ่มต้นอย่างรวดเร็วใน Kaggle

ไปที่หน้าโมเดล Kaggle เพื่อค้นหาการเริ่มต้นอย่างรวดเร็ว ตัวอย่างโค้ด และการสนทนาเกี่ยวกับ Gemma

เปิดใน Kaggle

ฝึกและทำให้ใช้งานได้ใน Google Cloud

Gemma 2 ทำงานได้ดีที่สุดบน Google Cloud ด้วยการเพิ่มประสิทธิภาพ TPU จากต้นทางถึงปลายทางเพื่อประสิทธิภาพระดับชั้นนำของตลาดและต้นทุนรวมในการเป็นเจ้าของบน Vertex

เปิดใน Vertex AI

ลองใช้การปรับสำหรับผู้มีอันดับต่ำด้วย JAX ผ่าน Keras 3

ปรับโมเดล Gemma ให้เข้ากับโดเมนและข้อมูลเฉพาะของคุณด้วยเฟรมเวิร์กแบ็กเอนด์ที่คุณต้องการผ่าน Keras 3

เปิดใน Colab

ดูคู่มือเริ่มต้นฉบับย่อทั้งหมดในเอกสารประกอบของเรา ดูการเริ่มต้นอย่างรวดเร็วทั้งหมด

คู่มือเริ่มใช้งานฉบับย่อสำหรับพาร์ทเนอร์

หน้ากอด

ใช้ Hugging Face Transformers และ TRL สำหรับการปรับแต่งและการอนุมานด้วยโมเดล Gemma

NVIDIA

ปรับแต่งโมเดล Gemma ด้วย NVIDIA NeMo Framework และส่งออกไปยัง TensorRT-LLM เพื่อการใช้งานจริง

LangChain

บทแนะนำนี้จะแสดงวิธีเริ่มต้นใช้งาน Gemma และ LangChain ใน Google Cloud หรือในสภาพแวดล้อม Colab

ทุกขนาด

เอกสารเหล่านี้จะแสดงวิธีใช้ Gemma ผ่านปลายทาง Anyscale เป็นปลายทาง API ที่มีการจัดการครบวงจร

MongoDB

บทความนี้นำเสนอวิธีใช้ประโยชน์จาก Gemma เป็นโมเดลพื้นฐานในไปป์ไลน์หรือระบบการสร้างด้วยการเติมข้อมูลแบบดึงข้อมูล

น้ำหนักและการให้น้ำหนักพิเศษ

คุณเจาะลึกรายละเอียดเกี่ยวกับ Model Registry และเครื่องมือเปิดใช้ของ W&B ผ่านตัวอย่างแบบทีละขั้นตอนโดยใช้โมเดล Gemma ของ Google

ตำราอาหาร Gemma

สำรวจคอลเล็กชันสูตรอาหารที่ใช้ได้จริงและตัวอย่างที่แสดงให้เห็นถึงพลังและความอเนกประสงค์ของ Gemma สำหรับงานต่างๆ เช่น การใส่คำบรรยายภาพด้วย PaliGemma, การสร้างโค้ดด้วย CodeGemma และการสร้างแชทบ็อตด้วยโมเดล Gemma ที่ปรับแต่งมาอย่างดี

เริ่มทำอาหาร

เข้าถึงโมเดล Gemma วันนี้

โมเดล Kaggle

เข้าถึงโมเดล Gemma 2 ใน Kaggle

สวนโมเดล Vertex AI

ปรับแต่ง Gemma 2 ด้วยข้อมูลของคุณเอง

รูปแบบหน้ากอด

เข้าถึง ปรับแต่ง และติดตั้งใช้งาน Gemma

การพัฒนา AI อย่างมีความรับผิดชอบ

ความรับผิดชอบตามการออกแบบ

ผ่านการฝึกล่วงหน้าด้วยข้อมูลที่ได้รับการดูแลจัดการอย่างละเอียดและปรับแต่งเพื่อความปลอดภัยเป็นสำคัญ ช่วยส่งเสริมการพัฒนา AI ที่ปลอดภัยและมีความรับผิดชอบโดยใช้โมเดล Gemma

การประเมินที่มีประสิทธิภาพและโปร่งใส

การประเมินที่ครอบคลุมและการรายงานที่โปร่งใสเผยให้เห็นข้อจำกัดของโมเดลในการนำแนวทางที่มีความรับผิดชอบไปใช้ในแต่ละกรณี

ขับเคลื่อนการพัฒนาอย่างมีความรับผิดชอบ

ชุดเครื่องมือ Generative AI ที่มีความรับผิดชอบจะช่วยสนับสนุนให้นักพัฒนาแอปออกแบบและนำแนวทางปฏิบัติแนะนำสำหรับ AI ที่มีความรับผิดชอบไปใช้

สำรวจชุดเครื่องมือ Gen AI ที่มีความรับผิดชอบ

เพิ่มประสิทธิภาพเพื่อ Google Cloud

เมื่อใช้โมเดล Gemma บน Google Cloud คุณสามารถปรับแต่งโมเดลให้เหมาะกับความต้องการที่เฉพาะเจาะจงได้อย่างละเอียดด้วยเครื่องมือที่มีการจัดการครบวงจรของ Vertex AI หรือตัวเลือก GKE ที่จัดการด้วยตนเอง และทำให้ใช้งานได้ในโครงสร้างพื้นฐานที่ยืดหยุ่นและประหยัดด้วย AI ซึ่งเพิ่มประสิทธิภาพโดย AI

ดูข้อมูลเพิ่มเติมในบล็อก Google Cloud

การเร่งการวิจัยทางวิชาการด้วยเครดิต Google Cloud

พัฒนาการวิจัยของคุณด้วยโมเดล Gemma 2 ใน Google Cloud โมเดลแบบเปิดคลื่นลูกใหม่ช่วยขยายขอบเขตการสนับสนุนการวิจัยที่ล้ำสมัย สมัครตอนนี้เพื่อรับเครดิต Google Cloud เพื่อขยายขอบเขตการวิจัยและสนับสนุนความก้าวหน้าของชุมชนวิทยาศาสตร์

นักวิจัยที่ได้รับเลือกจะได้รับเครดิต Google Cloud เพื่อเร่งการพัฒนาด้านวิทยาศาสตร์

สมัครเลย

เข้าร่วมชุมชน

เชื่อมต่อ สำรวจ และแชร์ความรู้ของคุณกับคนอื่นๆ ในชุมชนโมเดล ML

Gemma Open Models

ออกแบบอย่างรับผิดชอบ

มีประสิทธิภาพที่เหนือกว่าทุกขนาด

เฟรมเวิร์กที่ยืดหยุ่น

ขอแนะนำ Gemma 2

ตระกูลโมเดล Gemma

เจมม่า 2

เจมมา 1

RecurrentGemma

PaliGemma

CodeGemma

สำรวจเครื่องมือของเรา

คู่มือเริ่มใช้งานฉบับย่อสำหรับนักพัฒนาซอฟต์แวร์

สำรวจการเริ่มต้นอย่างรวดเร็วใน Kaggle

ฝึกและทำให้ใช้งานได้ใน Google Cloud

ลองใช้การปรับสำหรับผู้มีอันดับต่ำด้วย JAX ผ่าน Keras 3

คู่มือเริ่มใช้งานฉบับย่อสำหรับพาร์ทเนอร์

ตำราอาหาร Gemma

เข้าถึงโมเดล Gemma วันนี้

การพัฒนา AI อย่างมีความรับผิดชอบ

เพิ่มประสิทธิภาพเพื่อ Google Cloud

การเร่งการวิจัยทางวิชาการด้วยเครดิต Google Cloud

เข้าร่วมชุมชน

Kaggle

Discord

บล็อก

ขอแนะนำ
Gemma 2