Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ในงาน I/O 2024 บริษัท Google ได้ประกาศเปิดตัวโมเดล Gemma 2 รุ่นถัดไป และตอนนี้บริษัทกำลังเปิดตัวโมเดลน้ำหนักเบาภายใต้ใบอนุญาตโอเพนซอร์สในที่สุด กล่าวกันว่าโมเดล Gemma 2 27B ใหม่นี้มีแนวโน้มที่ดีมาก โดยทำผลงานได้ดีกว่ารุ่นใหญ่กว่าบางรุ่น เช่น Llama 3 70B และ Qwen 1.5 32B เพื่อทดสอบข้อเรียกร้องนี้ เราลองเปรียบเทียบ Gemma 2 และ Llama 3 ซึ่งเป็น 2 โมเดลโอเพนซอร์สที่ดีที่สุดในปัจจุบัน

การเขียนเชิงสร้างสรรค์

ก่อนอื่นเรามาดูกันว่า Gemma 2 และ Llama 3 ดีแค่ไห��ในด้านการเขียนเชิงสร้างสรรค์ ผู้เขียนบทความขอให้ทั้งสองนางแบบเขียนเรื่องสั้นเกี่ยวกับความสัมพันธ์ระหว่างดวงจันทร์และดวงอาทิตย์ ทั้งสองโมเดลต่างก็ทำหน้าที่ได้ดี แต่โมเดล Gemma 2 ของ Google โดดเด่นด้วยสำนวนที่น่าดึงดูดและเรื่องราวที่ดี

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?
Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ในทางกลับกัน Llama 3 ดูค่อนข้างน่าเบื่อและเหมือนหุ่นยนต์ Google เก่งในการสร้างข้อความด้วยโมเดล Gemini มาโดยตลอด และ Gemma 2 27B ที่มีขนาดเล็กกว่าก็ไม่มีข้อยกเว้น

ตัวเลือกที่ชนะ: เจมม่า 2

การทดสอบหลายภาษา

ในรอบต่อไป มาดูกันว่าทั้งสองโมเดลจัดการกับภาษาที่ไม่ใช่ภาษาอังกฤษได้ดีแค่ไหน เนื่องจาก Google โฆษณาว่า Gemma 2 สามารถเข้าใจหลายภาษาได้ดี ผู้เขียนจึงเปรียบเทียบกับโมเดล Llama 3 ของ Meta ผู้เขียนขอให้ทั้งสองโมเดลแปลข้อความเป็นภาษาฮินดี ทั้ง Gemma 2 และ Llama 3 ต่างก็ทำผลงานได้ดีมาก

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?
Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ผู้เขียนยังได้ลองใช้อีกภาษาหนึ่งคือภาษาเบงกาลี และแบบจำลองก็ให้ผลลัพธ์ที่ดีพอๆ กัน อย่างน้อยสำหรับภาษาอินเดีย สามารถพูดได้ว่า Gemma 2 และ Llama 3 ได้รับการฝึกอบรมอย่างดีบนคอร์ปัสขนาดใหญ่ อย่างไรก็ตาม Gemma 2 27B มีขนาดเล็กกว่า Llama 3 70B ถึง 2.5 เท่า ซึ่งทำให้ดูน่าประทับใจยิ่งขึ้น

ตัวเลือกในการชนะ: Gemma 2 และ Llama 3

ตรวจสอบตรรกะ

แม้ว่า Gemma 2 และ Llama 3 อาจไม่ใช่โมเดลที่ชาญฉลาดที่สุด แต่ก็สามารถทำการทดสอบการใช้เหตุผลทั่วไปได้เช่นเดียวกับโมเดลขนาดใหญ่กว่ามาก ในการเปรียบเทียบครั้งก่อนระหว่างLlama 3 กับ GPT-4โมเดล 70B ของ Meta ถือว่าน่าประทับใจเนื่องจากแสดงให้เห็นถึงความชาญฉลาดที่ดีแม้จะมีขนาดเล็กกว่าก็ตาม

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?
Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ในรอบนี้ Llama 3 เอาชนะ Gemma 2 ได้ด้วยคะแนนที่แตกต่างกันอย่างมาก Llama 3 ตอบคำถามได้ถูกต้อง 2 ข้อจากทั้งหมด 3 ข้อ ในขณะที่ Gemma 2 พยายามจะตอบคำถามให้ถูกต้องแม้แต่ข้อเดียว Gemma 2 ไม่ได้รับการฝึกฝนให้แก้ปัญหาการใช้เหตุผลที่ซับซ้อน

ในทางกลับกัน Llama 3 มีรากฐานการใช้เหตุผลที่มั่นคง ซึ่งสามารถอนุมานได้จากชุดข้อมูลที่เข้ารหัส ถึงแม้จะมีขนาดเล็ก — อย่างน้อยก็เมื่อเทียบกับโมเดลล้านล้านพารามิเตอร์เช่น GPT-4 — แต่ก็แสดงให้เห็นถึงระดับสติปัญญาที่มากกว่าพอสมควร ท้ายที่สุด การใช้โทเค็นเพิ่มมากขึ้นในการฝึกโมเดลจะส่งผลให้ได้โมเดลที่มีประสิทธิภาพมากยิ่งขึ้น

ตัวเลือกที่ชนะ: ลามะ 3

ปฏิบัติตามคำแนะนำ

ในรอบต่อไป ผู้เขียนขอให้ Gemma 2 และ Llama 3 สร้างคำ 10 คำที่ลงท้ายด้วยคำว่า "NPU" และ Llama 3 ได้คำตอบที่ถูกต้อง 10/10 คะแนน ในทางตรงกันข้าม Gemma 2 สร้างประโยคที่ถูกต้องเพียง 7 ประโยคจากทั้งหมด 10 ประโยค ในรุ่นก่อนหน้านี้หลายรุ่น โมเดลของ Google รวมถึง Gemini ไม่ได้ปฏิบัติตามคำแนะนำของผู้ใช้ได้ดีนัก และแนวโน้มเดียวกันนี้ยังคงดำเนินต่อไปกับ Gemma 2

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?
Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

การปฏิบัติตามคำแนะนำของผู้ใช้เป็นสิ่งสำคัญสำหรับโมเดล AI ทำให้มั่นใจได้ถึงความน่าเชื่อถือและสร้างผลตอบรับที่ถูกต้องสำหรับสิ่งที่คุณสั่งสอน ด้านความปลอดภัยยังช่วยให้โมเดลนี้สอดคล้องกับโปรโตคอลความปลอดภัยได้ดีขึ้นอีกด้วย

ตัวเลือกที่ชนะ: ลามะ 3

ค้นหาข้อมูล

ทั้ง Gemma 2 และ Llama 3 มีความยาวบริบท 8,000 โทเค็น ผู้เขียนได้เพิ่มข้อความจำนวนมาก ซึ่งอ้างอิงจากหนังสือ Pride and Prejudice โดยตรง ซึ่งประกอบด้วยอักขระมากกว่า 17,000 ตัวและโทเค็น 3.8 พันรายการ ตามปกติ ผู้เขียนจะวางคำพูดสุ่มไว้ที่ไหนสักแห่งในข้อความและขอให้ทั้งสองนางแบบค้นหาคำพูดนั้น

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

Gemma 2 หาข้อมูลได้อย่างรวดเร็วและชี้ให้เห็นว่าคำพูดนั้นถูกแทรกเข้ามาแบบสุ่ม ลามะที่ 3 ยังพบและแนะนำว่าข้อเรียกร้องนี้ดูไม่เหมาะสม ในด้านหน่วยความจำบริบทยาว ถึงแม้จะจำกัดอยู่ที่โทเค็น 8K แต่ทั้งสองโมเดลก็ค่อนข้างแข็งแกร่งในแง่นี้

โปรดทราบว่าผู้เขียนได้รันการทดสอบนี้บน HuggingChat (เว็บ) เนื่องจาก meta.ai ปฏิเสธที่จะรันการแจ้งเตือนนี้ ซึ่งส่วนใหญ่อาจเป็นเพราะเนื้อหาที่มีลิขสิทธิ์

ตัวเลือกในการชนะ: Gemma 2 และ Llama 3

ตรวจหาอาการประสาทหลอน

โมเดลขนาดเล็กมีแนวโน้มที่จะประสบปัญหาภาพหลอนของ AI เนื่องจากข้อมูลการฝึกอบรมที่มีจำกัด โดยมักจะสร้างข้อมูลปลอมขึ้นเมื่อโมเดลพบกับหัวข้อที่ไม่คุ้นเคย ผู้เขียนจึงใช้ชื่อประเทศที่แต่งขึ้นเพื่อทดสอบว่า Gemma 2 และ Llama 3 เป็นภาพหลอนหรือไม่ และที่น่าแปลกใจก็คือพวกเขาไม่ได้ทำเช่นนั้น ซึ่งหมายความว่าทั้ง Google และ Meta ต่างก็มีรากฐานที่ดีพอสำหรับโมเดลของพวกเขา

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?
Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?
Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ผู้เขียนยังตั้งคำถาม (ที่เป็นเท็จ) อีกข้อหนึ่งเพื่อทดสอบความถูกต้องของแบบจำลอง แต่ก็ไม่ได้ก่อให้เกิดอาการประสาทหลอนอีกเช่นกัน อย่างไรก็ตาม ผู้เขียนได้ทดสอบ Llama 3 บน HuggingChat ขณะที่ meta.ai สืบค้นข้อมูลปัจจุบันเกี่ยวกับหัวข้อที่เกี่ยวข้องบนอินเทอร์เน็ต

ตัวเลือกในการชนะ: Gemma 2 และ Llama 3

สรุป

แม้ว่าโมเดล Gemma 2 27B ของ Google จะไม่ทำงานได้ดีในการทดสอบการใช้เหตุผล แต่ก็สามารถทำงานอื่นๆ ได้อีกมากมาย เหมาะสำหรับการเขียนเชิงสร้างสรรค์ รองรับหลายภาษา มีหน่วยความจำที่ดี และที่สำคัญไม่ทำให้เกิดอาการประสาทหลอนเหมือนรุ่นก่อนๆ

Llama 3 ดีกว่าแน่นอน แต่ยังเป็นโมเดลที่ใหญ่กว่าอย่างมาก ซึ่งได้รับการฝึกด้วยพารามิเตอร์ 70 พันล้านรายการ นักพัฒนาจะพบว่าโมเดล Gemma 2 27B มีประโยชน์สำหรับกรณีการใช้งานที่หลากหลาย และเพื่อความคุ้มค่า Gemma 2 9B ก็มีจำหน่ายเช่นกัน

นอกจากนี้ ผู้ใช้ควรตรวจสอบ Gemini 1.5 Flash ซึ่งเป็นรุ่นที่เล็กกว่ามากและยังรองรับอินพุตหลายโหมดด้วย ไม่ต้องพูดถึง มันเร็วและมีประสิทธิภาพอย่างเหลือเชื่อ

Sign up and earn $1000 a day ⋙

Leave a Comment

คำแนะนำเกี่ยวกับวิธีการเล่น Zuka Lien Quan Mobile ซีซั่น S1 2023

คำแนะนำเกี่ยวกับวิธีการเล่น Zuka Lien Quan Mobile ซีซั่น S1 2023

ซูกะคือนักฆ่าที่รู้จักกันว่าเป็นผู้สร้างความหวาดกลัวให้กับแชมเปี้ยนที่พลังชีวิตต่ำ เรียนรู้วิธีใช้ Zuka อย่างมีประสิทธิภาพในซีซั่นที่ 23

รหัส Heroic Era ล่าสุดและวิธีแลกรหัส

รหัส Heroic Era ล่าสุดและวิธีแลกรหัส

การรับของขวัญผ่านรหัสของขวัญ Heroic Age เป็นสิ่งที่ผู้เล่นใหม่เกือบทั้งหมดทำเมื่อเข้าร่วมเกม

ผู้ให้บริการที่เก็บข้อมูลบนคลาวด์ราคาถูกที่สุด 8 อันดับ

ผู้ให้บริการที่เก็บข้อมูลบนคลาวด์ราคาถูกที่สุด 8 อันดับ

มาดูตัวเลือกการจัดเก็บข้อมูลบนคลาวด์ออนไลน์ราคาถูกที่สุดที่มีกัน บทความนี้จะพิจารณาราคาทั้งในแง่ราคาแน่นอนและต่อกิกะไบต์ (ต่อเดือน) เพื่อให้คุณเลือกสิ่งที่ดีที่สุดสำหรับคุณได้

ข้อผิดพลาดเครื่องหมายปอนด์ (####) ใน Excel คืออะไร

ข้อผิดพลาดเครื่องหมายปอนด์ (####) ใน Excel คืออะไร

#### ใน Excel เป็นข้อผิดพลาดทั่วไปของ Excel และปรากฏในหลายกรณีเมื่อเราป้อนข้อมูลใน Excel, ฟังก์ชันใน Excel, หรือป้อนสูตรใน Excel

การตั้งค่า 12 อย่างบนโทรศัพท์ Samsung Galaxy ที่คุณควรเปลี่ยน

การตั้งค่า 12 อย่างบนโทรศัพท์ Samsung Galaxy ที่คุณควรเปลี่ยน

เพิ่งซื้อโทรศัพท์ Samsung Galaxy และต้องการกำหนดค่าหรือไม่? นี่คือการตั้งค่า 10 ประการที่คุณควรเปลี่ยนเพื่อให้โทรศัพท์ Samsung ของคุณทำงานได้ดีขึ้น

รหัส Murder Mystery 2 ล่าสุดและวิธีการเข้า

รหัส Murder Mystery 2 ล่าสุดและวิธีการเข้า

Code Murder Mystery 2 ช่วยให้ผู้เล่นสามารถเลือกสกินมีดเพิ่มเติมให้กับตัวละครของพวกเขาหรือรับเงินมากขึ้นเพื่อใช้บริการและซื้อสิ่งอื่น ๆ ในเกม

28 แบบการ์ดวันเกิดสวยๆ พร้อมคำอวยพรดีๆ สำหรับพ่อแม่ คู่สมรส คนรัก เพื่อน

28 แบบการ์ดวันเกิดสวยๆ พร้อมคำอวยพรดีๆ สำหรับพ่อแม่ คู่สมรส คนรัก เพื่อน

ในวันเกิดของคนรัก พ่อแม่ เพื่อน พี่น้อง เพื่อนร่วมงาน... นอกจากของขวัญแล้ว อย่าลืมส่งการ์ดวันเกิดพร้อมคำอวยพรด้วย

ปริศนาการจีบสาวแสนสนุกแต่แสนหวานที่จะ “จับใจ” คนที่คุณแอบชอบ

ปริศนาการจีบสาวแสนสนุกแต่แสนหวานที่จะ “จับใจ” คนที่คุณแอบชอบ

แบบทดสอบสนุกๆ เหล่านี้จะช่วยให้คุณสร้างความประทับใจและพิชิตใจคนที่คุณแอบชอบได้อย่างรวดเร็วและมีความสุข

Corki DTCL ซีซั่น 7: ไอเทมสร้างมาตรฐานทีม Corki Gunner

Corki DTCL ซีซั่น 7: ไอเทมสร้างมาตรฐานทีม Corki Gunner

Corki DTCL ซีซั่นที่ 7 ต้องการการปกป้องหรือการสนับสนุนเพื่อสร้างการควบคุมหากเขาต้องการที่จะเป็นอิสระในการทำลายทีมศัตรู ในขณะเดียวกันอุปกรณ์ของ Corki ก็ต้องเป็นมาตรฐานด้วยจึงจะสร้างความเสียหายได้อย่างมีประสิทธิภาพยิ่งขึ้น

วิธีดาวน์โหลด Mini World Royale และคำแนะนำในการเล่น

วิธีดาวน์โหลด Mini World Royale และคำแนะนำในการเล่น

นี่คือลิงก์ดาวน์โหลดสำหรับ Mini World Royale และคำแนะนำในการเล่น เราจะมีสองเวอร์ชัน: Mini World Royale APK และ Mini World Royale iOS

1314 คืออะไร?

1314 คืออะไร?

1314 เป็นตัวเลขที่วัยรุ่นมักใช้เป็นรหัสแสดงความรัก อย่างไรก็ตาม ไม่ใช่ทุกคนที่รู้ว่า 1314 คืออะไรและหมายถึงอะไร

วิธีปกป้องสุขภาพจิตและร่างกายของคุณเมื่ออยู่ในสภาพแวดล้อมที่เป็นพิษ

วิธีปกป้องสุขภาพจิตและร่างกายของคุณเมื่ออยู่ในสภาพแวดล้อมที่เป็นพิษ

การจัดการกับสถานการณ์ที่เป็นพิษอาจเป็นเรื่องยากอย่างยิ่ง ต่อไปนี้เป็นเคล็ดลับบางประการที่จะช่วยให้คุณจัดการกับสภาพแวดล้อมที่เป็นพิษได้อย่างชาญฉลาดและรักษาความสงบในจิตใจ

ดนตรีช่วยกระตุ้นสมองอย่างไร

ดนตรีช่วยกระตุ้นสมองอย่างไร

คนส่วนใหญ่รู้ว่าดนตรีไม่ได้มีไว้เพื่อความบันเทิงเพียงอย่างเดียว แต่ยังมีประโยชน์อื่นๆ อีกมากมาย ต่อไปนี้เป็นวิธีบางอย่างที่ดนตรีช่วยกระตุ้นการพัฒนาสมองของเรา

สารอาหารที่ขาดหายมากที่สุดในอาหาร

สารอาหารที่ขาดหายมากที่สุดในอาหาร

การรับประทานอาหารเป็นสิ่งสำคัญมากต่อสุขภาพของเรา แต่อาหารของเราส่วนใหญ่มักขาดสารอาหารสำคัญทั้ง 6 ชนิดนี้

วิธีใช้แอป CK Club ของ Circle K เพื่อรับข้อเสนอสุดพิเศษ

วิธีใช้แอป CK Club ของ Circle K เพื่อรับข้อเสนอสุดพิเศษ

หากต้องการรับข้อมูลโปรโมตจาก Circle K อย่างรวดเร็วที่สุด คุณควรติดตั้งแอป CK Club แอปพลิเคชันช่วยบันทึกการชำระเงินเมื่อช้อปปิ้งหรือชำระเงินที่ Circle K รวมถึงจำนวนแสตมป์ที่สะสมไว้