Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ในงาน I/O 2024 บริษัท Google ได้ประกาศเปิดตัวโมเดล Gemma 2 รุ่นถัดไป และตอนนี้บริษัทกำลังเปิดตัวโมเดลน้ำหนักเบาภายใต้ใบอนุญาตโอเพนซอร์สในที่สุด กล่าวกันว่าโมเดล Gemma 2 27B ใหม่นี้มีแนวโน้มที่ดีมาก โดยทำผลงานได้ดีกว่ารุ่นใหญ่กว่าบางรุ่น เช่น Llama 3 70B และ Qwen 1.5 32B เพื่อทดสอบข้อเรียกร้องนี้ เราลองเปรียบเทียบ Gemma 2 และ Llama 3 ซึ่งเป็น 2 โมเดลโอเพนซอร์สที่ดีที่สุดในปัจจุบัน

การเขียนเชิงสร้างสรรค์

ก่อนอื่นเรามาดูกันว่า Gemma 2 และ Llama 3 ดีแค่ไห��ในด้านการเขียนเชิงสร้างสรรค์ ผู้เขียนบทความขอให้ทั้งสองนางแบบเขียนเรื่องสั้นเกี่ยวกับความสัมพันธ์ระหว่างดวงจันทร์และดวงอาทิตย์ ทั้งสองโมเดลต่างก็ทำหน้าที่ได้ดี แต่โมเดล Gemma 2 ของ Google โดดเด่นด้วยสำนวนที่น่าดึงดูดและเรื่องราวที่ดี

Gemma 2 หรือ Llama 3 เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุด?

ในทางกลับกัน Llama 3 ดูค่อนข้างน่าเบื่อและเหมือนหุ่นยนต์ Google เก่งในการสร้างข้อความด้วยโมเดล Gemini มาโดยตลอด และ Gemma 2 27B ที่มีขนาดเล็กกว่าก็ไม่มีข้อยกเว้น

ตัวเลือกที่ชนะ: เจมม่า 2

การทดสอบหลายภาษา

ในรอบต่อไป มาดูกันว่าทั้งสองโมเดลจัดการกับภาษาที่ไม่ใช่ภาษาอังกฤษได้ดีแค่ไหน เนื่องจาก Google โฆษณาว่า Gemma 2 สามารถเข้าใจหลายภาษาได้ดี ผู้เขียนจึงเปรียบเทียบกับโมเดล Llama 3 ของ Meta ผู้เขียนขอให้ทั้งสองโมเดลแปลข้อความเป็นภาษาฮินดี ทั้ง Gemma 2 และ Llama 3 ต่างก็ทำผลงานได้ดีมาก

ผู้เขียนยังได้ลองใช้อีกภาษาหนึ่งคือภาษาเบงกาลี และแบบจำลองก็ให้ผลลัพธ์ที่ดีพอๆ กัน อย่างน้อยสำหรับภาษาอินเดีย สามารถพูดได้ว่า Gemma 2 และ Llama 3 ได้รับการฝึกอบรมอย่างดีบนคอร์ปัสขนาดใหญ่ อย่างไรก็ตาม Gemma 2 27B มีขนาดเล็กกว่า Llama 3 70B ถึง 2.5 เท่า ซึ่งทำให้ดูน่าประทับใจยิ่งขึ้น

ตัวเลือกในการชนะ: Gemma 2 และ Llama 3

ตรวจสอบตรรกะ

แม้ว่า Gemma 2 และ Llama 3 อาจไม่ใช่โมเดลที่ชาญฉลาดที่สุด แต่ก็สามารถทำการทดสอบการใช้เหตุผลทั่วไปได้เช่นเดียวกับโมเดลขนาดใหญ่กว่ามาก ในการเปรียบเทียบครั้งก่อนระหว่างLlama 3 กับ GPT-4โมเดล 70B ของ Meta ถือว่าน่าประทับใจเนื่องจากแสดงให้เห็นถึงความชาญฉลาดที่ดีแม้จะมีขนาดเล็กกว่าก็ตาม

ในรอบนี้ Llama 3 เอาชนะ Gemma 2 ได้ด้วยคะแนนที่แตกต่างกันอย่างมาก Llama 3 ตอบคำถามได้ถูกต้อง 2 ข้อจากทั้งหมด 3 ข้อ ในขณะที่ Gemma 2 พยายามจะตอบคำถามให้ถูกต้องแม้แต่ข้อเดียว Gemma 2 ไม่ได้รับการฝึกฝนให้แก้ปัญหาการใช้เหตุผลที่ซับซ้อน

ในทางกลับกัน Llama 3 มีรากฐานการใช้เหตุผลที่มั่นคง ซึ่งสามารถอนุมานได้จากชุดข้อมูลที่เข้ารหัส ถึงแม้จะมีขนาดเล็ก — อย่างน้อยก็เมื่อเทียบกับโมเดลล้านล้านพารามิเตอร์เช่น GPT-4 — แต่ก็แสดงให้เห็นถึงระดับสติปัญญาที่มากกว่าพอสมควร ท้ายที่สุด การใช้โทเค็นเพิ่มมากขึ้นในการฝึกโมเดลจะส่งผลให้ได้โมเดลที่มีประสิทธิภาพมากยิ่งขึ้น

ตัวเลือกที่ชนะ: ลามะ 3

ปฏิบัติตามคำแนะนำ

ในรอบต่อไป ผู้เขียนขอให้ Gemma 2 และ Llama 3 สร้างคำ 10 คำที่ลงท้ายด้วยคำว่า "NPU" และ Llama 3 ได้คำตอบที่ถูกต้อง 10/10 คะแนน ในทางตรงกันข้าม Gemma 2 สร้างประโยคที่ถูกต้องเพียง 7 ประโยคจากทั้งหมด 10 ประโยค ในรุ่นก่อนหน้านี้หลายรุ่น โมเดลของ Google รวมถึง Gemini ไม่ได้ปฏิบัติตามคำแนะนำของผู้ใช้ได้ดีนัก และแนวโน้มเดียวกันนี้ยังคงดำเนินต่อไปกับ Gemma 2

การปฏิบัติตามคำแนะนำของผู้ใช้เป็นสิ่งสำคัญสำหรับโมเดล AI ทำให้มั่นใจได้ถึงความน่าเชื่อถือและสร้างผลตอบรับที่ถูกต้องสำหรับสิ่งที่คุณสั่งสอน ด้านความปลอดภัยยังช่วยให้โมเดลนี้สอดคล้องกับโปรโตคอลความปลอดภัยได้ดีขึ้นอีกด้วย

ตัวเลือกที่ชนะ: ลามะ 3

ค้นหาข้อมูล

ทั้ง Gemma 2 และ Llama 3 มีความยาวบริบท 8,000 โทเค็น ผู้เขียนได้เพิ่มข้อความจำนวนมาก ซึ่งอ้างอิงจากหนังสือ Pride and Prejudice โดยตรง ซึ่งประกอบด้วยอักขระมากกว่า 17,000 ตัวและโทเค็น 3.8 พันรายการ ตามปกติ ผู้เขียนจะวางคำพูดสุ่มไว้ที่ไหนสักแห่งในข้อความและขอให้ทั้งสองนางแบบค้นหาคำพูดนั้น

Gemma 2 หาข้อมูลได้อย่างรวดเร็วและชี้ให้เห็นว่าคำพูดนั้นถูกแทรกเข้ามาแบบสุ่ม ลามะที่ 3 ยังพบและแนะนำว่าข้อเรียกร้องนี้ดูไม่เหมาะสม ในด้านหน่วยความจำบริบทยาว ถึงแม้จะจำกัดอยู่ที่โทเค็น 8K แต่ทั้งสองโมเดลก็ค่อนข้างแข็งแกร่งในแง่นี้

โปรดทราบว่าผู้เขียนได้รันการทดสอบนี้บน HuggingChat (เว็บ) เนื่องจาก meta.ai ปฏิเสธที่จะรันการแจ้งเตือนนี้ ซึ่งส่วนใหญ่อาจเป็นเพราะเนื้อหาที่มีลิขสิทธิ์

ตัวเลือกในการชนะ: Gemma 2 และ Llama 3

ตรวจหาอาการประสาทหลอน

โมเดลขนาดเล็กมีแนวโน้มที่จะประสบปัญหาภาพหลอนของ AI เนื่องจากข้อมูลการฝึกอบรมที่มีจำกัด โดยมักจะสร้างข้อมูลปลอมขึ้นเมื่อโมเดลพบกับหัวข้อที่ไม่คุ้นเคย ผู้เขียนจึงใช้ชื่อประเทศที่แต่งขึ้นเพื่อทดสอบว่า Gemma 2 และ Llama 3 เป็นภาพหลอนหรือไม่ และที่น่าแปลกใจก็คือพวกเขาไม่ได้ทำเช่นนั้น ซึ่งหมายความว่าทั้ง Google และ Meta ต่างก็มีรากฐานที่ดีพอสำหรับโมเดลของพวกเขา

ผู้เขียนยังตั้งคำถาม (ที่เป็นเท็จ) อีกข้อหนึ่งเพื่อทดสอบความถูกต้องของแบบจำลอง แต่ก็ไม่ได้ก่อให้เกิดอาการประสาทหลอนอีกเช่นกัน อย่างไรก็ตาม ผู้เขียนได้ทดสอบ Llama 3 บน HuggingChat ขณะที่ meta.ai สืบค้นข้อมูลปัจจุบันเกี่ยวกับหัวข้อที่เกี่ยวข้องบนอินเทอร์เน็ต

ตัวเลือกในการชนะ: Gemma 2 และ Llama 3

สรุป

แม้ว่าโมเดล Gemma 2 27B ของ Google จะไม่ทำงานได้ดีในการทดสอบการใช้เหตุผล แต่ก็สามารถทำงานอื่นๆ ได้อีกมากมาย เหมาะสำหรับการเขียนเชิงสร้างสรรค์ รองรับหลายภาษา มีหน่วยความจำที่ดี และที่สำคัญไม่ทำให้เกิดอาการประสาทหลอนเหมือนรุ่นก่อนๆ

Llama 3 ดีกว่าแน่นอน แต่ยังเป็นโมเดลที่ใหญ่กว่าอย่างมาก ซึ่งได้รับการฝึกด้วยพารามิเตอร์ 70 พันล้านรายการ นักพัฒนาจะพบว่าโมเดล Gemma 2 27B มีประโยชน์สำหรับกรณีการใช้งานที่หลากหลาย และเพื่อความคุ้มค่า Gemma 2 9B ก็มีจำหน่ายเช่นกัน

นอกจากนี้ ผู้ใช้ควรตรวจสอบ Gemini 1.5 Flash ซึ่งเป็นรุ่นที่เล็กกว่ามากและยังรองรับอินพุตหลายโหมดด้วย ไม่ต้องพูดถึง มันเร็วและมีประสิทธิภาพอย่างเหลือเชื่อ

ฝากความเห็น

ความเห็น *

ชื่อ *

เว็บไซต์

การแก้ไขปัญหาแท็บข้อผิดพลาดของ Microsoft Teams Planner

ติดปัญหาแท็บ Planner ใน Microsoft Teams ใช่ไหม? มาดูวิธีแก้ไขปัญหาทีละขั้นตอนสำหรับปัญหาทั่วไป เช่น การโหลดล้มเหลว ข้อผิดพลาดด้านสิทธิ์ และปัญหาการซิงค์ ทำให้แท็บ Planner ของคุณใช้งานได้อย่างราบรื่นใน Teams ได้แล้ววันนี้

การแก้ไขปัญหาข้อผิดพลาดในการโทรวิดีโอของ Microsoft Teams

กำลังประสบปัญหาเกี่ยวกับการโทรผ่านวิดีโอใน Microsoft Teams อยู่ใช่ไหม? ค้นพบวิธีแก้ไขปัญหาแบบทีละขั้นตอนที่ได้รับการพิสูจน์แล้ว สำหรับปัญหาเกี่ยวกับวิดีโอ ปัญหาเกี่ยวกับกล้อง และอื่นๆ อีกมากมาย กลับมาโทรได้อย่างราบรื่นในไม่กี่นาที!

การแก้ไขปัญหา Microsoft Teams ข้อผิดพลาดของ Microsoft ใน Teams

เบื่อไหมกับปัญหาข้อผิดพลาดของ Microsoft ที่ทำให้ Microsoft Teams ของคุณล่ม? พบกับขั้นตอนการแก้ไขปัญหาข้อผิดพลาดของ Microsoft Teams ทีละขั้นตอน ตั้งแต่การล้างแคชไปจนถึงวิธีแก้ไขขั้นสูง กลับมาทำงานร่วมกันได้อย่างราบรื่นอีกครั้งในวันนี้!

การแก้ไขปัญหาข้อผิดพลาดในการเข้าสู่ระบบ Microsoft Teams บน Chromebook

ติดปัญหาการเข้าสู่ระบบ Microsoft Teams บน Chromebook ใช่ไหม? คู่มือการแก้ไขปัญหาฉบับสมบูรณ์ของเราจะช่วยคุณแก้ไขปัญหาได้อย่างรวดเร็วและเชื่อถือได้ ไม่ว่าจะเป็นปัญหาเกี่ยวกับแคช การอัปเดต และอื่นๆ แก้ปัญหาได้ภายในไม่กี่นาทีและเชื่อมต่อได้อย่างต่อเนื่อง!

วิธีแก้ไขข้อผิดพลาดในการดาวน์โหลด Microsoft Teams สำหรับพีซี

เบื่อกับข้อผิดพลาดในการดาวน์โหลด Microsoft Teams สำหรับพีซีที่ขัดขวางการทำงานของคุณใช่ไหม? ทำตามคำแนะนำทีละขั้นตอนที่ได้รับการพิสูจน์แล้วของเราเพื่อแก้ไขปัญหาอย่างรวดเร็วและทำให้ Teams ทำงานได้อย่างราบรื่นบนพีซีของคุณในวันนี้

การแก้ไขปัญหาอาการหน่วงของการประชุมทางวิดีโอ Microsoft Teams บน Wi-Fi

กำลังประสบปัญหาภาพกระตุกขณะใช้งาน Microsoft Teams ผ่าน Wi-Fi อยู่ใช่ไหม? คู่มือแก้ไขปัญหาฉบับสมบูรณ์นี้จะนำเสนอวิธีแก้ไขปัญหาอย่างรวดเร็ว เคล็ดลับขั้นสูง และการปรับแต่ง Wi-Fi เพื่อให้การสนทนาทางวิดีโอของคุณกลับมาคมชัดอีกครั้งในทันที

การแก้ไขปัญหาการวนซ้ำขณะเริ่มต้นใช้งานหน้าจอต้อนรับของ Microsoft Teams

รู้สึกหงุดหงิดกับการวนลูปของหน้าจอต้อนรับใน Microsoft Teams ใช่ไหม? ลองทำตามขั้นตอนการแก้ไขปัญหาการวนลูปของหน้าจอต้อนรับใน Microsoft Teams ที่เราแนะนำ: ล้างแคช รีเซ็ตแอป และติดตั้งใหม่ กลับมาใช้งานร่วมกันได้อย่างราบรื่นภายในไม่กี่นาที!

ทำไมสถานะใน Microsoft Teams ของฉันถึงค้างอยู่ที่ ไม่อยู่?

รู้สึกหงุดหงิดกับสถานะ "ไม่อยู่" ใน Microsoft Teams ที่ค้างอยู่ใช่ไหม? พบกับสาเหตุหลักๆ เช่น การหมดเวลาการใช้งาน และการตั้งค่าพลังงาน พร้อมวิธีแก้ไขทีละขั้นตอนเพื่อให้กลับมาเป็น "พร้อมใช้งาน" ได้อย่างรวดเร็ว อัปเดตด้วยฟีเจอร์ Teams ล่าสุดแล้ว

เหตุใดส่วนเสริม Microsoft Teams จึงหายไปจาก Outlook ของฉัน?

รู้สึกหงุดหงิดเพราะปลั๊กอิน Microsoft Teams หายไปจาก Outlook ใช่ไหม? มาดูสาเหตุหลักและวิธีแก้ไขง่ายๆ ทีละขั้นตอน เพื่อให้การใช้งาน Teams และ Outlook กลับมาราบรื่นอีกครั้งโดยไม่ต้องยุ่งยาก ใช้งานได้กับเวอร์ชันล่าสุด!

วิธีแก้ไขข้อผิดพลาดในการเล่นสื่อของ Microsoft Teams ในปี 2026

เบื่อกับปัญหาการเล่นสื่อใน Microsoft Teams ที่ทำให้การประชุมปี 2026 ของคุณเสียบรรยากาศใช่ไหม? ทำตามคำแนะนำทีละขั้นตอนจากผู้เชี่ยวชาญของเราเพื่อแก้ไขปัญหาเสียง วิดีโอ และการแชร์ได้อย่างรวดเร็ว โดยไม่ต้องมีความรู้ด้านเทคนิคใดๆ การทำงานร่วมกันอย่างราบรื่นรอคุณอยู่!