Alibaba เพิ่งประกาศโมเดลการใช้เหตุผลใหม่ล่าสุดอย่างเป็นทางการ และดูเหมือนว่า DeepSeek และ OpenAI มีสาเหตุที่ต้องกังวล หากว่า "กระแสฮือฮา" ทั้งหมดของ Alibaba เป็นเรื่องจริง โมเดลนี้เป็นโอเพ่นซอร์ส ดังนั้นทุกคนสามารถเข้าถึงและสัมผัสได้ฟรี
QwQ-32b (Quan-with-Questions) คือโมเดล AI ใหม่ของ Alibaba ที่ทำงานบนพารามิเตอร์น้อยกว่าโมเดลภาษาหลักเกือบทั้งหมดในปัจจุบันอย่างมาก ซึ่งหมายความว่าต้องใช้ทรัพยากรน้อยลง อาลีบาบาอ้างว่า QwQ-32b ทำงานได้ในระดับเดียวกับ DeepSeek หรือ o1-mini ของ OpenAI
โมเดลภาษาขนาดใหญ่ DeepSeek-R1 (LLM) สร้างกระแสเมื่อเปิดตัวในช่วงต้นเดือนกุมภาพันธ์ ท้าทายมาตรฐานทองคำที่ ChatGPT ตั้งไว้ แต่มีต้นทุนการดำเนินงานต่ำกว่ามาก ด้วย QwQ-32b ดูเหมือนว่า Alibaba ต้องการที่จะผลักดันขีดจำกัดนี้ไปไกลยิ่งขึ้น
ในทางเทคนิคแล้ว DeepSeek-R1 ต้องมีพารามิเตอร์ 671 พันล้านตัวจึงจะทำงานได้ โดยมีพารามิเตอร์ที่เปิดใช้งานอยู่ 37 พันล้านตัว ในขณะเดียวกัน QwQ-32b ของ Alibaba ต้องการพารามิเตอร์เพียง 32 พันล้านพารามิเตอร์เท่านั้น ตัวเลขเหล่านี้อาจดูเป็นนามธรรมสำหรับหลายๆ คน แต่ตัวเลขเหล่านี้สร้างความแตกต่างมหาศาลในด้านพลังการประมวลผล: ในขณะที่ DeepSeek-R1 ต้องใช้ VRAM 1,600GB เพื่อทำงาน QwQ-32b ต้องการ VRAM เพียง 24GB เท่านั้น ในกรณีส่วนใหญ่จะต้องใช้การ์ดจอเช่น Nvidia H100 หรือเทียบเท่า แต่แม้แต่ RTX 4090 ที่เป็นมิตรกับเกมเมอร์ก็ยังมี VRAM 24GB RTX 5090 รุ่นล่าสุดเพิ่มตัวเลขนี้เป็น 32GB
ยังมีการถกเถียงกันว่าแม้จะมีพารามิเตอร์เพียง 32 พันล้านตัว แต่ QwQ-32B ก็ยังให้ประสิทธิภาพเท่าเทียมหรือดีกว่า R1 ในด้านต่างๆ เช่น คณิตศาสตร์ การเขียนโปรแกรม และการแก้ปัญหาโดยทั่วไป นอกจากนี้ อาลีบาบายังกล่าวอีกว่า QwQ-32B มีประสิทธิภาพเหนือกว่า o1-mini ของ OpenAI ซึ่งสร้างขึ้นด้วยพารามิเตอร์ 100 พันล้านรายการ QwQ-32B มีจำหน่ายบน Hugging Face ซึ่งเป็นชุมชนโอเพ่นซอร์สโมเดล AI ที่ใหญ่ที่สุดในโลก

QwQ-32b ของ Alibaba พร้อมใช้งานภายใต้ใบอนุญาต Apache 2.0 ซึ่งหมายความว่าบริษัทต่างๆ และนักวิจัยสามารถใช้งานได้อย่างเสรี ที่สำคัญกว่านั้นเราสามารถลองใช้งานผ่าน Qwen Chat ของ Alibaba ได้ เช่นเดียวกับ DeepSeek, QwQ-32b มีข้อจำกัดบางประการในแง่ของขอบเขตเรื่อง เช่น เมื่อถูกถามเกี่ยวกับประเด็นทางการเมือง Qwen Chat จะตอบไปว่านี่เป็นหัวข้อที่ไม่เหมาะสม แต่ก็มีข้อดีบางประการที่เห็นได้ชัดทันที
QwQ-32b ดูเหมือนจะให้คำตอบที่ค่อนข้างละเอียดแม้กระทั่งกับคำถามสั้นๆ และง่ายๆ นี่อาจเป็นเรื่องดี แต่ในทางหนึ่งก็ค่อนข้างน่ารำคาญ เนื่องจากมีข้อมูลที่ไม่จำเป็นมากมายที่คุณไม่ได้ร้องขอ ข้อดีอย่างหนึ่งคือ QwQ-32b สามารถแสดงกระบวนการใช้เหตุผลทั้งหมดได้ ซึ่งคล้ายกับฟีเจอร์ Deep Thinking ของ ChatGPT แต่มีความลึกน้อยกว่า
ยังต้องรอดูว่าคำกล่าวอ้างของ Alibaba จะเป็นจริงหรือไม่ แต่ดูเหมือนว่า ChatGPT และ DeepSeek จะมีคู่แข่งใหม่ที่คู่ควรแล้ว