Deepseek เปิดตัว Free Language Model v3 ที่ทำงานได้ดีบนการกำหนดค่าฮาร์ดแวร์ทั่วไป

DeepSeek ซึ่งเป็นบริษัทสตาร์ทอัพด้าน AI ของจีน เพิ่งเปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ล่าสุดอย่างเป็นทางการ DeepSeek-V3-0324 ด้วยความจุสูงถึง 641GB รุ่นนี้ได้รับการประกาศบนแพลตฟอร์ม AI Hugging Faceโดยไม่มีการเปิดเผยข้อมูลมากนัก สอดคล้องกับสไตล์การปิดบังเกี่ยวกับผลิตภัณฑ์ใหม่ที่บริษัทนำมาใช้เสมอมา

สิ่งที่พิเศษเกี่ยวกับโมเดลนี้คือใบอนุญาต MIT ซึ่งอนุญาตให้ใช้ฟรีสำหรับวัตถุประสงค์เชิงพาณิชย์ ผลการประเมินประสิทธิภาพเบื้องต้นแสดงให้เห็นว่า DeepSeek-V3-0324 สามารถทำงานบนฮาร์ดแวร์คอนฟิกูเรชันหลัก เช่น Mac Studio ของ Apple ที่มีชิป M3 Ultra นักวิทยาศาสตร์ AI Awni Hannun รายงานว่าสามารถบรรลุความเร็วการประมวลผลมากกว่า 20 โทเค็นต่อวินาทีด้วยการกำหนดค่านี้ ความสามารถในการรันโมเดลภาษาขนาดใหญ่บนฮาร์ดแวร์ทั่วไปภายในองค์กรนี้แตกต่างอย่างสิ้นเชิงกับแนวทางดั้งเดิมในการใช้โครงสร้างพื้นฐานของศูนย์ข้อมูลขนาดใหญ่เพื่อรองรับโมเดล AI ขั้นสูง

Deepseek เปิดตัว Free Language Model v3 ที่ทำงานได้ดีบนการกำหนดค่าฮาร์ดแวร์ทั่วไป

ตามข้อมูลจาก DeepSeek การทดสอบเบื้องต้นแสดงให้เห็นถึงการปรับปรุงที่สำคัญเมื่อเทียบกับเวอร์ชันก่อนหน้า แบบจำลองนี้ได้รับการทดสอบอย่างเข้มงวดโดยผู้มีส่วนได้ส่วนเสียภายในและแสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยม ถึงแม้จะเหนือกว่าแบบจำลองอื่น ๆ ที่แข่งขันกันและเอาชนะ Claude Sonnet 3.5 ของ Anthropic ในงานที่ไม่ต้องใช้การคิดเชิงลึกก็ตาม อย่างไรก็ตาม แตกต่างจากโมเดลสไตล์ Sonnet ที่ต้องมีการสมัครสมาชิกแบบชำระเงิน DeepSeek-V3-0324 สามารถดาวน์โหลดและใช้งานได้ฟรีอย่างสมบูรณ์

ในทางเทคนิค DeepSeek-V3-0324 จะใช้สถาปัตยกรรมแบบผสมผู้เชี่ยวชาญ (MoE) โดดเด่นด้วยความสามารถในการเลือกใช้พารามิเตอร์ได้ประมาณ 37 พันล้านรายการจากทั้งหมด 685 พันล้านรายการต่องาน เพิ่มประสิทธิภาพด้วยการลดความต้องการในการคำนวณในขณะที่ยังคงประสิทธิภาพการทำงานไว้ โมเดลนี้ยังใช้เทคโนโลยี Multi-Head Latent Attention (MLA) และ Multi-Token Prediction (MTP) ซึ่งช่วยปรับปรุงหน่วยความจำบริบทและเพิ่มความเร็วเอาต์พุต

ผู้ใช้สามารถเข้าถึง DeepSeek-V3-0324 ได้ผ่านทาง Hugging Face ซึ่งเป็นอินเทอร์เฟซการแชทและ API ของ OpenRouter รวมทั้งแพลตฟอร์มการแชทของ DeepSeek หากต้องการ ผู้ให้บริการอนุมาน Hyperbolic Labs ยังให้การเข้าถึงโมเดลดังกล่าวด้วย

ด้วยการเปิดตัว DeepSeek-V3-0324 บริษัทได้ยืนยันตำแหน่งของตนในการแข่งขันเพื่อพัฒนาโมเดลภาษาขนาดใหญ่ ในขณะเดียวกันก็มอบตัวเลือกที่ทรงพลังและสามารถเข้าถึงได้สำหรับชุมชนการวิจัยและพัฒนา AI ความสามารถในการทำงานบนฮาร์ดแวร์ทั่วไปควบคู่ไปกับใบอนุญาตฟรีจะเปิดโอกาสให้นำรุ่นนี้ไปใช้งานจริงได้มากมายในอนาคตอันใกล้นี้

Sign up and earn $1000 a day ⋙

Leave a Comment

วิธีการลงทะเบียนบัญชี DeepSeek อย่างรวดเร็ว

วิธีการลงทะเบียนบัญชี DeepSeek อย่างรวดเร็ว

DeepSeek ซึ่งเป็นแอป AI ที่มีฐานอยู่ในประเทศจีน กำลังอยู่ในอันดับสูงสุดของ App Store ในปัจจุบัน

นักต้มตุ๋นกำลังใช้ Deepseek เพื่อขโมยข้อมูลผู้ใช้

นักต้มตุ๋นกำลังใช้ Deepseek เพื่อขโมยข้อมูลผู้ใช้

คนร้ายกำลังสร้างเว็บไซต์ประเภท DeepSeek ขึ้นมาจำนวนนับพันแห่งด้วยความหวังว่าผู้ใช้ที่ไม่สงสัยจะให้ข้อมูลส่วนตัวแก่พวกเขา

โฆษณาปลอมของ DeepSeek กำลังแพร่กระจายมัลแวร์อันตราย

โฆษณาปลอมของ DeepSeek กำลังแพร่กระจายมัลแวร์อันตราย

โฆษณาหลอกลวง DeepSeek หลายรายการบน Google กำลังส่งมัลแวร์ขโมยข้อมูลอันตรายไปยังผู้ใช้ DeepSeek ที่ไม่สงสัย

Huawei เปิดตัวโทรศัพท์พับได้ Pura X พร้อมผู้ช่วย AI DeepSeek

Huawei เปิดตัวโทรศัพท์พับได้ Pura X พร้อมผู้ช่วย AI DeepSeek

Huawei กำลังก้าวเข้าสู่ยุคที่ปราศจากระบบปฏิบัติการ Android โดยเปิดตัว Pura X โทรศัพท์หน้าจอพับได้รุ่นใหม่ที่ใช้ซอฟต์แวร์ HarmonyOS 5 ของบริษัท และไม่รวมตัวเลือกให้ผู้คนใช้ระบบปฏิบัติการของ Google

4 เหตุผลที่คุณควรเลิกใช้ ChatGPT และเริ่มใช้ DeepSeek

4 เหตุผลที่คุณควรเลิกใช้ ChatGPT และเริ่มใช้ DeepSeek

DeepSeek คือชื่อบริษัทปัญญาประดิษฐ์ของจีนและแชทบอทที่มีชื่อเดียวกัน รุ่นเรือธงของบริษัท ได้แก่ DeepSeek-V3 และ DeepSeek-R1 ได้สร้างกระแสเพราะมีค่าใช้จ่ายในการฝึกและใช้งานถูกกว่ารุ่นคู่แข่ง

ลืม RTX 5070 ไปได้เลย แม้แต่ RTX 5080 ก็ยังเอาชนะ RTX 4090 ไม่ได้

ลืม RTX 5070 ไปได้เลย แม้แต่ RTX 5080 ก็ยังเอาชนะ RTX 4090 ไม่ได้

สัปดาห์ที่ผ่านมานับว่าเป็นสัปดาห์ที่ผ่านมาไม่ใช่สัปดาห์ที่น่ายินดีสำหรับนักลงทุนและแฟนๆ ของ Nvidia

จอภาพภายนอกอาจส่งผลเสียต่อแบตเตอรี่ของแล็ปท็อป

จอภาพภายนอกอาจส่งผลเสียต่อแบตเตอรี่ของแล็ปท็อป

การใช้แล็ปท็อปที่มีจอภาพภายนอกถือเป็นการผสมผสานที่ยอดเยี่ยมระหว่างประสิทธิภาพการทำงานและช่วยให้คุณทำงานได้สำเร็จ แต่เมื่อเวลาผ่านไป คุณจะพบว่าแบตเตอรี่แล็ปท็อปของคุณหมดลงอย่างรวดเร็ว และอายุการใช้งานแบตเตอรี่ก็เริ่มลดลง

ข้อเสียหลัก 8 ประการของโทรศัพท์หน้าจอพับได้ที่คุณคาดไม่ถึง

ข้อเสียหลัก 8 ประการของโทรศัพท์หน้าจอพับได้ที่คุณคาดไม่ถึง

ไม่สามารถปฏิเสธได้เลยว่าโทรศัพท์แบบพับได้นั้นเจ๋งมาก แต่หลังจากใช้ไปสักระยะหนึ่ง อุปกรณ์นี้มีข้อบกพร่องอยู่ไม่น้อย นี่คือข้อเสียหลัก 5 ประการของโทรศัพท์หน้าจอพับได้ที่คุณคาดไม่ถึง!

Adobe นำเทคโนโลยีการสร้างวิดีโอด้วย AI มาสู่ Premiere Pro

Adobe นำเทคโนโลยีการสร้างวิดีโอด้วย AI มาสู่ Premiere Pro

Adobe ได้นำเทคโนโลยีการสร้างวิดีโอด้วย AI สู่สาธารณชนในรูปแบบใหม่ แม้ว่าจะยังไม่สามารถสร้างภาพยนตร์เสร็จสมบูรณ์โดยใช้เทคโนโลยีนี้ก็ตาม

รหัส Genshin Impact ล่าสุด เมษายน 2025

รหัส Genshin Impact ล่าสุด เมษายน 2025

รหัส Genshin Impact 5.5 จะช่วยให้คุณแลกรับ Primordial Stone, Magic Minerals, ประสบการณ์ และรางวัลอื่นๆ มากมาย

วิธีเปลี่ยน iPad ของคุณให้เป็นจอภาพเสริมสำหรับ Mac

วิธีเปลี่ยน iPad ของคุณให้เป็นจอภาพเสริมสำหรับ Mac

macOS Catalina และ iPadOS รองรับฟีเจอร์ใหม่ที่เรียกว่า Sidecar ซึ่งได้รับการออกแบบเพื่อให้คุณสามารถใช้ iPad เป็นจอแสดงผลรองสำหรับ Mac ได้

วอลเปเปอร์ 1280 วอลเปเปอร์มือถือ Nokia 1280 สวยๆ

วอลเปเปอร์ 1280 วอลเปเปอร์มือถือ Nokia 1280 สวยๆ

นี่คือชุดวอลเปเปอร์ Nokia 1280 หากคุณเคยส่งข้อความเพื่อรับวอลเปเปอร์ 1280 วอลเปเปอร์โทรศัพท์แบบอิฐ ลองดูวอลเปเปอร์เหล่านี้

เครื่องบินอวกาศความเร็วเหนือเสียงทำความเร็วได้ถึง 11,115 กม./ชม.

เครื่องบินอวกาศความเร็วเหนือเสียงทำความเร็วได้ถึง 11,115 กม./ชม.

Venus Aerospace ได้เปิดเผยภาพแรกของเครื่องบินความเร็วเหนือเสียงรุ่นใหม่ที่เรียกว่า Stargazer ซึ่งสามารถทำความเร็วสูงสุดได้ 11,115 กม./ชม. ซึ่งเทียบเท่ากับความเร็วระดับมัค 9

การกินกล้วยเป็นอาหารเช้าช่วยลดอาการท้องอืดได้

การกินกล้วยเป็นอาหารเช้าช่วยลดอาการท้องอืดได้

อาการท้องอืดสามารถเกิดขึ้นกับใครก็ได้ ข่าวดีก็คืออาหารเช้าเป็นช่วงเวลาที่ดีในการเพิ่มส่วนผสมบางอย่างให้กับอาหารของคุณที่จะช่วยลดอาการท้องอืด ส่วนผสมนั้นคือกล้วย

OpenAI ประกาศอัปเดตสำคัญสำหรับการสร้างภาพ AI ใน ChatGPT

OpenAI ประกาศอัปเดตสำคัญสำหรับการสร้างภาพ AI ใน ChatGPT

OpenAI เพิ่งเปิดตัวการอัปเกรดอันน่าทึ่งสำหรับความสามารถในการสร้างภาพ AI ใน ChatGPT อย่างเป็นทางการ ซึ่งถือเป็นก้าวสำคัญแทนที่จะใช้โมเดลการสร้างภาพแยกต่างหากเหมือน DALL-E รุ่นก่อนหน้า

Deepseek เปิดตัว Free Language Model v3 ที่ทำงานได้ดีบนการกำหนดค่าฮาร์ดแวร์ทั่วไป

Deepseek เปิดตัว Free Language Model v3 ที่ทำงานได้ดีบนการกำหนดค่าฮาร์ดแวร์ทั่วไป

DeepSeek ซึ่งเป็นบริษัทสตาร์ทอัพด้าน AI ของจีน เพิ่งเปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ล่าสุดอย่างเป็นทางการ DeepSeek-V3-0324

เหตุผลที่ควรเลิกใช้ Gboard และเปลี่ยนไปใช้ Samsung Keyboard

เหตุผลที่ควรเลิกใช้ Gboard และเปลี่ยนไปใช้ Samsung Keyboard

Gboard ถือเป็นคีย์บอร์ดหลักบนโทรศัพท์ Android มานานแล้ว อย่างไรก็ตาม หลายๆ คนได้เปลี่ยนมาใช้ Samsung Keyboard เมื่อเร็วๆ นี้ และไม่เคยหันหลังกลับเลย

คำอวยพรสุดสัปดาห์แสนหวานและโรแมนติกสำหรับคนรัก

คำอวยพรสุดสัปดาห์แสนหวานและโรแมนติกสำหรับคนรัก

ส่งคำอวยพรวันหยุดสุดสัปดาห์ที่แสนหวานและโรแมนติกให้กับคนรักของคุณ แม้ว่าจะเป็นเพียงคำพูดหรือข้อความ แต่ก็เป็นของขวัญทางจิตวิญญาณที่มีความหมายและช่วยเสริมสร้างความสัมพันธ์ของคุณ

ซีรีส์ทีวี Harry Potter ต้องมีองค์ประกอบต่อไปนี้จึงจะประสบความสำเร็จ

ซีรีส์ทีวี Harry Potter ต้องมีองค์ประกอบต่อไปนี้จึงจะประสบความสำเร็จ

คาดว่า Harry Potter ฉบับรีเมคของ HBO จะออกฉายในปี 2026 นี่คือสิ่งที่ทำให้ Harry Potter ฉบับทีวีประสบความสำเร็จ

ภาพที่น่าทึ่งของซูเปอร์มูนจากทั่วโลก

ภาพที่น่าทึ่งของซูเปอร์มูนจากทั่วโลก

ภาพพระจันทร์สวยๆ ไม่ใช่เรื่องแปลกบนอินเตอร์เน็ต บทความนี้จะสรุปภาพดวงจันทร์ที่สวยงามที่สุดในโลกมาฝากคุณ

ผู้ใช้ AMD Ryzen ควรติดตั้งการอัปเดต BIOS นี้เพื่อเพิ่มประสิทธิภาพได้ฟรี

ผู้ใช้ AMD Ryzen ควรติดตั้งการอัปเดต BIOS นี้เพื่อเพิ่มประสิทธิภาพได้ฟรี

ในตอนนี้ AMD ได้ตอบสนองต่อปัญหาที่เกิดขึ้นกับ CPU เรือธงที่ทำงานต่ำกว่ามาตรฐานด้วยการอัปเดตใหม่ที่สามารถส่งมอบเฟรมต่อวินาทีได้เพิ่มขึ้นอีกเล็กน้อย