Cerebras เปิดตัวเทคโนโลยี AI Inference ที่เร็วที่สุดในโลก ประสิทธิภาพเหนือกว่า NVIDIA ถึง 20 เท่า

Cerebras Systems เพิ่งประกาศเปิดตัว Cerebras Inference อย่างเป็นทางการ ซึ่งถือเป็นโซลูชันการอนุมาน AI ที่เร็วที่สุดในโลก Cerebras Inference นี้มอบประสิทธิภาพสูงถึง 1,800 โทเค็นต่อวินาทีสำหรับโมเดล Llama 3.1 8B (พารามิเตอร์ 8 พันล้านตัว) และ 450 โทเค็นต่อวินาทีสำหรับ Llama 3.1 70B ซึ่งเร็วกว่าโซลูชันการอนุมาน AI ที่ใช้ GPU ของ NVIDIA เกือบ 20 เท่าที่มีให้ใช้ในระบบคลาวด์ไฮเปอร์สเกลทั่วโลกในปัจจุบัน รวมถึง Microsoft Azure ด้วย

นอกเหนือจากประสิทธิภาพอันน่าเหลือเชื่อแล้ว ราคาบริการของโซลูชั่นอนุมานใหม่นี้ยังมีราคาถูกมากอีกด้วย เป็นเพียงเศษเสี้ยวหนึ่งของราคาแพลตฟอร์มคลาวด์ GPU ยอดนิยม ตัวอย่างเช่น ลูกค้าสามารถรับโทเค็นหนึ่งล้านโทเค็นด้วยราคาเพียง 10 เซ็นต์ ทำให้ประสิทธิภาพด้านราคาสูงขึ้น 100 เท่าสำหรับเวิร์กโหลด AI

ความแม่นยำ 16 บิตและความเร็วในการอนุมานที่เร็วขึ้น 20 เท่าของ Cerebras จะทำให้นักพัฒนาสามารถสร้างแอปพลิเคชัน AI ประสิทธิภาพสูงรุ่นถัดไปได้โดยไม่กระทบต่อความเร็วหรือต้นทุน อัตราส่วนราคา/ประสิทธิภาพที่ก้าวล้ำนี้เป็นไปได้ด้วยระบบ Cerebras CS-3 และโปรเซสเซอร์ AI Wafer Scale Engine 3 (WSE-3) CS-3 ให้แบนด์วิดท์หน่วยความจำมากกว่า Nvidia H100 ถึง 7,000 เท่า ช่วยแก้ปัญหาทางเทคนิคของแบนด์วิดท์หน่วยความจำสำหรับ AI เชิงสร้างสรรค์

Cerebras เปิดตัวเทคโนโลยี AI Inference ที่เร็วที่สุดในโลก ประสิทธิภาพเหนือกว่า NVIDIA ถึง 20 เท่า

ปัจจุบัน Cerebras Inference มีให้เลือกใช้ 3 ระดับดังนี้:

  • Free Tier มอบการเข้าถึง API ฟรีและการจำกัดการใช้งานที่ใจดีให้กับทุกคนที่สมัครใช้งาน
  • Developer Tier นั้นได้รับการออกแบบมาสำหรับการใช้งานที่ยืดหยุ่นและไม่ต้องใช้เซิร์ฟเวอร์ โดยมอบจุดสิ้นสุดของ API ให้แก่ผู้ใช้ด้วยต้นทุนเพียงเศษเสี้ยวของทางเลือกอื่นๆ ที่มีอยู่ในตลาด โดยที่รุ่น Llama 3.1 8B และ 70B มีราคาเพียง 10 เซ็นต์และ 60 เซ็นต์ต่อหนึ่งล้านโทเค็นตามลำดับ
  • แผน Enterprise Tier นำเสนอโมเดลที่ปรับแต่งละเอียด ข้อตกลงระดับบริการแบบกำหนดเอง และการสนับสนุนเฉพาะ เหมาะสำหรับภาระงานต่อเนื่อง ธุรกิจต่างๆ สามารถเข้าถึง Cerebras Inference ได้ผ่านระบบคลาวด์ส่วนตัวที่ Cerebras จัดการหรือภายในองค์กร

ด้วยประสิทธิภาพที่เป็นประวัติการณ์ ราคาที่มีการแข่งขัน และการเข้าถึง API แบบเปิด Cerebras Inference จึงสร้างมาตรฐานใหม่สำหรับการพัฒนาและการปรับใช้ LLM แบบเปิด เนื่องจากเป็นโซลูชั่นเดียวที่สามารถส่งมอบการฝึกอบรมและการอนุมานความเร็วสูง Cerebras จึงเปิดโอกาสใหม่ๆ ให้กับ AI

เนื่องจากแนวโน้ม AI พัฒนารวดเร็วและปัจจุบัน NVIDIA ครองตำแหน่งที่โดดเด่นในตลาด การเกิดขึ้นของบริษัทเช่น Cerebras และ Groq จึงเป็นสัญญาณของการเปลี่ยนแปลงที่อาจเกิดขึ้นในพลวัตของอุตสาหกรรมทั้งหมด เนื่องจากความต้องการโซลูชันการอนุมาน AI ที่รวดเร็วและคุ้มต้นทุนมากขึ้นเพิ่มมากขึ้น โซลูชันเช่น Cerebras Inference จึงอยู่ในตำแหน่งที่ดีในการคว้าโอกาสจากความโดดเด่นของ NVIDIA โดยเฉพาะในพื้นที่ของการอนุมาน

Sign up and earn $1000 a day ⋙

Leave a Comment

วิธีใช้แอป CK Club ของ Circle K เพื่อรับข้อเสนอสุดพิเศษ

วิธีใช้แอป CK Club ของ Circle K เพื่อรับข้อเสนอสุดพิเศษ

หากต้องการรับข้อมูลโปรโมตจาก Circle K อย่างรวดเร็วที่สุด คุณควรติดตั้งแอป CK Club แอปพลิเคชันช่วยบันทึกการชำระเงินเมื่อช้อปปิ้งหรือชำระเงินที่ Circle K รวมถึงจำนวนแสตมป์ที่สะสมไว้

Instagram จะอนุญาตให้ใช้ Reels ยาวได้ถึง 3 นาที

Instagram จะอนุญาตให้ใช้ Reels ยาวได้ถึง 3 นาที

Instagram เพิ่งประกาศว่าจะอนุญาตให้ผู้ใช้โพสต์วิดีโอ Reels ได้ยาวสูงสุด 3 นาที ซึ่งเพิ่มขึ้นเป็นสองเท่าจากเดิมที่จำกัดไว้ที่ 90 วินาที

วิธีดูข้อมูล CPU ของ Chromebook

วิธีดูข้อมูล CPU ของ Chromebook

บทความนี้จะแนะนำวิธีการดูข้อมูล CPU ตรวจสอบความเร็ว CPU โดยตรงบน Chromebook ของคุณ

8 สิ่งเจ๋งๆ ที่คุณสามารถทำได้ด้วยแท็บเล็ต Android รุ่นเก่า

8 สิ่งเจ๋งๆ ที่คุณสามารถทำได้ด้วยแท็บเล็ต Android รุ่นเก่า

หากคุณไม่อยากขายหรือให้แท็บเล็ตเครื่องเก่าของคุณไป คุณสามารถใช้งานได้ 5 วิธี คือ เป็นกรอบรูปคุณภาพสูง เครื่องเล่นเพลง เครื่องอ่านอีบุ๊กและนิตยสาร เครื่องช่วยทำงานบ้าน และเป็นหน้าจอรอง

วิธีการทำเล็บสวยอย่างรวดเร็ว

วิธีการทำเล็บสวยอย่างรวดเร็ว

คุณอยากมีเล็บสวย เงางาม และสุขภาพดีอย่างรวดเร็ว เคล็ดลับง่ายๆ สำหรับเล็บสวยๆ ด้านล่างนี้จะมีประโยชน์กับคุณ

ความลับของแรงบันดาลใจด้านสีที่เฉพาะนักออกแบบเท่านั้นที่รู้

ความลับของแรงบันดาลใจด้านสีที่เฉพาะนักออกแบบเท่านั้นที่รู้

บทความนี้จะรวบรวมเคล็ดลับที่ได้รับแรงบันดาลใจจากสี ซึ่งแบ่งปันโดยนักออกแบบชั้นนำจากชุมชน Creative Market เพื่อให้คุณได้ชุดสีที่สมบูรณ์แบบในทุกครั้ง

ทุกสิ่งที่คุณต้องการเพื่อแทนที่แล็ปท็อปของคุณด้วยโทรศัพท์

ทุกสิ่งที่คุณต้องการเพื่อแทนที่แล็ปท็อปของคุณด้วยโทรศัพท์

คุณสามารถแทนที่แล็ปท็อปด้วยโทรศัพท์ของคุณได้จริงหรือไม่? ใช่ แต่คุณจะต้องมีอุปกรณ์เสริมที่เหมาะสมเพื่อเปลี่ยนโทรศัพท์ของคุณให้เป็นแล็ปท็อป

เร็วๆ นี้ ChatGPT จะสามารถมองเห็นทุกอย่างที่เกิดขึ้นบนหน้าจอของคุณได้

เร็วๆ นี้ ChatGPT จะสามารถมองเห็นทุกอย่างที่เกิดขึ้นบนหน้าจอของคุณได้

สิ่งสำคัญอย่างหนึ่งในวิดีโอเต็มรูปแบบของงานนี้คือมีการสาธิตฟีเจอร์แอป ChatGPT ที่กำลังจะเปิดตัว แต่ไม่ได้มีการเปิดเผยรายละเอียดที่แท้จริง ความสามารถของ ChatGPT คือการดูทุกสิ่งที่เกิดขึ้นบนหน้าจออุปกรณ์ของผู้ใช้

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI ชั้นนำหลายตัวแม้จะได้รับการฝึกให้ซื่อสัตย์ แต่ก็เรียนรู้ที่จะหลอกลวงผ่านการฝึกฝน และชักจูงผู้ใช้ให้มีความเชื่อที่ผิด ๆ อย่างเป็นระบบ จากผลการศึกษาวิจัยใหม่ล่าสุด

วิธีการเปลี่ยนคำถามใน ChatGPT

วิธีการเปลี่ยนคำถามใน ChatGPT

ขณะนี้ ChatGPT มีตัวเลือกการเปลี่ยนคำถามเพื่อให้ผู้ใช้สามารถแก้ไขคำถามหรือเนื้อหาที่พวกเขากำลังแลกเปลี่ยนกับ ChatGPT ได้

วิธีการระบุรหัส QR ปลอมและรักษาข้อมูลของคุณให้ปลอดภัย

วิธีการระบุรหัส QR ปลอมและรักษาข้อมูลของคุณให้ปลอดภัย

รหัส QR อาจดูไม่เป็นอันตรายจนกว่าคุณจะสแกนรหัส QR ที่ไม่ดีแล้วพบสิ่งที่ไม่น่าไว้ใจโยนเข้ามาในระบบของคุณ หากคุณต้องการรักษาโทรศัพท์และข้อมูลของคุณให้ปลอดภัย มีหลายวิธีในการระบุรหัส QR ปลอม

Qualcomm เปิดตัวโมเด็ม X85 5G พร้อมการปรับปรุงที่สำคัญหลายประการ

Qualcomm เปิดตัวโมเด็ม X85 5G พร้อมการปรับปรุงที่สำคัญหลายประการ

บนเวทีงาน MWC 2025 บริษัท Qualcomm สร้างความฮือฮาเมื่อเปิดตัวโมเด็ม 5G รุ่นที่ 8 ที่เรียกว่า X85 ซึ่งคาดว่าจะใช้ในสมาร์ทโฟนเรือธงที่เปิดตัวในช่วงปลายปีนี้

เทคโนโลยีใหม่ช่วยให้โทรศัพท์สามารถเปลี่ยนสีได้อย่างยืดหยุ่น

เทคโนโลยีใหม่ช่วยให้โทรศัพท์สามารถเปลี่ยนสีได้อย่างยืดหยุ่น

คุณมี iPhone 16 สี “Ultramarine” สุดเทรนด์ แต่เมื่อถึงวันดีคืนดี คุณก็รู้สึกเบื่อสีนั้นขึ้นมา คุณจะทำอย่างไร?

Microsoft รวม DeepSeek เข้ากับแพลตฟอร์ม PC Copilot+

Microsoft รวม DeepSeek เข้ากับแพลตฟอร์ม PC Copilot+

ในเดือนมกราคม Microsoft ได้ประกาศแผนที่จะนำเวอร์ชันที่ปรับแต่ง NPU ของรุ่น DeepSeek-R1 มาสู่คอมพิวเตอร์ Copilot+ ที่ทำงานบนโปรเซสเซอร์ Qualcomm Snapdragon X โดยตรง

ความแตกต่างระหว่างฟังก์ชัน IF และ Switch ใน Excel

ความแตกต่างระหว่างฟังก์ชัน IF และ Switch ใน Excel

คำสั่ง IF เป็นฟังก์ชันตรรกะทั่วไปใน Excel คำสั่ง SWITCH เป็นที่รู้จักน้อยกว่า แต่คุณสามารถใช้แทนคำสั่ง IF ได้ในบางกรณี