Google เปิดตัว Gemini Robotics โมเดล Gemini 2.0 ที่ปรับให้เหมาะกับหุ่นยนต์

Google DeepMind มีความก้าวหน้าอย่างต่อเนื่องในด้าน AI ด้วยการอัปเดต Gemini, Imagen, Veo, Gemma และ AlphaFold ที่ได้รับการยกย่องอย่างสูงเป็นประจำ ในวันนี้ ทีม AI ของ Google ยังคงสร้างกระแสฮือฮาอย่างต่อเนื่อง ด้วยการประกาศเข้าสู่วงการหุ่นยนต์อย่างเป็นทางการ ด้วยการเปิดตัวโมเดลใหม่ 2 รุ่นที่ใช้ Gemini 2.0 ได้แก่ Gemini Robotics และ Gemini Robotics-ER

Gemini Robotics: โมเดลการมองเห็น-ภาษา-การกระทำขั้นสูง

Gemini Robotics เป็นโมเดลการมองเห็น-ภาษา-การกระทำ (VLA) ขั้นสูงที่พัฒนาขึ้นบนพื้นฐานของ Gemini 2.0 โดยมีการเพิ่มการกระทำทางกายภาพเป็นวิธีเอาต์พุตใหม่สำหรับการควบคุมหุ่นยนต์ Google อ้างว่าโมเดลใหม่นี้สามารถเข้าใจสถานการณ์ที่ไม่เคยพบมาก่อนในระหว่างการฝึกอบรมได้

เมื่อเทียบกับโมเดล VLA ชั้นนำอื่นๆ Gemini Robotics มีประสิทธิภาพดีกว่าสองเท่าในเกณฑ์มาตรฐานทั่วไปที่ครอบคลุม เนื่องจากสร้างขึ้นบนโมเดล Gemini 2.0 จึงสามารถเข้าใจภาษาธรรมชาติประเภทต่างๆ ได้หลายประเภท ซึ่งหมายความว่าสามารถเข้าใจคำสั่งของมนุษย์ได้แม่นยำยิ่งขึ้น

ในด้านความคล่องตัว Google อ้างว่า Gemini Robotics สามารถจัดการกับงานที่ซับซ้อนหลายขั้นตอนซึ่งต้องการการจัดการที่แม่นยำได้ ตัวอย่างเช่น โมเดลนี้สามารถพับกระดาษโอริกามิหรือใส่ขนมลงในถุงซิปล็อกได้

Gemini Robotics-ER: โมเดลภาษาภาพที่เน้นการใช้เหตุผลเชิงพื้นที่

Gemini Robotics-ER เป็นโมเดลภาพและภาษาขั้นสูงที่เน้นการใช้เหตุผลเชิงพื้นที่ ช่วยให้ผู้ใช้หุ่นยนต์สามารถบูรณาการกับตัวควบคุมระดับต่ำที่มีอยู่ได้ เมื่อใช้โมเดลนี้ นักหุ่นยนต์จะมีขั้นตอนทั้งหมดเพื่อควบคุมหุ่นยนต์ในคราวเดียว รวมถึงการรับรู้ การประมาณสถานะ การทำความเข้าใจเชิงพื้นที่ การวางแผน และการสร้างโค้ด

อนาคตของหุ่นยนต์เจมินี่

Google ร่วมมือกับ Apptronik เพื่อสร้างหุ่นยนต์คล้ายมนุษย์โดยใช้โมเดล Gemini 2.0 นอกจากนี้ Google ยังทำงานร่วมกับพันธมิตรการทดสอบที่เชื่อถือได้หลายราย รวมถึง Agile Robots, Agility Robotics, Boston Dynamics และ Enchanted Tools เพื่อกำหนดทิศทางการพัฒนา Gemini Robotics-ER ในอนาคต

ด้วยการช่วยให้หุ่นยนต์เข้าใจและทำงานที่ซับซ้อนได้อย่างแม่นยำและปรับตัวได้มากขึ้น Google DeepMind กำลังปูทางไปสู่อนาคตที่หุ่นยนต์จะสามารถผสานรวมกับด้านต่างๆ ในชีวิตของเราได้อย่างราบรื่น

Sign up and earn $1000 a day ⋙

Leave a Comment

Google เปิดตัว Career Dreamer ซึ่งเป็นเครื่องมือ AI ล่าสุดที่จะช่วยเลือกอาชีพที่สมบูรณ์แบบสำหรับคุณ

Google เปิดตัว Career Dreamer ซึ่งเป็นเครื่องมือ AI ล่าสุดที่จะช่วยเลือกอาชีพที่สมบูรณ์แบบสำหรับคุณ

ไม่ว่าคุณจะเพิ่งเริ่มต้นเข้าสู่กำลังแรงงานหรือกำลังเปลี่ยนผ่านไปสู่ภาคอุตสาหกรรมใหม่ Career Dreamer เชิงทดลองของ Google ได้รับการออกแบบมาเพื่อเชื่อมโยงคุณกับบทบาทที่เข้ากันได้

Google พัฒนาเครื่องมือช้อปปิ้ง AI ที่ให้ผู้ใช้สามารถลองชุดเดรสและเสื้อเชิ้ตที่บ้านได้

Google พัฒนาเครื่องมือช้อปปิ้ง AI ที่ให้ผู้ใช้สามารถลองชุดเดรสและเสื้อเชิ้ตที่บ้านได้

เมื่อปีที่แล้ว Google ได้เปิดตัวระบบช่วยช้อปปิ้งที่ขับเคลื่อนด้วย AI ใน Search ซึ่งช่วยให้ผู้ใช้สามารถเห็นภาพว่าเสื้อผ้าชิ้นหนึ่งๆ จะดูเป็นอย่างไรเมื่อสวมใส่กับรูปร่างที่เฉพาะเจาะจง

Google พัฒนาอัลกอริทึม AI ที่สามารถวินิจฉัยโรคผิวหนังและวัณโรคได้

Google พัฒนาอัลกอริทึม AI ที่สามารถวินิจฉัยโรคผิวหนังและวัณโรคได้

Google แสดงความสนใจในสาขาการประยุกต์ใช้ปัญญาประดิษฐ์ในทางการแพทย์เพิ่มมากขึ้น

Google ยืนยันปัญหาของ Chromecast และ Chromecast Audio รุ่นที่สอง

Google ยืนยันปัญหาของ Chromecast และ Chromecast Audio รุ่นที่สอง

หลังจากที่มีความสับสนมาหลายวัน ในที่สุด Google ก็ได้ยืนยันอย่างเป็นทางการถึงปัญหาที่เกิดขึ้นกับ Chromecast รุ่นที่ 2 และ Chromecast Audio แล้ว

Google เผยแพร่เอกสารเกี่ยวกับการทำงานของการค้นหาโดยไม่ได้ตั้งใจ

Google เผยแพร่เอกสารเกี่ยวกับการทำงานของการค้นหาโดยไม่ได้ตั้งใจ

เมื่อวันจันทร์ เอกสารภายในที่อธิบายถึงปัจจัยที่ Google Search พิจารณาในการจัดอันดับและแสดงผลลัพธ์บนเว็บถูกรั่วไหลออกมา

วิธีเปิดใช้งานและใช้ Google Assistant บน Chrome Android

วิธีเปิดใช้งานและใช้ Google Assistant บน Chrome Android

Google ค่อยๆ ยุติเทคโนโลยีการจดจำเสียงแบบเก่า และแทนที่ด้วยผู้ช่วยเสมือนอย่าง Assistant

Samsung เปิดตัวเทคโนโลยีเสียง 3D Eclipsa Audio แข่งขันกับ Dolby Atmos โดยตรง

Samsung เปิดตัวเทคโนโลยีเสียง 3D Eclipsa Audio แข่งขันกับ Dolby Atmos โดยตรง

Samsung Electronics ได้ประกาศแผนการรวม Eclipsa Audio ซึ่งเป็นเทคโนโลยีเสียงสามมิติใหม่ล่าสุดที่พัฒนาผ่านความร่วมมือกับ Google เข้ากับกลุ่มผลิตภัณฑ์ทีวีและซาวด์บาร์ในปี 2025

Google ประกาศเปิดตัวฟีเจอร์ใหม่ 6 ประการสำหรับโทรศัพท์ Android

Google ประกาศเปิดตัวฟีเจอร์ใหม่ 6 ประการสำหรับโทรศัพท์ Android

วันนี้ Google ได้ประกาศเปิดตัวฟีเจอร์ใหม่ 6 ประการที่จะมาพร้อมกับสมาร์ทโฟน Android

ChatGPT Search หรือ Google ดีกว่า?

ChatGPT Search หรือ Google ดีกว่า?

หลายๆ คนพยายามมาเป็นเวลานานเพื่อดูว่าพวกเขาสามารถแทนที่ Google ด้วยส่วนขยาย ChatGPT Search Chrome ได้จริงหรือไม่

Google ลบส่วนขยาย Manifest V2 ออกจาก Chrome อย่างเป็นทางการ

Google ลบส่วนขยาย Manifest V2 ออกจาก Chrome อย่างเป็นทางการ

เป็นเวลานานที่รอคอย และในที่สุดวันนั้นก็มาถึง ผู้คนรายงานว่าส่วนขยาย Manifest v2 เก่าของตนกำลังถูกลบออกจาก Chrome แล้วต่อเป็นไงบ้าง?

Google เปิดตัวอัปเดต Pixel ประจำเดือนธันวาคม โดยส่วนใหญ่เกี่ยวข้องกับ Gemini

Google เปิดตัวอัปเดต Pixel ประจำเดือนธันวาคม โดยส่วนใหญ่เกี่ยวข้องกับ Gemini

การอัปเดตล่าสุดนี้มาพร้อมกับการปรับปรุงที่เกี่ยวข้องกับกล้อง เครื่องมือเสียงและภาพ และที่สำคัญที่สุดคือ Gemini ผู้ช่วย AI ของ Google

9 แอป Google ที่มีประโยชน์ซึ่งไม่ได้ติดตั้งไว้ล่วงหน้าบนโทรศัพท์ Android

9 แอป Google ที่มีประโยชน์ซึ่งไม่ได้ติดตั้งไว้ล่วงหน้าบนโทรศัพท์ Android

หากคุณชื่นชอบบริการของ Google แอปที่ไม่ค่อยมีใครรู้จักเหล่านี้อาจเพิ่มมูลค่าอันน่าประหลาดใจให้กับอุปกรณ์ของคุณได้

การค้นหาทางสังคมของ Perplexity ต้องมีคุณลักษณะ 3 ประการนี้เพื่อแข่งขันกับ Google

การค้นหาทางสังคมของ Perplexity ต้องมีคุณลักษณะ 3 ประการนี้เพื่อแข่งขันกับ Google

เครื่องมือค้นหาทั่วไปของ Perplexity นั้นดีเยี่ยม แต่คุณลักษณะการค้นหาทางสังคมนั้นยังมีข้อบกพร่องอยู่มาก ก่อนที่ Perplexity จะสามารถคิดแข่งขันกับ Google ในพื้นที่นี้ได้ จำเป็นต้องมีฟีเจอร์ใหม่เหล่านี้

การเปลี่ยนแปลงเล็กๆ น้อยๆ นี้จะทำให้การเข้าถึงรหัสผ่าน Google ของคุณง่ายขึ้นมาก!

การเปลี่ยนแปลงเล็กๆ น้อยๆ นี้จะทำให้การเข้าถึงรหัสผ่าน Google ของคุณง่ายขึ้นมาก!

แม้ว่าตัวจัดการรหัสผ่านของ Google จะเป็นโซลูชันที่เชื่อถือได้ แต่หากต้องการเข้าถึง คุณจะต้องค้นหาผ่านการตั้งค่าของ Chrome

Gemini เวอร์ชันฟรีได้ลบข้อจำกัดสำคัญบางประการออกไปแล้ว

Gemini เวอร์ชันฟรีได้ลบข้อจำกัดสำคัญบางประการออกไปแล้ว

Imagen 3 ของ Google ถือเป็นโมเดล AI แปลงข้อความเป็นรูปภาพที่ทรงพลังที่สุดโมเดลหนึ่ง และพร้อมใช้งานบนแอป Gemini แล้ว แต่เพียงในระดับหนึ่งเท่านั้น

1314 คืออะไร?

1314 คืออะไร?

1314 เป็นตัวเลขที่วัยรุ่นมักใช้เป็นรหัสแสดงความรัก อย่างไรก็ตาม ไม่ใช่ทุกคนที่รู้ว่า 1314 คืออะไรและหมายถึงอะไร

วิธีปกป้องสุขภาพจิตและร่างกายของคุณเมื่ออยู่ในสภาพแวดล้อมที่เป็นพิษ

วิธีปกป้องสุขภาพจิตและร่างกายของคุณเมื่ออยู่ในสภาพแวดล้อมที่เป็นพิษ

การจัดการกับสถานการณ์ที่เป็นพิษอาจเป็นเรื่องยากอย่างยิ่ง ต่อไปนี้เป็นเคล็ดลับบางประการที่จะช่วยให้คุณจัดการกับสภาพแวดล้อมที่เป็นพิษได้อย่างชาญฉลาดและรักษาความสงบในจิตใจ

ดนตรีช่วยกระตุ้นสมองอย่างไร

ดนตรีช่วยกระตุ้นสมองอย่างไร

คนส่วนใหญ่รู้ว่าดนตรีไม่ได้มีไว้เพื่อความบันเทิงเพียงอย่างเดียว แต่ยังมีประโยชน์อื่นๆ อีกมากมาย ต่อไปนี้เป็นวิธีบางอย่างที่ดนตรีช่วยกระตุ้นการพัฒนาสมองของเรา

สารอาหารที่ขาดหายมากที่สุดในอาหาร

สารอาหารที่ขาดหายมากที่สุดในอาหาร

การรับประทานอาหารเป็นสิ่งสำคัญมากต่อสุขภาพของเรา แต่อาหารของเราส่วนใหญ่มักขาดสารอาหารสำคัญทั้ง 6 ชนิดนี้

วิธีใช้แอป CK Club ของ Circle K เพื่อรับข้อเสนอสุดพิเศษ

วิธีใช้แอป CK Club ของ Circle K เพื่อรับข้อเสนอสุดพิเศษ

หากต้องการรับข้อมูลโปรโมตจาก Circle K อย่างรวดเร็วที่สุด คุณควรติดตั้งแอป CK Club แอปพลิเคชันช่วยบันทึกการชำระเงินเมื่อช้อปปิ้งหรือชำระเงินที่ Circle K รวมถึงจำนวนแสตมป์ที่สะสมไว้

Instagram จะอนุญาตให้ใช้ Reels ยาวได้ถึง 3 นาที

Instagram จะอนุญาตให้ใช้ Reels ยาวได้ถึง 3 นาที

Instagram เพิ่งประกาศว่าจะอนุญาตให้ผู้ใช้โพสต์วิดีโอ Reels ได้ยาวสูงสุด 3 นาที ซึ่งเพิ่มขึ้นเป็นสองเท่าจากเดิมที่จำกัดไว้ที่ 90 วินาที

วิธีดูข้อมูล CPU ของ Chromebook

วิธีดูข้อมูล CPU ของ Chromebook

บทความนี้จะแนะนำวิธีการดูข้อมูล CPU ตรวจสอบความเร็ว CPU โดยตรงบน Chromebook ของคุณ

8 สิ่งเจ๋งๆ ที่คุณสามารถทำได้ด้วยแท็บเล็ต Android รุ่นเก่า

8 สิ่งเจ๋งๆ ที่คุณสามารถทำได้ด้วยแท็บเล็ต Android รุ่นเก่า

หากคุณไม่อยากขายหรือให้แท็บเล็ตเครื่องเก่าของคุณไป คุณสามารถใช้งานได้ 5 วิธี คือ เป็นกรอบรูปคุณภาพสูง เครื่องเล่นเพลง เครื่องอ่านอีบุ๊กและนิตยสาร เครื่องช่วยทำงานบ้าน และเป็นหน้าจอรอง

วิธีการทำเล็บสวยอย่างรวดเร็ว

วิธีการทำเล็บสวยอย่างรวดเร็ว

คุณอยากมีเล็บสวย เงางาม และสุขภาพดีอย่างรวดเร็ว เคล็ดลับง่ายๆ สำหรับเล็บสวยๆ ด้านล่างนี้จะมีประโยชน์กับคุณ

ความลับของแรงบันดาลใจด้านสีที่เฉพาะนักออกแบบเท่านั้นที่รู้

ความลับของแรงบันดาลใจด้านสีที่เฉพาะนักออกแบบเท่านั้นที่รู้

บทความนี้จะรวบรวมเคล็ดลับที่ได้รับแรงบันดาลใจจากสี ซึ่งแบ่งปันโดยนักออกแบบชั้นนำจากชุมชน Creative Market เพื่อให้คุณได้ชุดสีที่สมบูรณ์แบบในทุกครั้ง

ทุกสิ่งที่คุณต้องการเพื่อแทนที่แล็ปท็อปของคุณด้วยโทรศัพท์

ทุกสิ่งที่คุณต้องการเพื่อแทนที่แล็ปท็อปของคุณด้วยโทรศัพท์

คุณสามารถแทนที่แล็ปท็อปด้วยโทรศัพท์ของคุณได้จริงหรือไม่? ใช่ แต่คุณจะต้องมีอุปกรณ์เสริมที่เหมาะสมเพื่อเปลี่ยนโทรศัพท์ของคุณให้เป็นแล็ปท็อป

เร็วๆ นี้ ChatGPT จะสามารถมองเห็นทุกอย่างที่เกิดขึ้นบนหน้าจอของคุณได้

เร็วๆ นี้ ChatGPT จะสามารถมองเห็นทุกอย่างที่เกิดขึ้นบนหน้าจอของคุณได้

สิ่งสำคัญอย่างหนึ่งในวิดีโอเต็มรูปแบบของงานนี้คือมีการสาธิตฟีเจอร์แอป ChatGPT ที่กำลังจะเปิดตัว แต่ไม่ได้มีการเปิดเผยรายละเอียดที่แท้จริง ความสามารถของ ChatGPT คือการดูทุกสิ่งที่เกิดขึ้นบนหน้าจออุปกรณ์ของผู้ใช้

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI กำลังเรียนรู้ที่จะหลอกมนุษย์แม้จะได้รับการฝึกให้ซื่อสัตย์

AI ชั้นนำหลายตัวแม้จะได้รับการฝึกให้ซื่อสัตย์ แต่ก็เรียนรู้ที่จะหลอกลวงผ่านการฝึกฝน และชักจูงผู้ใช้ให้มีความเชื่อที่ผิด ๆ อย่างเป็นระบบ จากผลการศึกษาวิจัยใหม่ล่าสุด

วิธีการเปลี่ยนคำถามใน ChatGPT

วิธีการเปลี่ยนคำถามใน ChatGPT

ขณะนี้ ChatGPT มีตัวเลือกการเปลี่ยนคำถามเพื่อให้ผู้ใช้สามารถแก้ไขคำถามหรือเนื้อหาที่พวกเขากำลังแลกเปลี่ยนกับ ChatGPT ได้

วิธีการระบุรหัส QR ปลอมและรักษาข้อมูลของคุณให้ปลอดภัย

วิธีการระบุรหัส QR ปลอมและรักษาข้อมูลของคุณให้ปลอดภัย

รหัส QR อาจดูไม่เป็นอันตรายจนกว่าคุณจะสแกนรหัส QR ที่ไม่ดีแล้วพบสิ่งที่ไม่น่าไว้ใจโยนเข้ามาในระบบของคุณ หากคุณต้องการรักษาโทรศัพท์และข้อมูลของคุณให้ปลอดภัย มีหลายวิธีในการระบุรหัส QR ปลอม