Imagen 3 ของ Google ถือเป็นโมเดล AI แปลงข้อความเป็นรูปภาพที่ทรงพลังที่สุดโมเดลหนึ่ง และพร้อมใช้งานบน แอปGemini แล้ว แต่เพียงในระดับหนึ่งเท่านั้น การสร้างภาพลักษณ์ของมนุษย์ถือเป็นสิ่งฟุ่มเฟือยที่มีให้เฉพาะผู้ใช้ที่ชำระเงินเท่านั้น - จนกระทั่งถึงทุกวันนี้
ตอนนี้ผู้ใช้สามารถสร้างรูปภาพของบุคคลโดยใช้แอปฟรีของ Gemini
หากคุณใช้แอป Gemini บนเว็บ เดสก์ท็อป หรือมือถือ คุณอาจเคยทดลองใช้ความสามารถในการสร้างภาพแล้ว ซึ่งขับเคลื่อนโดยโมเดล Imagen 3 ของ Google Google เปิดตัวเครื่องมือดังกล่าวให้กับผู้ใช้ทุกคนในเดือนสิงหาคม 2024 โดยมีตัวเลือกตั้งแต่ "ทิวทัศน์ที่สมจริง" ไปจนถึง "ฉากดินเหนียวประหลาด" ตามที่ประกาศใน The Keyword ของ Google
อย่างไรก็ตามการสร้างภาพลักษณ์ของผู้คนนั้นเป็นอีกเรื่องหนึ่ง Google จำกัดการเปิดตัวฟีเจอร์พิเศษนี้เฉพาะผู้สมัครสมาชิกแบบชำระเงินเท่านั้น ซึ่งได้แก่ผู้ใช้ Gemini Advanced, Business และ Enterprise หากคุณมีบัญชีฟรี การขอให้ Gemini สร้างรูปภาพของใครสักคน จะส่งผลให้เกิดข้อความต่อไปนี้:
"มีให้ใช้งานเฉพาะในช่วง Early Access ของ Gemini Advanced เท่านั้น รับสิทธิ์เข้าถึงฟีเจอร์ใหม่ของ Gemini ก่อนใครเมื่อสมัคร Advanced ที่นี่"
ณ เดือนกุมภาพันธ์ 2025 ผู้ใช้ Gemini ฟรีส่วนใหญ่สามารถสร้างภาพกับผู้คนบน Gemini ได้สำเร็จ อย่างไรก็ตาม หากคุณยังคงได้รับข้อความแสดงข้อผิดพลาด เป็นไปได้ว่าฟีเจอร์ดังกล่าวยังอยู่ในระหว่างการเปิดตัว ดูเหมือนว่าฟีเจอร์ดังกล่าวจะเปิดตัวอย่างค่อยเป็นค่อยไปโดยเริ่มจากผู้ใช้ในสหรัฐอเมริกาที่ใช้ Gemini ในภาษาอังกฤษ
ผู้ใช้ขอให้ Gemini สร้างภาพผู้หญิงกำลังกินไอศกรีม
หมายเหตุ : ตามคำแนะนำของราศีเมถุน คุณยังคงไม่สามารถสร้างรูปภาพที่เหมือนจริงของบุคคลหรือเด็กๆ ที่สามารถจดจำได้
Imagen 3 ทำงานบน Gemini Flash 2.0 อย่างไร?
ในเดือนกุมภาพันธ์ 2025 เช่นเดียวกัน Google ได้เปิดตัวรุ่น Gemini ที่เร็วที่สุดให้กับประชาชนทั่วไปโดยไม่มีค่าใช้จ่าย Google อธิบายโมเดลนี้ซึ่งเรียกว่า Gemini 2.0 Flash ว่าเป็น "คอมพิวเตอร์ประสิทธิภาพสูง" ที่สามารถส่งผลดีต่อการถ่ายภาพเท่านั้น โดยทั่วไปแล้วการประมวลผลข้อความจะต้องใช้พลังงานและเวลามากกว่าการประมวลผลข้อความปกติ แต่การสร้างภาพด้วย AI สามารถให้คุณภาพสูงขึ้นได้ในทางทฤษฎี เมื่อมีโมเดลที่มีประสิทธิภาพมากขึ้นเป็นเครื่องมือ
ดูเหมือนว่าคุณภาพจะเป็นสิ่งสำคัญอย่างยิ่งเมื่อต้องอธิบายถึงผู้คน เราทุกคนต่างเคยเห็นภาพมนุษย์ที่สร้างโดย AI เป็นครั้งแรกมาแล้ว ไม่ว่าจะเป็นภาพมือที่งอซึ่งมีรายละเอียดพิเศษมากมาย ไปจนถึงภาพดวงตาที่ลึกและมืด ดังนั้น คุณจะเข้าใจถึงความลังเลของผู้คนจำนวนมากในการไว้วางใจเครื่องสร้างรูปภาพที่ขับเคลื่อนด้วย AI ของ Google ในฐานะผู้ใช้ฟรี
ตรงกันข้ามกับความกลัวที่กล่าวมาข้างต้น ผู้คนจำนวนมากรู้สึกประทับใจกับความสามารถของราศีเมถุนในการจัดการกับสิ่งเร้าที่สร้างภาพ รวมถึงมนุษย์ด้วย การทดสอบภาพแรกๆ สองสามภาพให้ผลลัพธ์ที่สมจริงและเหนือระดับซึ่งตรงตามคำแนะนำที่ให้มา ซึ่งถือว่าน่าประทับใจสำหรับเครื่องมือฟรี
เคล็ดลับ : คุณสามารถขอให้ Gemini แก้ไขรูปภาพต่อได้โดยไม่ต้องเริ่มต้นใหม่ทุกครั้ง
การสามารถเข้าถึง Imagen 3 ผ่าน Gemini ได้ฟรีนั้นถือว่าเป็นเรื่องดี แต่การต้องหลีกเลี่ยงทุกคนถือเป็นข้อจำกัดที่สำคัญ การอัปเดตล่าสุดของ Google เปิดโอกาสและทำให้บริการฟรีของ Gemini กลายเป็นคู่แข่งที่คู่ควรกับบริการแบบชำระเงินเช่นMidjourney
แม้ว่าบริการแบบชำระเงินจะมีตัวเลือกขั้นสูงมากกว่า เช่น ขนาดรูปภาพที่กำหนดเอง แต่แนวทางของ Gemini นั้นง่ายและพร้อมใช้งาน ด้วยความฟรีมากมายขนาดนี้ จึงไม่น่าแปลกใจที่การเข้าใช้งานก่อนกำหนดจะเพียงพอที่จะทำให้ผู้คนยอมจ่ายเงินเพื่อซื้อ Gemini Advanced