เคยอยากจะแก้ไขงาน DALL-E 3 ของคุณทันทีแต่ไม่รู้วิธีการบ้างไหม? ข่าวดีก็คือ OpenAI ได้เพิ่มเครื่องมือแก้ไขแบบอินไลน์ให้กับ DALL-E 3 ใน ChatGPT ทำให้คุณแก้ไขงานได้โดยไม่ต้องออกจากแอปพลิเคชัน
ปัญหาเดียวคือพวกเขาไม่ได้ทำอย่างที่ OpenAI โฆษณา และยากที่จะบอกได้ว่าคุณได้รับการแก้ไขตามที่ต้องการหรือไม่ อย่างไรก็ตาม นั่นยังเป็นเพียงจุดเริ่มต้นของสิ่งที่จะเกิดขึ้นในกระบวนการแก้ไข DALL-E 3 และนี่คือวิธีการทำงาน
เครื่องมือแก้ไขของ DALL-E 3 คืออะไร?
OpenAI อยู่มาสักระยะแล้ว แต่ในที่สุดก็ได้เพิ่มฟังก์ชันการแก้ไขให้กับ DALL-E 3 ใน ChatGPT Plus ก่อนหน้านี้คุณสามารถลองแก้ไขการสร้าง DALL-E 3 ได้ แต่ปกติแล้วจะได้ภาพใหม่ทั้งหมดเสมอ แม้ว่าคำแนะนำที่ใช้สร้างรูปภาพที่แก้ไขจะคล้ายคลึงกับคำแนะนำแรกมากก็ตาม แต่เนื่องจากลักษณะของ AI เชิงสร้างสรรค์ ผลลัพธ์ที่ได้จึงอาจแตกต่างอย่างมาก
เครื่องมือแก้ไขในตัวของ DALL-E 3 มุ่งเน้นไปที่การแก้ไขปัญหาภายในภาพเดียวกันโดยไม่ต้องสร้างคำแนะนำใหม่ คุณทำเครื่องหมายพื้นที่ในรูปภาพที่คุณต้องการปรับ สั่งให้ DALL-E ทำการเปลี่ยนแปลงที่ต้องการ (เช่น "ลบสิ่งนี้" หรือ "เพิ่มคุณสมบัตินี้") แล้วทุกอย่างก็จะทำงาน
ตัวอย่างเครื่องมือแก้ไข DALL-E 3
ตัวอย่างบนบล็อกอย่างเป็นทางการของ OpenAI แสดงให้เห็น DALL-E เพิ่มดอกซากุระลงในภาพแมวสไตล์อุคิโยเอะ และทุกอย่างทำงานได้อย่างสมบูรณ์แบบ จากประสบการณ์ เครื่องมือแก้ไขของ DALL-E พบว่ามีปัญหาในการเพิ่มรูปภาพที่มีรายละเอียดดังกล่าวลงในรูปภาพที่มีอยู่ และส่วนใหญ่ไม่สามารถจัดการกับคำขอประเภทนี้ได้
นั่นไม่ได้หมายความว่าเครื่องมือแก้ไขไม่ทำงาน พวกเขาสามารถลบคุณสมบัติต่างๆ ออกไปได้อย่างแน่นอน และทำการเปลี่ยนแปลงเล็กๆ น้อยๆ อย่างที่ให้รายละเอียดไว้ด้านล่าง แต่ทั้งหมดเป็นเพียงการเปลี่ยนแปลงในระดับเล็กน้อยเท่านั้น
วิธีใช้เครื่องมือแก้ไข DALL-E 3
วิธีที่ดีที่สุดในการแสดงให้เห็นว่าเครื่องมือแก้ไขของ DALL-E 3 ทำอะไรได้บ้างคือการให้ตัวอย่างที่เหมาะสม
ลบและลบ
เครื่องมือแก้ไขของ DALL-E 3 สามารถลบรายละเอียดเล็กๆ น้อยๆ บางส่วนออกไปได้ แต่มันก็สร้างความยุ่งยากอย่างแน่นอน ในภาพต่อไปนี้ ผู้เขียนบทความได้ขอให้ DALL-E สร้าง"มือหุ่นยนต์ที่ถือชิปสี่เหลี่ยมโปร่งใสเรืองแสงซึ่งมีคำว่า 'AI Accelerated' เขียนอยู่ พื้นหลังเป็นสีน้ำเงินเข้ม สร้างบรรยากาศล้ำยุคและไฮเทค"
ขณะนี้ ข้อความที่เขียนเป็นปัญหาสำหรับ Generative AI ดังนั้นจึงไม่น่าแปลกใจที่ข้อความจะผิด ดังนั้นผู้เขียนจึงขอให้ DALL-E ลบคำพิมพ์ผิดออกไป ล้มเหลวในการลองครั้งแรกโดยมีข้อความแจ้งเตือนว่า "กรุณาลบคำนี้" แต่ประสบความสำเร็จในการลองครั้งที่สองโดยมีข้อความแจ้งเตือนว่า "กรุณาลบคำนี้ออกจากรูปภาพ" ดังนั้นคุณอาจต้องลองใช้คำสั่งต่างๆ เพื่อให้ได้ผลลัพธ์ที่ต้องการ จากนั้นผู้เขียนจึงขอให้มันย้ายตัวอักษร AI มาไว้ตรงกลางสี่เหลี่ยม ซึ่งมันก็ใช้งานได้ดี แม้ว่าด้วยเหตุผลบางประการพีซีจึงขัดข้องก็ตาม
ถัดมาผู้เขียนขอให้ DALL-E แก้ไขภาพโทรทัศน์ DALL-E นั้นยอดเยี่ยมสำหรับการสร้างภาพที่ไม่ซ้ำใคร แต่มีรายละเอียดบางส่วนที่ไม่ถูกต้องหรือให้ข้อความที่ผิดเพี้ยน ในกรณีนี้แถบข้อมูลบนหน้าจอทีวีจะแสดงข้อความ AI ที่ไม่มีความหมาย ดังนั้นผู้เขียนจึงต้องการลบข้อความนี้ออก ความพยายามครั้งแรกของ DALL-E ทิ้งเงาไว้ในแถบข้อมูล ส่วนความพยายามครั้งที่สองและสามนั้นชัดเจนขึ้นมาก ไม่สมบูรณ์แบบแต่ก็ดีพอสำหรับการใช้ภาพเริ่มต้น
เพิ่มและเปลี่ยนแปลง
DALL-E 3 สามารถทำการเปลี่ยนแปลงภาพบางส่วนได้ แต่ทั้งนี้ขึ้นอยู่กับขนาดของเนื้อหาที่คุณต้องการ อาจมีการเพิ่มและเปลี่ยนแปลงเล็กน้อยแต่ในกรณีส่วนใหญ่เครื่องมือแก้ไขของ DALL-E ไม่สามารถจัดการกับสิ่งที่จำเป็นได้
ผู้เขียนขอให้ DALL-E "สร้างภาพระยะใกล้ 4k 2:1 ของดวงตาของมนุษย์ โดยมีรายละเอียดที่ยอดเยี่ยม" ซึ่งส่งผลให้ได้ภาพต่อไปนี้:
เครื่องมือแก้ไขภาพระยะใกล้ของดวงตามนุษย์
ค่อนข้างดี (ยกเว้นขนตา) แต่ผู้เขียนต้องการเปลี่ยนสีม่านตาให้เป็นสีน้ำเงิน จึงได้ภาพนี้:
เครื่องมือแก้ไขเปลี่ยนสีดวงตาของมนุษย์
สีค่อนข้างหมองแต่ไม่เปลี่ยนแปลง มีรายละเอียดบางส่วนโค้งเล็กน้อย
ถัดมาผู้เขียนขอให้ DALL-E "สร้างภาพสไตล์เคลย์แมชั่น 4k 2:1 ของคนสวมชุดบอดี้สูทเสือกำลังเล่นสกีลงเนินโดยมีตุ๊กตาหิมะเป็นฉากหลัง "
ภาพต้นฉบับยังคงสวยงาม คมชัด สีสันสดใส และสอดคล้องกับข้อความ อย่างไรก็ตามผู้เขียนต้องการเปลี่ยนเยติให้เป็นสัตว์น่ากลัวอีกประเภทหนึ่ง
ตุ๊กตาหิมะถูกลบออกจากรูปภาพแล้ว
แทนที่จะเปลี่ยนตุ๊กตาหิมะเป็นสัตว์อื่น มันกลับหายไปอย่างสิ้นเชิง ผู้เขียนกลับไปที่ภาพดั้งเดิมและขอตุ๊กตาหิมะอีกตัวแต่มันไม่ได้ผล ในทำนองเดียวกัน ผลลัพธ์ก็ล้มเหลวเช่นกันเมื่อผู้เขียนขอให้เพิ่มต้นไม้ลงในรูปภาพ
เพิ่มข้อความ
กล่าวได้ว่า Generative AI มักประสบปัญหาในการจัดการข้อความ และการเพิ่มข้อความลงในรูปภาพนั้นยากยิ่งกว่า ผู้เขียนขอให้ DALL-E สร้างโปสการ์ดจากชายทะเลในอังกฤษ และมันก็สามารถถ่ายทอดฉากนั้นได้อย่างสวยงาม ผู้เขียนต้องการเพิ่มข้อความ "Sunny Beach" ลงในรูปภาพแต่เครื่องมือไม่สามารถจัดการได้
นั่นคือจนกระทั่งหลังจากมีการแจ้งเตือนไปมาประมาณ 6 หรือ 7 ครั้งเพื่อเตือน DALL-E ว่าจะต้องทำอะไร เครื่องมือจึงสร้างภาพใหม่ทั้งหมดพร้อมข้อความที่ร้องขอ
ถัดไปคือการ์ดวันเกิด คราวนี้ DALL-E เติมคำว่า "สุขสันต์วันเกิด" โดยไม่ต้องบอก ผู้เขียนจึงขอให้เพิ่มวันเกิดเข้าไปในบัตรด้วย DALL-E ไม่สามารถเพิ่มวันที่ลงในการ์ดอีกครั้ง แต่หลังจากได้รับแจ้งสองสามครั้ง ก็สร้างรูปภาพใหม่พร้อมวันที่ที่ร้องขอขึ้นมา ในกรณีนี้ การเพิ่มวันที่ด้วยตัวเองจะง่ายกว่า โดยเฉพาะถ้าคุณต้องการเก็บรูปถ่ายต้นฉบับไว้
เครื่องมือแก้ไขของ DALL-E มีประโยชน์แต่ต้องใช้ความอดทนสักหน่อย
เครื่องมือแก้ไขของ DALL-E มีประโยชน์สำหรับงานบางอย่าง แต่จะต้องใช้เวลาสักพักในการแก้ไขให้ถูกต้อง ในหลายๆ กรณี มันจะใช้ไม่ได้ผล และอาจจะดีกว่าถ้าใช้ข้อความเดิมแล้วปรับเปลี่ยนเพื่อสร้างภาพใหม่
เครื่องมือแก้ไขของ DALL-E น่าจะได้รับการปรับปรุงให้ดีขึ้นตามเวลา แต่จนกว่าจะถึงเวลานั้น ควรแก้ไขรูปภาพโดยใช้โปรแกรมแก้ไขรูปภาพดีกว่าเสียเวลากับการสนทนาหลายรอบกับ DALL-E