เมื่อ 12 ปีที่แล้ว นักเขียน Will Douglas Heaven ได้เขียนเรื่องสั้นตลกขบขันเกี่ยวกับชายคนหนึ่งที่หลงใหลในอาหารแมวราคาแพงในเวลาว่าง และตอนนี้มี แพลตฟอร์มGenerative AI ที่เรียกว่า Lore Machine ซึ่งช่วยเปลี่ยนเรื่องราวที่น่าสนใจนี้ให้กลายเป็นหนังสือการ์ตูน
ผู้เขียนใส่เรื่องราวของเขาลงในกล่องข้อความและได้รับข้อความว่า “ เรากำลังระบุฉาก สถานที่ ตัวละคร และอารมณ์ ซึ่งอาจใช้เวลาถึง 2 นาที ” Lore Machine วิเคราะห์ข้อความ สกัดคำอธิบายของบุคคลและสถานที่ที่กล่าวถึง แล้วส่งข้อมูลดังกล่าวไปยังโมเดลสร้างภาพ
สตอรี่บอร์ดภาพประกอบจะปรากฏบนหน้าจอ ในขณะที่ผู้เขียนคลิกดูภาพประกอบการ์ตูนอันสดใสของตัวละครที่เกือบลืมไปแล้ว สิ่งต่างๆ ก็เกิดการเปลี่ยนแปลงอย่างน่าประหลาดใจ
ฉากหนึ่งจากเรื่องราวที่วาดโดย Lore Machine
หลังจากผ่านการพัฒนามามากกว่าหนึ่งปี ตอนนี้ Lore Machine ก็ได้เปิดตัวต่อสาธารณะแล้ว ด้วยค่าใช้จ่ายเพียง 10 ดอลลาร์ต่อเดือน คุณสามารถอัปโหลดคำได้สูงสุด 100,000 คำ (อัปโหลดได้สูงสุด 30,000 คำต่อการอัปโหลดหนึ่งครั้ง) และสร้างภาพได้ 80 ภาพสำหรับเรื่องสั้น บทภาพยนตร์ บทบรรยายพอดแคสต์ และอื่นๆ อีกมากมาย ยังมีระดับสำหรับผู้ใช้ระดับสูงอีกด้วย รวมถึงแผนระดับองค์กรราคา 160 เหรียญสหรัฐฯ ต่อเดือน ซึ่งรองรับคำได้ 2.24 ล้านคำและรูปภาพ 1,792 รูป ภาพประกอบมีหลากหลายรูปแบบตั้งแต่มังงะไปจนถึงสีน้ำไปจนถึงรายการทีวีในยุค 80
Zac Ryder ผู้ก่อตั้งบริษัทโฆษณา Modern Arts ได้ใช้เครื่องมือเวอร์ชัน Early Access มาตั้งแต่ Thobey Campion ผู้ก่อตั้ง Lore Machine ได้แสดงให้ Ryder เห็นถึงศักยภาพของเครื่องมือนี้เป็นครั้งแรก ไรเดอร์ส่งบทภาพยนตร์สั้นให้กับระบบ และ Lore Machine ได้แปลงบทดังกล่าวให้กลายเป็นหนังสือการ์ตูนความยาว 16 หน้าในชั่วข้ามคืน
“ฉันจำได้ว่าโทบีย์แชร์หน้าจอของเขา พวกเราทุกคนตกตะลึงมาก” ไรเดอร์กล่าว“ไม่ใช่แค่เรื่องของภาพเท่านั้น แต่ยังรวมถึงการเล่าเรื่องด้วย ตั้งแต่เนื้อเรื่องไปจนถึงอารมณ์ของตัวละคร ทุกสิ่งทุกอย่างดูสมบูรณ์แบบตั้งแต่เริ่มต้น”
ปัจจุบัน Modern Arts กำลังใช้ Lore Machine เพื่อพัฒนาจักรวาลสมมติสำหรับหนังสือการ์ตูนชุดหนึ่ง ซึ่งเป็นผลงานที่อิงจากบทที่เขียนโดยผู้สร้างLove, Death & Robots ของ Netflix
Lore Machine สร้างมาจากส่วนประกอบที่คุ้นเคย:
แบบจำลองภาษาขนาดใหญ่ (LLM) จะสแกนข้อความของคุณโดยระบุคำอธิบายของบุคคล สถานที่ รวมถึงความรู้สึกทั่วไป
เวอร์ชัน Stable Diffusion จะสร้างภาพ
สิ่งที่ทำให้ Lore Machine แตกต่างคือความง่ายในการใช้งาน การอัพโหลดเนื้อหาเรื่องราวและดาวน์โหลดผลลัพธ์ใช้เวลาเพียงไม่กี่คลิก
ซึ่งทำให้ Lore Machine กลายเป็นตัวอย่างที่ดีเยี่ยมของเครื่องมือรูปแบบใหม่ที่เป็นมิตรต่อผู้ใช้แต่ยังซ่อนพลังอันน่าเหลือเชื่อไว้ภายใต้อินเทอร์เฟซเว็บที่เรียบง่ายอย่างเหลือเชื่อ
“มีงานมากมายที่ต้องทำเพื่ออัปเดตเครื่องมือ AI ใหม่ และอินเทอร์เฟซและเวิร์กโฟลว์จะแตกต่างกันไปสำหรับแต่ละเครื่องมือ ” เบน พาล์มเมอร์ ซีอีโอของ New Computer Corporation ซึ่งเป็นบริษัทผู้สร้างเนื้อหา กล่าว“การใช้เครื่องมือขนาดใหญ่ที่มีอินเทอร์เฟซผู้ใช้ที่สอดคล้องกันนั้นมีเสน่ห์ดึงดูดใจมาก ฉันรู้สึกว่านั่นคือจุดที่อุตสาหกรรมจะยืนหยัดได้”
Campion ก่อตั้งบริษัทที่อยู่เบื้องหลัง Lore Machine เมื่อสองปีก่อนเพื่อพัฒนา Wikipedia เวอร์ชันบล็อคเชน แต่เมื่อเขาเห็นว่าผู้คนนำโมเดลเชิงกำเนิดไปใช้ แคมเปี้ยนก็เปลี่ยนทิศทาง Campion ใช้โมเดล Midjourney แปลงข้อความเป็นรูปภาพฟรีเพื่อสร้างการ์ตูนเรื่องThe Rime of the Ancient Mariner ของ Samuel Taylor Coleridge เขากล่าวว่าผลงานดังกล่าวแพร่ระบาดไปทั่ว แต่กระบวนการในการสร้างมันไม่สนุกเลย
“ภรรยาของผมเกลียดโครงการนั้น ” แคมเปี้ยนกล่าว“ทุกคืนฉันนอนดึกจนถึงตี 4 เพื่อพยายามทำให้รูปภาพออกมาสมบูรณ์แบบ ” ปัญหามีอยู่ว่าโมเดลการแปลงข้อความเป็นรูปภาพ เช่น Midjourney จะสร้างรูปภาพขึ้นมาครั้งละหนึ่งภาพ ซึ่งทำให้ยากต่อการรักษาความสอดคล้องระหว่างภาพต่าง ๆ ของตัวละครเดียวกัน แม้แต่การล็อคในรูปแบบที่เฉพาะเจาะจงสำหรับภาพหลายภาพก็อาจเป็นเรื่องยาก
ประสบการณ์นี้ทำให้เขาตระหนักว่าเทคโนโลยีจะต้องใช้งานง่ายกว่านี้มาก แคมเปี้ยนไม่ได้บอกชัดเจนว่า Lore Machine จัดการรักษาภาพลักษณ์และรูปแบบให้สอดคล้องกันในชุดภาพประกอบได้อย่างไร ก็ค่อนข้างดี แต่ไม่สมบูรณ์แบบ ในฉากหนึ่งในเรื่องราวของผู้เขียน ตัวละครที่มีผมสั้นกลับมีหน้าม้าขึ้นมาทันใด และยังมีฉากที่ตัวละครปรากฏตัวสองครั้ง - ในสถานที่ที่แตกต่างกัน
ภาพประกอบยังค่อยๆ มีความรู้สึกทั่วๆ ไปมากขึ้น ผู้เขียนผิดหวังที่คำอธิบายตัวละครหลายอย่างมีความเฉพาะเจาะจงมาก แต่กลับไม่ได้แสดงไว้ในภาพประกอบ อย่างไรก็ตาม หากเปรียบเทียบกับการทำแต่ละเฟรมด้วยมือแล้ว Lore Machine ถือเป็นก้าวสำคัญไปข้างหน้าอย่างมาก
“ความสม่ำเสมอเป็นที่น่าทึ่งมาก” ไรเดอร์กล่าวทำให้บริษัท Modern Arts ของ Ryder มั่นใจมากขึ้นที่จะใช้ Lore Machine ในโปรเจ็กต์ร่วมกับลูกค้า “ หากเราต้องกลับไปแก้ไขปัญหาด้านความสอดคล้องกันอย่างต่อเนื่อง เราก็ไม่มีทางส่งมอบงานได้ทันเวลา ”
สตอรี่บอร์ดที่สร้างขึ้นโดยใช้รูปภาพที่สร้างโดย AI
เช่นเดียวกับโมเดลการสร้างอื่น ๆ เทคโนโลยีที่อยู่เบื้องหลัง Lore Machine สามารถสร้างเนื้อหาที่เป็นอันตรายได้ตามต้องการ แคมเปี้ยนกล่าวว่าพวกเขาพยายามที่จะป้องกันการสร้างภาพที่แสดงถึงความรุนแรงหรือความเกลียดชัง แต่ในขณะเดียวกันก็ไม่ต้องการจำกัดการแสดงออกทางความคิดสร้างสรรค์ของศิลปิน
ความสนใจเริ่มแรกเกี่ยวกับ Lore Machine ส่วนใหญ่มาจากบริษัทการตลาด แต่แคมเปี้ยนหวังว่าการเปิดตัวอย่างแพร่หลายจะกระตุ้นให้ผู้ใช้มากขึ้นลองใช้ดู แคมเปี้ยนกล่าวว่าเมื่อหกเดือนก่อน เขาได้รับโทรศัพท์จากผู้อำนวยการโรงเรียนสำหรับเด็กพิการแห่งหนึ่งในแมนฮัตตัน ผู้อำนวยการต้องการรันหนังสือเรียนของเขาผ่านเครื่องมือนี้เพื่อให้เด็ก ๆ สามารถมองเห็นรูปภาพได้ “ ฉันไม่ได้คิดเรื่องนั้นเลย ฉันติดอยู่กับความคิดแบบฮอลลีวูด ” แคมเปี้ยนกล่าว