อัปเดต Gemini 1.5 Pro ใหม่เพิ่มความสามารถในการฟังไฟล์เสียงและประมวลผลและแยกข้อมูลข้อความจากคลิปเสียงเหล่านั้น Gemini มีความสามารถในการประมวลผลเสียงประเภทต่างๆ ให้เป็นข้อความในภาษาต่างๆ มากมาย เพื่อช่วยให้ผู้ใช้รับเนื้อหาที่ต้องการได้อย่างง่ายดาย นี่คือคำแนะนำในการแปลงไฟล์เสียงเป็นข้อความบน Gemini 1.5 Pro
วิธีการแปลงไฟล์เสียงเป็นข้อความบน Gemini 1.5 Pro
ขั้นตอนที่ 1:
ขั้นแรกคุณต้องเข้าถึงเว็บไซต์การประมวลผลเสียงของ Gemini ได้ที่ลิงค์ด้านล่าง
ถัดไป ดูที่ส่วนโมเดลทางด้านขวาและเลือก Gemini 1.5 Proที่จะใช้

ขั้นตอนที่ 2:
ขั้นตอนต่อไปคือ ผู้ใช้คลิกที่แท็บเสียงด้านบนเพื่อดาวน์โหลดไฟล์เสียงที่ต้องการแปลงเป็นข้อความ

ตอนนี้ผู้ใช้จะเห็นตัวเลือกในการอัปโหลดเสียงไปยัง Gemini 1.5 Pro เพื่อใช้งาน คุณเลือกไดรฟ์เพื่อดาวน์โหลดเสียงจาก Google Drive

ณ จุดนี้ ผู้ใช้จะต้องยินยอมให้ Google AI Studio เข้าถึงบัญชี Google ของคุณ

ขั้นตอนที่ 3:
ผู้ใช้จะอัปโหลดไฟล์เสียงที่จะประมวลผลไปยัง Gemini 1.5 Pro จากนั้นป้อนคำขอที่ต้องการดำเนินการแล้วกด ไอคอน ส่งวงกลมสีน้ำเงินโปรดทราบว่าบัญชีแต่ละบัญชีจะมีจำนวนโทเค็นเป็นของตัวเอง และทุกครั้งที่คุณอัปโหลดไฟล์เสียง จะต้องใช้จำนวนโทเค็นที่แตกต่างกันในการประมวลผลไฟล์ที่อัปโหลด

ขั้นตอนที่ 4:
ทันทีหลังจากนั้นคุณจะเห็นเนื้อหาที่ถูกถ่ายโอนจากเสียงบน Gemini 1.5 Pro ดังที่แสดงด้านล่าง เนื้อหาถูกเขียนไว้อย่างชัดเจนและเฉพาะเจาะจงเป็นรายชั่วโมงเพื่อให้ผู้ใช้สามารถติดตามได้ง่าย

ฟีเจอร์ใหม่นี้ใน Gemini 1.5 Pro ใช้ได้กับบัญชี Google ทั้งหมด โดยที่คุณไม่ต้องลงทะเบียนอะไรเลย