เมาน์เทนวิว, แคลิฟอร์เนีย – Google ได้ประกาศเปิดตัวฟีเจอร์ใหม่ล่าสุดในชื่อ “Video Overview” ซึ่งเป็นส่วนขยายของระบบ AI Overviews ที่เปิดตัวไปก่อนหน้านี้ โดยฟีเจอร์ใหม่นี้จะใช้เทคโนโลยีปัญญาประดิษฐ์ขั้นสูงในการเปลี่ยนข้อมูลที่เป็นตัวอักษรยาวๆ หรือหัวข้อที่ซับซ้อน ให้กลายเป็นวิดีโอสรุปสั้นๆ ที่มีทั้งภาพเคลื่อนไหว, เสียงบรรยาย และข้อความประกอบ
เบื้องหลังการทำงาน: การผสมผสานของ Gemini และ Veo
เทคโนโลยีเบื้องหลัง Video Overview คือการทำงานร่วมกันของโมเดล AI ที่ทรงพลังที่สุดของ Google สองตัว:
- Gemini Model: ทำหน้าที่เป็น “สมอง” ในการอ่าน, วิเคราะห์ และทำความเข้าใจเนื้อหาจากหน้าเว็บไซต์หรือผลการค้นหา จากนั้นจะสรุปประเด็นสำคัญและเรียบเรียงออกมาเป็นสคริปต์สำหรับวิดีโอ
- Veo Model: ซึ่งเป็นโมเดล Text-to-Video ขั้นสูงของ Google จะทำหน้าที่เป็น “ผู้กำกับ” โดยนำสคริปต์ที่ได้จาก Gemini มาสร้างเป็นภาพเคลื่อนไหว, กราฟิก และวิดีโอประกอบ พร้อมทั้งสร้างเสียงบรรยาย (AI Voiceover) ที่สอดคล้องกับเนื้อหา
ผลลัพธ์ที่ได้คือคลิปวิดีโอความยาวประมาณ 60-90 วินาที ที่สามารถอธิบายเรื่องราวที่ซับซ้อน เช่น หลักการทำงานทางวิทยาศาสตร์, สรุปประวัติศาสตร์ หรือขั้นตอนการทำสิ่งต่างๆ ได้อย่างกระชับและเห็นภาพชัดเจน
ประสบการณ์ของผู้ใช้งาน
ในช่วงทดลองใช้งาน เมื่อผู้ใช้ค้นหาข้อมูลในหัวข้อที่ซับซ้อน ระบบอาจแสดงการ์ด “Video Overview” ขึ้นมาเป็นตัวเลือกบนสุดของหน้าผลการค้นหา ผู้ใช้สามารถกดเล่นวิดีโอเพื่อรับชมสรุปได้ทันทีโดยไม่ต้องคลิกเข้าไปอ่านเนื้อหาทั้งหมดจากหลายๆ เว็บไซต์
นางลิซ รีด (Liz Reid) หัวหน้าฝ่าย Google Search กล่าวว่า “เราพบว่าผู้คนมีวิธีการเรียนรู้และรับข้อมูลที่แตกต่างกัน Video Overview คือความพยายามของเราในการทำให้ข้อมูลเข้าถึงได้ง่ายขึ้นสำหรับทุกคน โดยเฉพาะผู้ที่เป็น Visual Learner (ผู้ที่เรียนรู้ผ่านการมองเห็น) และผู้ที่ต้องการคำตอบอย่างรวดเร็วในรูปแบบที่ย่อยง่าย”
แผนการเปิดใช้งาน
ในระยะแรก ฟีเจอร์ Video Overview จะเริ่มเปิดทดลองใช้งานในวงจำกัดสำหรับผู้ใช้งานในสหรัฐอเมริกาที่ใช้ภาษาอังกฤษ และจะทยอยขยายไปยังภูมิภาคและภาษาอื่นๆ ต่อไปในอนาคตโดยขึ้นอยู่กับผลตอบรับจากผู้ใช้งาน



