ChatGPT เปิดให้ใช้งานฟีเจอร์ ‘สนทนาถามตอบด้วยวิดีโอ’ แบบเรียลไทม์

ChatGPT เปิดให้ใช้งานฟีเจอร์ ‘สนทนาถามตอบด้วยวิดีโอ’ แบบเรียลไทม์

รองรับการสนทนาถามตอบด้วยวิดีโอแบบเรียลไทม์ OpenAI เพิ่มฟังก์ชันใหม่ให้โหมด Advanced Voice Mode ของ ChatGPT สามารถมองเห็นและวิเคราะห์สิ่งรอบตัวแบบเรียลไทม์ พร้อมให้คำแนะนำและอธิบายอย่างละเอียด

OpenAI ได้เพิ่มความสามารถใหม่ให้โหมดสั่งการด้วยเสียง (Advanced Voice Mode) ของ ChatGPT ที่สามารถวิเคราะห์วิดีโอและภาพหน้าจอแบบเรียลไทม์ผ่านแอปพลิเคชัน โดยผู้ใช้สามารถเปิดกล้องสมาร์ทโฟนเพื่อให้ ChatGPT เรียนรู้ อธิบาย และตอบคำถามเกี่ยวกับสิ่งที่ปรากฏตรงหน้าได้ ซึ่งก่อนหน้านี้เป็นแค่การสั่งการด้วยเสียงเท่านั้น

นอกจากการวิเคราะห์วัตถุโดยตรงแล้ว ระบบยังสามารถแชร์หน้าจออุปกรณ์เพื่อช่วยเหลือผู้ใช้ในการแก้ปัญหาต่างๆ เช่น อธิบายการตั้งค่าซอฟต์แวร์ ช่วยแก้โจทย์คณิตศาสตร์ หรือให้คำแนะนำในการใช้งานแอปพลิเคชันต่างๆ ผู้ใช้สามารถแพลนกล้องเพื่อให้เอไอโต้ตอบและรับคำแนะนำจาก ChatGPT เสมือนมีครูมาสอนทีละขั้นตอน

ChatGPT เปิดให้ใช้งานฟีเจอร์ ‘สนทนาถามตอบด้วยวิดีโอ’ แบบเรียลไทม์

จุดประสงค์ของความสามารถนี้คือ การเปิดโอกาสให้ผู้ใช้โต้ตอบกับปัญญาประดิษฐ์แบบมีปฏิสัมพันธ์มากขึ้น โดยไม่จำกัดเพียงแค่การพิมพ์ข้อความ หรือการสนทนาด้วยเสียงเท่านั้น แต่ยังสามารถเรียนรู้และเข้าใจบริบทผ่านภาพ

สำหรับการเข้าถึง ขณะนี้เปิดให้เฉพาะผู้ใช้ ChatGPT Plus, Team และ Pro ส่วนผู้ใช้ Enterprise และ Edu จะได้รับสิทธิ์ในเดือนมกราคมปี 2025 ส่วนผู้ใช้ในยุโรปยังรอการประกาศอย่างเป็นทางการ นอกจากนี้ OpenAI ยังเพิ่มความฟีเจอร์โหมดเสียงพิเศษ “ซานต้า” ที่มีให้ใช้ช่วงสิ้นปี 2024

เกร็ก บร็อคแมน ในฐานะประธาน OpenAI สาธิตความสามารถใหม่ของ ChatGPT ผ่านรายการ  60 Minutes โดยในการสาธิต แอนเดอร์สัน คูเปอร์ ผู้ประกาศข่าว ได้วาดภาพร่างกายมนุษย์บนกระดานดำ ขณะที่ ChatGPT ทำหน้าที่วิเคราะห์และอธิบายรายละเอียด ซึ่งระบบสามารถระบุตำแหน่งอวัยวะต่างๆ ได้อย่างแม่นยำ โดยเฉพาะสมอง

ตัวอย่างเช่น เมื่อคูเปอร์วาดสมอง ChatGPT สามารถอธิบายได้ว่า “ตำแหน่งถูกต้องมาก สมองอยู่ในศีรษะ สำหรับรูปทรงนั้นเริ่มได้ดี แต่สมองจริงๆ มีลักษณะเป็นวงรีมากกว่า” การสาธิตนี้แสดงให้เห็นความสามารถล่าสุดของเอไอในการรับรู้และตีความภาพวาดแบบเรียลไทม์ แต่ก็ยังคงมีข้อจำกัดบางประการ เช่น ความแม่นยำในรายละเอียดที่ซับซ้อน

สำหรับคู่แข่ง ด้าน Google กำลังพัฒนาโครงการที่เรียกว่า Project Astra ซึ่งเป็นระบบปัญญาประดิษฐ์ที่สามารถรับรู้และวิเคราะห์สภาพแวดล้อมผ่านกล้องแบบทันทีทันใด โดยเริ่มทดสอบกับกลุ่มผู้ใช้แอนดรอยด์ที่ได้รับการคัดเลือกเป็นพิเศษ

Meta (บริษัทแม่ของ Facebook) ก็อยู่ระหว่างการพัฒนาความสามารถคล้ายคลึงกันสำหรับแพลตฟอร์มของตน โดยมุ่งเน้นการสร้างระบบแชตบอตที่สามารถโต้ตอบกับสภาพแวดล้อมรอบตัวได้อย่างอัจฉริยะ

อ้างอิง: techcrunch