OpenAI เปิดตัว GPT-4o รองรับภาษาไทย จุดเด่น ‘แปลเรียลไทม์-ติดตั้งได้บนเดสก์ท็อป’

OpenAI เปิดตัว GPT-4o รองรับภาษาไทย จุดเด่น ‘แปลเรียลไทม์-ติดตั้งได้บนเดสก์ท็อป’

GPT-4o เวอร์ชันใหม่ เร็ว-แรง ฉลาดกว่าเดิม รองรับการใช้งานภาษาไทย แปลภาษาแบบเรียลไทม์ สามารถติดตั้งได้บนหน้าจอเดสก์ท็อป

เมื่อวันจันทร์ที่ 13 พ.ค. OpenAI บริษัทวิจัยปัญญาประดิษฐ์ ได้เปิดตัว GPT-4o (โฟร์-โอ) เวอร์ชันใหม่ ซึ่งทำงานได้รวดเร็วและแรงกว่ารุ่น GPT-4 พร้อมทั้งยังรองรับการใช้งานภาษาไทย ฟังเสียง-อ่านภาพได้โดยไม่ต้องการโมเดล speech-to-text แยก และยังสามารถติดตั้ง ChatGPT บนหน้าจอเดสก์ท็อปที่สามารถฟังเสียงและจับภาพหน้าจอได้ในตัว

มิรา มูราติ หัวหน้าฝ่ายเทคโนโลยีของ OpenAI กล่าวว่า GPT-4o นั้น “เร็วขึ้นมาก” สามารถรับข้อมูลนำเข้าได้หลายรูปแบบ (multimodal) ไม่ว่าจะเป็นข้อความ เสียง หรือภาพ และสร้างผลลัพธ์ออกมาได้ทุกรูปแบบ โดย ตัว “o” ในชื่อ “GPT-4o” ย่อมาจาก “omni” ที่แปว่าความรอบรู้ 

นอกจากนี้ GPT-4o ยังรองรับภาษาได้ถึง 50 ภาษา หนึ่งในนั้นมีภาษาไทยอยู่ในลิสต์ โดยสามารถเข้าใจภาษาไทยอย่างลึกซึ้ง แปลภาษาไทย-อังกฤษได้แบบเรียลไทม์ 

ด้านของวิดีโอและเสียงก็ทำงานได้ดีขึ้น มีฟังก์ชันสั่งและตอบด้วยเสียง (Voice Mode) ผู้ใช้สามารถพูดแทรก ChatGPT ได้ทันที เช่น ขอให้พูดเสียงหุ่นยนต์หรือตอบเป็นเพลง ตลอดจนขอให้เอไอเล่านิทานก่อนนอน 

“Voice Mode เป็นฟังก์ชันที่สั่งเสียงกับเอไอ โดยเอไอสามารถตอบสนองต่อคำสั่งเสียงของผู้ใช้ภายในเวลาเพียง 232 มิลลิวินาที โดยเฉลี่ยอยู่ที่ 320 มิลลิวินาที ซึ่งใกล้เคียงกับเวลาตอบสนองของมนุษย์ในการสนทนา”

แน่นอนว่า ตอนนี้ GPT-4o สามารถเป็น “ล่าม” ได้แล้ว เพราะมันสามารถแปลคำพูดจากภาษาหนึ่งเป็นอีกภาษาหนึ่งเกือบจะในทันที ทีมผู้สร้างได้ทดสอบความสามารถของเอไอ ด้วยการสั่งให้แก้สมการทางคณิตศาสตร์และช่วยเขียนโค้ด ซึ่งก็ทำได้ดีขึ้น นับว่าเป็นคู่แข่งที่สูสีกับ GitHub Copilot ของไมโครซอฟท์

OpenAI ยังประกาศว่าฟีเจอร์หลายอย่างที่เคยจำกัดให้เฉพาะ ChatGPT Plus สมาชิกที่ชำระค่าบริการ ตอนนี้ขยายมารองรับผู้ใช้งานแบบฟรีทุกคนมากขึ้น ยกตัวอย่างเช่น สามารถอัปโหลดรูปภาพ และให้เอไอตอบคำถามได้ หรือฟีเจอร์ Memory ที่จดจำฐานข้อมูลต่าง ๆ โดยไม่ต้องป้อนหลายรอบ  

สำหรับ ChatGPT เวอร์ชันเดสก์ท็อป ผู้ใช้เข้าถึงบริการได้ฟรี ทำให้โต้ตอบกับเอไอได้สะดวกและง่ายขึ้น ในส่วนของสมาชิก ChatGPT Plus ทางทีมก็ยกระดับสิทธิพิเศษขึ้นมากกว่าเดิม โดยจะเข้าถึงฟังก์ชัน Voice Mode ที่กำลังเตรียมเปิดตัวในสัปดาห์หน้าได้ก่อนใคร

“การเปิดตัว GPT-4o ครั้งนี้ ถือเป็นหนึ่งในการประกาศครั้งใหญ่ของบริษัท นับตั้งแต่เปิดตัว ChatGPT เราใช้เวลาพัฒนาแชตบอตเอไอน้อยกว่า 1 ปี และได้รับความช่วยเหลือจากบริษัทต่าง ๆ มากกว่า 20 บริษัท ก้าวต่อไปคือ การทำให้ทุกคนสามารถทำงานร่วมกับเครื่องมืออย่าง ChatGPT ง่ายขึ้นและมีความปลอดภัยมากขึ้น” แบรด ไลท์แคป ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ OpenAI กล่าว

อ้างอิง: cnbc , open ai