อาลีบาบา ส่ง Marco-o1 ลงสังเวียน ท้าชน OpenAI ด้านใช้เหตุผลแก้ปัญหา

อาลีบาบา ส่ง Marco-o1 ลงสังเวียน ท้าชน OpenAI ด้านใช้เหตุผลแก้ปัญหา

ความก้าวหน้าเอไอจีน ‘อาลีบาบา’ ส่ง Marco-o1 ลงสนาม โชว์ความเก่งด้านการแปลภาษา แก้ปัญหาแบบมีเหตุผล พร้อมเปิดให้นักพัฒนาทั่วโลกเข้าถึงโค้ด ท้าชนโมเดลของ OpenAI

ทีมมาร์โคโพโล (MarcoPolo Team) จาก อาลีบาบา อินเตอร์เนชันแนล ดิจิทัล คอมเมิร์ซ ได้เปิดตัวโมเดล “มาโคร-โอวัน (Marco-o1)” ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ที่พัฒนาขึ้นเพื่อตอบโจทย์การใช้เหตุผลในการแก้ปัญหาแบบปลายเปิด โดยมีจุดมุ่งหมายที่จะแข่งขันกับโมเดล o1 ของ OpenAI

Marco-o1 มีความพิเศษตรงที่ไม่ได้เก่งแค่การแก้โจทย์คณิตศาสตร์หรือการเขียนโค้ด แต่สามารถรับมือกับโจทย์ปัญหาที่ไม่มีคำตอบตายตัว เหมือนกับปัญหาที่เราเจอในชีวิตจริง ซึ่งบางครั้งอาจมีหลายคำตอบที่ถูกต้อง ทีมพัฒนาได้ใช้เทคนิคพิเศษหลายอย่างเพื่อให้ เอไอคิดเป็นระบบ มากขึ้น เช่น

  • การสอนให้คิดเป็นขั้นเป็นตอน (Chain-of-Thought) เหมือนการที่ครูสอนให้นักเรียนแสดงวิธีทำ ไม่ใช่แค่ตอบคำตอบสุดท้าย
  • การใช้ระบบ Monte Carlo Tree Search ซึ่งเป็นเหมือนการให้เอไอลองคิดหลายๆ แนวทาง แล้วเลือกแนวทางที่ดีที่สุด คล้ายกับที่เราชอบคิดหลายๆ ทางก่อนตัดสินใจทำอะไรสักอย่าง
  • มีระบบให้เอไอทบทวนตัวเองว่าคิดถูกหรือผิด เหมือนที่เราชอบบอกตัวเอง “เดี๋ยวก่อน ลองคิดใหม่อีกที”

ทางบริษัทอธิบายว่า ความสามารถ Marco-o1 โดดเด่นมากในเรื่องการแปลภาษา โดยเฉพาะการแปลสำนวนหรือคำพูดที่ใช้ในชีวิตประจำวัน

ยกตัวอย่างเช่น เมื่อเจอประโยคในภาษาจีนที่พูดถึงรองเท้าว่า “ให้ความรู้สึกเหมือนเหยียบอุจจาระ (“这个鞋拥有踩屎感”)” ซึ่งเป็นสำนวนที่คนจีนใช้บอกว่ารองเท้านุ่มมาก Marco-o1 สามารถแปลเป็นภาษาอังกฤษว่า “รองเท้าคู่นี้มีพื้นที่สวมใส่สบาย” แทนที่จะแปลตรงๆ แบบผิดความหมาย แสดงให้เห็นถึงความเข้าใจในบริบทและวัฒนธรรม

ในการทดสอบประสิทธิภาพ Marco-o1 ทำคะแนนได้ดีขึ้นกว่าโมเดลรุ่นก่อนถึง 6.17% สำหรับการทดสอบภาษาอังกฤษ และ 5.60% สำหรับภาษาจีน ซึ่งแสดงให้เห็นว่าการพัฒนาระบบการคิดและใช้เหตุผลของเอไอทำได้ผลจริง

นอกจากนี้ ทีมพัฒนาได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ซึ่งเป็นแพลตฟอร์มที่นักพัฒนาทั่วโลกสามารถเข้าถึงได้ แสดงให้เห็นถึงความตั้งใจที่จะสร้างความก้าวหน้าในวงการเอไอแบบเปิดกว้าง

การเปิดตัว Marco-o1 ครั้งนี้ยังสอดคล้องกับความเคลื่อนไหวของบริษัทเอไอจีนรายอื่นอย่าง บริษัท DeepSeek เปิดตัวโมเดล DeepSeek-R1-Lite-Preview ที่มีความสามารถใกล้เคียงกับ o1 ของ OpenAI โดยเฉพาะในการทำโจทย์คณิตศาสตร์ระดับสูงและการใช้เหตุผลเชิงตรรกะ สะท้อนให้เห็นว่า วงการเอไอในจีนกำลังพัฒนากันอย่างเข้มข้นที่จะแข่งขันกับบริษัทชั้นนำจากตะวันตก

อ้างอิง: GitHub AIM และ Medium