อาลีบาบา ส่ง Marco-o1 ลงสังเวียน ท้าชน OpenAI ด้านใช้เหตุผลแก้ปัญหา
ความก้าวหน้าเอไอจีน ‘อาลีบาบา’ ส่ง Marco-o1 ลงสนาม โชว์ความเก่งด้านการแปลภาษา แก้ปัญหาแบบมีเหตุผล พร้อมเปิดให้นักพัฒนาทั่วโลกเข้าถึงโค้ด ท้าชนโมเดลของ OpenAI
ทีมมาร์โคโพโล (MarcoPolo Team) จาก อาลีบาบา อินเตอร์เนชันแนล ดิจิทัล คอมเมิร์ซ ได้เปิดตัวโมเดล “มาโคร-โอวัน (Marco-o1)” ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ที่พัฒนาขึ้นเพื่อตอบโจทย์การใช้เหตุผลในการแก้ปัญหาแบบปลายเปิด โดยมีจุดมุ่งหมายที่จะแข่งขันกับโมเดล o1 ของ OpenAI
Marco-o1 มีความพิเศษตรงที่ไม่ได้เก่งแค่การแก้โจทย์คณิตศาสตร์หรือการเขียนโค้ด แต่สามารถรับมือกับโจทย์ปัญหาที่ไม่มีคำตอบตายตัว เหมือนกับปัญหาที่เราเจอในชีวิตจริง ซึ่งบางครั้งอาจมีหลายคำตอบที่ถูกต้อง ทีมพัฒนาได้ใช้เทคนิคพิเศษหลายอย่างเพื่อให้ เอไอคิดเป็นระบบ มากขึ้น เช่น
- การสอนให้คิดเป็นขั้นเป็นตอน (Chain-of-Thought) เหมือนการที่ครูสอนให้นักเรียนแสดงวิธีทำ ไม่ใช่แค่ตอบคำตอบสุดท้าย
- การใช้ระบบ Monte Carlo Tree Search ซึ่งเป็นเหมือนการให้เอไอลองคิดหลายๆ แนวทาง แล้วเลือกแนวทางที่ดีที่สุด คล้ายกับที่เราชอบคิดหลายๆ ทางก่อนตัดสินใจทำอะไรสักอย่าง
- มีระบบให้เอไอทบทวนตัวเองว่าคิดถูกหรือผิด เหมือนที่เราชอบบอกตัวเอง “เดี๋ยวก่อน ลองคิดใหม่อีกที”
ทางบริษัทอธิบายว่า ความสามารถ Marco-o1 โดดเด่นมากในเรื่องการแปลภาษา โดยเฉพาะการแปลสำนวนหรือคำพูดที่ใช้ในชีวิตประจำวัน
ยกตัวอย่างเช่น เมื่อเจอประโยคในภาษาจีนที่พูดถึงรองเท้าว่า “ให้ความรู้สึกเหมือนเหยียบอุจจาระ (“这个鞋拥有踩屎感”)” ซึ่งเป็นสำนวนที่คนจีนใช้บอกว่ารองเท้านุ่มมาก Marco-o1 สามารถแปลเป็นภาษาอังกฤษว่า “รองเท้าคู่นี้มีพื้นที่สวมใส่สบาย” แทนที่จะแปลตรงๆ แบบผิดความหมาย แสดงให้เห็นถึงความเข้าใจในบริบทและวัฒนธรรม
ในการทดสอบประสิทธิภาพ Marco-o1 ทำคะแนนได้ดีขึ้นกว่าโมเดลรุ่นก่อนถึง 6.17% สำหรับการทดสอบภาษาอังกฤษ และ 5.60% สำหรับภาษาจีน ซึ่งแสดงให้เห็นว่าการพัฒนาระบบการคิดและใช้เหตุผลของเอไอทำได้ผลจริง
นอกจากนี้ ทีมพัฒนาได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ซึ่งเป็นแพลตฟอร์มที่นักพัฒนาทั่วโลกสามารถเข้าถึงได้ แสดงให้เห็นถึงความตั้งใจที่จะสร้างความก้าวหน้าในวงการเอไอแบบเปิดกว้าง
การเปิดตัว Marco-o1 ครั้งนี้ยังสอดคล้องกับความเคลื่อนไหวของบริษัทเอไอจีนรายอื่นอย่าง บริษัท DeepSeek เปิดตัวโมเดล DeepSeek-R1-Lite-Preview ที่มีความสามารถใกล้เคียงกับ o1 ของ OpenAI โดยเฉพาะในการทำโจทย์คณิตศาสตร์ระดับสูงและการใช้เหตุผลเชิงตรรกะ สะท้อนให้เห็นว่า วงการเอไอในจีนกำลังพัฒนากันอย่างเข้มข้นที่จะแข่งขันกับบริษัทชั้นนำจากตะวันตก