Apple เปิดตัวโมเดลภาษา OpenELM บอกใบ้การมาถึงของ AI บนไอโฟน
แอปเปิล (Apple) เปิดตัว OpenELM ชุดโมเดลภาษาขนาดเล็กแบบโอเพนซอร์ส สามารถรันบนอุปกรณ์โดยไม่ต้องพึ่งพาคลาวด์เซิร์ฟเวอร์
แอปเปิล (Apple) เป็นบริษัทเทคโนโลยีที่หลายองค์กรต่างจับตามองทิศทางการพัฒนาเอไอ แม้ว่าแอปเปิลยังคงไม่เปิดเผยแผนพัฒนาเจนเอไอที่ใช้งานเชิงพาณิชย์เหมือนกับคู่แข่ง แต่การเปิดตัวโมเดลเอไอชุดใหม่อย่าง OpenELM กำลังแสดงให้เห็นว่า เป้าหมายของบริษัทคือการมุ่งเน้นไปที่ การนำเอไอมารันบนอุปกรณ์
เมื่อวันที่ 24 เม.ย. 2567 นักวิจัยจากแอปเปิลเผยแพร่ OpenELM (Open-source Efficient Language Models) ชุดโมเดลเอไอภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์ส ที่สามารถทำงานบนอุปกรณ์โดยไม่ต้องเชื่อมต่อกับคลาวด์เซิร์ฟเวอร์
OpenELM มี 4 ขนาด ได้แก่ 270 ล้านพารามิเตอร์, 450 ล้านพารามิเตอร์, 1.1 พันล้านพารามิเตอร์ และ 3 พันล้านพารามิเตอร์ (พารามิเตอร์ คือตัวแปรที่โมเดลเรียนรู้และใช้ในการตัดสินใจจากชุดข้อมูลที่เทรน)
ตัวอย่างเช่น โมเดล Phi-3 ที่ไมโครซอฟท์เพิ่งเปิดตัวมีขนาด 3.8 พันล้านพารามิเตอร์ ขณะที่รุ่น 2 พันล้านพารามิเตอร์ของ Google Gemma โมเดลเหล่านี้ใช้พลังงานน้อยกว่า และเหมาะสำหรับการทำงานบนอุปกรณ์เคลื่อนที่ขนาดเล็ก เช่น สมาร์ทโฟนและแล็ปท็อป
งานวิจัยยังบอกว่า OpenELM ใช้วิธีจัดสรรพารามิเตอร์ในแต่ละเลเยอร์โมเดลเพื่อเพิ่มความแม่นยำ ผลลัพธ์ที่ได้คือ โมเดลทำงานแม่นยำขึ้น 2.36% เมื่อเทียบกับ OLMo แต่ใช้โทเค็นที่ยังไม่ถูกเทรนน้อยกว่าสองเท่า
กล่าวโดยสรุป จุดเด่นของ OpenELM คือ มีขนาดเล็ก ประหยัดพลังงาน ใช้ทรัพยากร CPU และแรมน้อย เหมาะกับการใช้งานบนอุปกรณ์พกพา การเปิดเป็นโอเพนซอร์สทำให้นักพัฒนาสามารถนำไปใช้งานและปรับแต่งได้ฟรี รันโมเดลบนอุปกรณ์โดยไม่ต้องเชื่อมต่อกับคลาวด์เซิร์ฟเวอร์
โมเดลตัวนี้จะช่วยเพิ่มศักยภาพของการทำงาน เช่น การเขียนอีเมล สรุปข้อความ เขียนบทความ ช่วยเขียนอีเมล แปลภาษา วิเคราะห์ข้อมูล หรือสามารถนำไปใช้งานด้านบันเทิง สร้างสรรค์ผลงานได้อีกด้วย
อ้างอิง: theverge venturebeat