เลือกโมเดล Gen-AI ให้เหมาะกับงาน แนวทางสำหรับยุคเอไอก้าวกระโดด

เลือกโมเดล Gen-AI ให้เหมาะกับงาน แนวทางสำหรับยุคเอไอก้าวกระโดด

วันนี้เราคิดว่าโมเดลเอไอนี้ล้ำสมัยและเก่งสุดแล้ว แต่อีกเพียงไม่กี่สัปดาห์ก็มีโมเดลใหม่ที่ล้ำกว่าและทรงพลังยิ่งกว่าเดิมถูกปล่อยออกมาเสมอ

ในช่วงสองปีที่ผ่านมา โมเดล Generative AI (Gen-AI) ต่างๆ มีการเปลี่ยนแปลงอย่างรวดเร็ว โดยในช่วงแรกก่อนที่บริษัทเทคโนโลยีรายใหญ่ (Big Tech) จะพัฒนาโมเดลเอไอใหม่ๆ ขึ้นมา เพื่อให้แซงหน้าคู่แข่งได้นั้น เรามักจะเห็นระยะห่างอย่างน้อย 5-6 เดือน แต่ช่วงหลังๆ มานี้เราเริ่มเห็นโมเดลใหม่ๆ ที่เด่นกว่าเดิมแข่งกันออกมาแทบจะเป็นรายสัปดาห์ก็ว่าได้

ดังนั้นหากวันนี้เราคิดว่าโมเดลเอไอนี้ล้ำสมัยและเก่งสุดแล้ว แต่อีกเพียงไม่กี่สัปดาห์ก็มีโมเดลใหม่ที่ล้ำกว่าและทรงพลังยิ่งกว่าเดิมถูกปล่อยออกมาเสมอ โดยเฉพาะในวงการ Big Tech ที่บริษัทยักษ์ใหญ่อย่าง OpenAI, Google, Anthropic และ xAI ต่างแข่งขันกันพัฒนาโมเดลใหม่ๆ เพื่อช่วงชิงความเป็นผู้นำด้าน Generative AI กันอย่างดุเดือด

การแข่งขันนี้เห็นได้ชัดเจนจากช่วงเวลาในการเปิดตัวโมเดลที่รวดเร็วขึ้นเรื่อยๆ จากเดิมที่โมเดล GPT 3.5 เปิดตัวเมื่อปลายปี 2022 และกว่าจะมีโมเดลที่เด่นกว่าอย่าง GPT 4 ออกมาก็เกือบกลางปี 2023 แต่ตั้งแต่ต้นปีมานี้บริษัท Big Tech ต่างๆ ก็เปิดโมเดลที่ล้ำหน้าอย่าง GPT o3-mini, Claude 3.7, Gemini 2.0, Grok 3 และ DeepSeek R1 ออกมาอย่างต่อเนื่อง ซึ่งแสดงให้เห็นว่าแต่ละค่ายพยายามเร่งพัฒนาศักยภาพของโมเดลเอไอเพื่อแซงหน้าคู่แข่งอย่างรวดเร็ว

ที่น่าสนใจคือ มีการพัฒนาโมเดลที่เป็น Reasoning AI อย่าง GPT o1 และ DeepSeek R1 ที่ถูกออกแบบเฉพาะเพื่อเน้นความสามารถด้านการคิดเชิงเหตุผลอย่างเป็นขั้นตอน ซึ่งมีสถาปัตยกรรมพิเศษที่ช่วยในการวิเคราะห์และแก้ปัญหาที่ซับซ้อน เช่น โจทย์คณิตศาสตร์ วิทยาศาสตร์ และการเขียนโปรแกรมยากๆ ได้ดี ซึ่งจะแตกต่างจากโมเดลทั่วไปที่มีความสามารถหลากหลาย และมีคลังข้อมูลความรู้มากมาย มุ่งเน้นการตอบสนองทั่วไปมากกว่าการแก้ปัญหาที่ต้องใช้การคิดวิเคราะห์ขั้นสูง จึงยิ่งทำให้โมเดลเอไอเก่งขึ้นไปอีกขั้นหนึ่ง

จากผลการประเมินเปรียบเทียบความสามารถของโมเดลด้านภาษาขนาดใหญ่ (LLM) ในปีล่าสุด จะเห็นว่าโมเดล Reasoning AI เช่น GPT o3, GPT o3-mini (high), Grok 3 Reasoning Beta และ DeepSeek R1 มีคะแนนสูงสุดในกลุ่ม โดยเฉพาะ GPT o3 ที่มีคะแนนนำ ขณะที่โมเดลทั่วไปอย่าง GPT-4.5, Gemini 2.0 Pro Experimental และ Claude 3.7 Sonnet ยังคงมีคะแนนรองลงมา แต่ก็ยังมีบทบาทสำคัญในแง่ของการนำเสนอข้อมูลที่ถูกต้อง และความคล่องตัวในการใช้งานทั่วไป

จากการเปลี่ยนแปลงที่รวดเร็วเช่นนี้ เราจึงเห็นได้ว่าไม่มีใครสามารถรักษาตำแหน่งผู้ชนะได้อย่างถาวร เพราะเมื่อใดที่มีโมเดลตัวใหม่ที่ทำงานได้ดีขึ้น แม่นยำมากขึ้น หรือแม้กระทั่งเร็วขึ้น คู่แข่งก็พร้อมที่จะออกโมเดลที่เหนือกว่าในระยะเวลาเพียงไม่กี่เดือนเท่านั้น

ด้วยเหตุนี้ ผู้ใช้งานอย่างชาญฉลาด จึงจำเป็นต้องเลือกใช้โมเดล Gen-AI ด้วยความระมัดระวัง ไม่ควรยึดติดหรือพึ่งพาโมเดลใดโมเดลหนึ่งจนเกินไป เนื่องจากสถานการณ์ยังไม่ถึงขั้นที่เราจะสรุปได้ว่าโมเดลไหนจะดีที่สุดหรือเหมาะสมที่สุดในระยะยาว

ด้วยเหตุนี้ ผู้ใช้งานอย่างชาญฉลาด จึงจำเป็นต้องเลือกใช้โมเดล Gen-AI ด้วยความระมัดระวัง ไม่ควรยึดติดหรือพึ่งพาโมเดลใดโมเดลหนึ่งจนเกินไป เนื่องจากสถานการณ์ยังไม่ถึงขั้นที่เราจะสรุปได้ว่าโมเดลไหนจะดีที่สุดหรือเหมาะสมที่สุดในระยะยาว

ดังนั้น เมื่อมีโมเดลที่หลากหลาย เราก็ควรจะเลือกใช้ให้เหมาะกับงาน และต้องคำนึงเสมอว่าไม่มีโมเดลใดที่จะตอบโจทย์ในทุกเรื่องได้ สำหรับ ณ วันนี้ ถ้าเราจะต้องเลือกใช้โมเดล LLM ล่าสุดอาจสรุปได้คร่าวๆ ดังนี้  สำหรับใครที่กำลังมองหาโมเดลที่ช่วยในงานเขียนเอกสาร ไม่ว่าจะเป็นบทความ รายงาน หรือแม้แต่การสอบถามขอความเห็นต่างๆ โมเดลที่โดดเด่นที่สุด ก็คือ GPT 4o และ Claude 3.7 ทั้งสองโมเดลนี้มีจุดเด่นในด้านความสามารถทางภาษา การสร้างเนื้อหาที่มีคุณภาพ และเข้าใจบริบทได้ดี ช่วยให้การเขียนเป็นเรื่องง่ายขึ้นอย่างมาก

แต่หากเราต้องทำงานด้านการพัฒนาโปรแกรม ตัวเลือกที่ดีที่สุดคือ Claude 3.7 เนื่องจากโมเดลนี้ได้รับการปรับแต่งมาเป็นพิเศษเพื่อเข้าใจและสร้างโค้ดได้อย่างมีประสิทธิภาพ ช่วยลดเวลาการเขียนโปรแกรมได้อย่างมีนัยสำคัญ

สำหรับงานที่มีความซับซ้อนมากขึ้น เช่น การแก้โจทย์คณิตศาสตร์ หรือวิทยาศาสตร์ โมเดลที่เราควรเรียกใช้งานคือกลุ่ม Reasoning AI ที่มีความสามารถในการคิดเชิงลึกได้ดี โดยตัวเลือกที่โดดเด่นในเวลานี้ ได้แก่ GPT o3-mini-high, Claude 3.7 Extended Thinking, DeepSeek R1 หรือ Grok 3 Think กลุ่มนี้เหมาะอย่างยิ่งสำหรับงานที่ต้องการการคำนวณหรือเหตุผลที่ซับซ้อน เพราะสามารถให้ผลลัพธ์ที่แม่นยำและมีเหตุผล

ถึงตรงนี้หลายคนอาจสงสัยว่า แล้วโมเดล GPT กับ โปรแกรม ChatGPT คือตัวเดียวกันไหม คงต้องอธิบายอย่างนี้ว่า ChatGPT เป็นส่วนติดต่อผู้ใช้ (user interface) ที่บริษัท OpenAI พัฒนาให้คนทั่วไปสามารถใช้โมเดล GPT ได้ง่ายผ่านเว็บหรือแอป ที่ให้บริการสนทนากับผู้ใช้ โดยผู้ใช้จะสามารถเรียกโมเดล GPT ได้หลากหลายทั้ง GPT 4.5, GPT 4o หรือ GPT o3-mini ทั้งนี้โปรแกรม ChatGPT จะมีฟีเจอร์เพิ่มเติมเพื่อเพิ่มความสามารถให้หลากหลายขึ้น เช่น plugin การค้นหาเว็บ การอัปโหลดไฟล์ และการสร้างรูปภาพ เป็นต้น

ทั้งนี้ในปัจจุบันจะมีโปรแกรมมากมายที่สามารถให้เราเลือกใช้ในการเรียกโมเดล Gen-AI ต่างๆ ได้ บางโปรแกรมก็อาจมีชื่อเดียวกับโมเดล เช่น Claude หรือ Gemini บางโปรแกรมก็ถูกสร้างมาเฉพาะงาน และสามารถเรียกโมเดลได้หลากหลาย เช่น Perplexity ใช้ในการค้นหาข้อมูลก็เรียกได้ทั้งโมเดล Deepseek R1, GPT o3-mini และ Claude 3.7

แม้จะมีโปรแกรมเอไอตัวเลือกมากมายทั้ง ChatGPT, Claude, Gemini, DeepSeek, Grok และ Gwen Chat ที่แต่ละแพลตฟอร์มต่างมีจุดแข็งที่แตกต่างกัน แต่ ChatGPT ยังคงโดดเด่นที่สุดด้วยระบบนิเวศที่สมบูรณ์ ความเป็นที่รู้จักอย่างกว้างขวาง และความสามารถในการประยุกต์ใช้งานที่หลากหลาย ทำให้กลายเป็นมาตรฐานอุตสาหกรรมที่เครื่องมือเอไออื่นๆ มักถูกนำมาเปรียบเทียบด้วย แต่เราก็ควรพิจารณาเลือกใช้โปรแกรมให้เหมาะสมกับงาน เพราะแต่ละโปรแกรมก็จะสามารถเลือกใช้โมเดลได้จำกัด และบางโปรแกรมก็อาจมีค่าใช้จ่ายที่สูง

สำหรับด้านการค้นข้อมูลเป็นเรื่องที่หลายคนยังเข้าใจผิดคิดว่าโปรแกรมอย่าง ChatGPT ถูกออกแบบมาเพื่อมาสืบหาข้อมูลเหมือน Google Search และจะแทนที่ Google ได้ แท้จริงโมเดล LLM เหล่านั้น จะถูกสร้างมาเพื่องานสร้างเนื้อหา (ถึงเรียกว่า Generative AI) และจะมีจินตนาการสร้างสรรค์เนื้อหาค่อนข้างมาก จึงไม่แปลกที่จะได้คำตอบที่ผิด

ดังนั้น ChatGPT จึงไม่ได้เอามาแทน Google Search แต่เหมาะกับงานเขียน งานสรุปเอกสาร งานวิเคราะห์ งานระดมความคิด งานเขียนโปรแกรม งานแปล หรือสอบถามความเห็นต่างๆ และอาจมีความผิดพลาดได้ 

แต่ถ้าจะใช้โปรแกรม LLM ในการค้นข้อมูล ด้วยการถามด้วยภาษาธรรมชาติ อาจต้องนึกถึงโปรแกรมอย่าง Perplexity ซึ่งสามารถจะไปค้นข้อมูลจากแหล่งต่างๆ มา แล้วจะทำการวิเคราะห์และเขียนสรุปผลการค้นหาออกมาพร้อมทั้งมีการอ้างอิงถึงแหล่งข้อมูล ซึ่งโมเดลอย่าง Perplexity ได้รับการปรับแต่งมาเพื่อความแม่นยำและสามารถเข้าถึงข้อมูลที่อัปเดตล่าสุดและให้ข้อมูลเชิงลึกได้ดียิ่งขึ้น แต่ถ้าต้องการค้นข้อมูลเกี่ยวข้องกับการวิจัยหรือวิเคราะห์ข้อมูลเชิงลึกเป็นหลัก โมเดลในกลุ่ม Deep Research อย่าง Perplexity Deep Research และ ChatGPT Deep Research จะเหมาะสมที่สุด เพราะออกแบบมาเพื่อให้ข้อมูลที่ลึกซึ้ง มีความละเอียดและครอบคลุมมากกว่าการใช้งานทั่วไป

เทคโนโลยี Gen-AI ยังเปลี่ยนแปลงไปอีกมากและจะมีโมเดลหรือเครื่องมือใหม่ที่เกิดขึ้นตลอดเวลา คำแนะนำที่ดีที่สุดคือ การรักษาความยืดหยุ่นและเปิดใจยอมรับเครื่องมือหรือโมเดลใหม่ๆ อยู่เสมอ อย่าทุ่มลงทุนหรือยึดติดกับตัวใดตัวหนึ่งจนเกินไป เพราะสุดท้ายแล้ว  สิ่งที่สำคัญที่สุดคือ การเลือกใช้เครื่องมือให้ตรงกับงาน และพร้อมปรับตัวให้ทันต่อการเปลี่ยนแปลงอยู่เสมอ