DeepSeek : สปุตนิกยุคเอไอจีน สะเทือนวงการเทคโนโลยีโลก

DeepSeek : สปุตนิกยุคเอไอจีน สะเทือนวงการเทคโนโลยีโลก

ต้นสัปดาห์นี้มีการเปิดตัว DeepSeek ซึ่งเป็นโมเดลเอไอจากบริษัทสตาร์ตอัปของจีน แซงหน้าโมเดลเอไอชั้นนำอย่าง ChatGPT, Gemini หรือ Claude ของบริษัทเทคโนโลยีรายใหญ่ในสหรัฐอเมริกา

ต้นสัปดาห์นี้มีการเปิดตัว DeepSeek ซึ่งเป็นโมเดลเอไอจากบริษัทสตาร์ตอัปของจีน แซงหน้าโมเดลเอไอชั้นนำอย่าง ChatGPT, Gemini หรือ Claude ของบริษัทเทคโนโลยีรายใหญ่ในสหรัฐอเมริกา

การเข้ามาของ DeepSeek สั่นคลอนตลาดเทคโนโลยีโลก และทำให้หุ้นบริษัทเทคโนโลยีหลายบริษัทในสหรัฐอเมริกาตกลงไปอย่างแรง ซึ่งประธานาธิบดีโดนัลด์ ทรัมป์ ระบุว่าการมาของ DeepSeek ควรเป็น “เสียงเตือน” (Wake-up call) สำหรับอุตสาหกรรมเอไอ ของสหรัฐอเมริกา โดยย้ำถึงความจำเป็นที่บริษัทเทคโนโลยีสหรัฐฯ ต้องมุ่งมั่นในการแข่งขัน เพื่อรักษาความเป็นผู้นำด้านเอไอ

การเปิดตัวของ DeepSeek อาจเปรียบเทียบได้กับวิกฤติการณ์สปุตนิกที่สหภาพโซเวียตส่งดาวเทียม Sputnik 1 ขึ้นสู่วงโคจรโลกในวันที่ 4 ตุลาคม ค.ศ.1957 เป็นเวลาสามสัปดาห์ก่อนที่แบตเตอรีจะเสียและตกลงสู่ชั้นบรรยากาศในอีกสองเดือนต่อมา ความสำเร็จของสหภาพโซเวียตสร้างความแปลกใจนี้ และตื่นตระหนกในหมู่ชาวอเมริกัน ทำให้เกิดการแข่งขันด้านอวกาศเป็นส่วนหนึ่งของสงครามเย็น การเปิดตัวนี้นำมาซึ่งการพัฒนาด้านการเมือง การทหาร เทคโนโลยี และวิทยาศาสตร์ใหม่ๆ

มีการกล่าวว่า “เอไอเป็นการแข่งขันด้านอวกาศในยุคใหม่” ชาติที่ชนะด้านเอไอ ไม่เป็นเพียงแต่จะเป็นผู้นำทางด้านเทคโนโลยี แต่เอไอถูกนำมาประยุกต์ใช้ในด้านต่างๆ มากมาย ทำให้สามารถควบคุมอุตสาหกรรม และเศรษฐกิจของโลกได้ รวมไปถึงด้านการทหาร เพราะเทคโนโลยีเอไอถูกนำมาใช้ด้านนี้อย่างมากเช่นกัน ดังนั้น ชาติที่เป็นเจ้าของโมเดลเอไอขนาดใหญ่ จะได้เปรียบทางด้านนี้ รวมถึงการควบคุมข้อมูลขนาดใหญ่ที่ต้องนำไปใช้ประมวลผลเอไอ

การพัฒนาโมเดลเอไอขนาดใหญ่ มีปัจจัยที่สำคัญสามอย่าง คือ ต้องมีข้อมูลขนาดใหญ่ ต้องมีอัลกอริทึมที่ซับซ้อน และต้องมีระบบประมวลผลมหาศาลในการฝึกฝนและปรับแต่งโมเดล การพัฒนาอัลกอริทึมเอไอ ต้องการนักวิทยาศาสตร์และนักวิจัยที่เก่ง ซึ่งปัจจุบันสหรัฐอเมริกาเป็นที่ตั้งของบุคลากรด้านเอไอส่วนใหญ่ของโลก ซึ่งรวมถึงนักวิทยาศาสตร์ วิศวกร และนักวิจัยในสาขานี้

นอกจากนี้ สหรัฐฯ ยังเป็นศูนย์กลางที่ดึงดูดผู้มีความสามารถที่ยอดเยี่ยมจากประเทศอื่นๆ ตัวอย่างเช่น สหรัฐฯ มีนักวิทยาศาสตร์เอไอที่มีประสบการณ์ขั้นสูงคิดเป็น 27% ของจำนวนทั้งหมดทั่วโลก

ส่วนระบบประมวลผลก็ต้องการเซมิคอนดักเตอร์ประมวลผลที่เรียกว่า หน่วยประมวลผลกราฟิก (GPU) จำนวนมาก ยิ่งโมเดลเอไอมีขนาดใหญ่และซับซ้อนมากขึ้นเท่าไหร่ ก็ยิ่งต้องการ GPU ที่ทรงพลังมากขึ้นเท่านั้น และการจะผลิตเซมิคอนดักเตอร์ออกมาจะมีห่วงโซ่อุปทานที่ซับซ้อนและกระบวนการบางช่วง ซึ่งสิ่งนี้ขึ้นอยู่กับบริษัทเพียงไม่กี่ราย

การเข้าถึงเทคโนโลยีเซมิคอนดักเตอร์ขั้นสูงจึงกลายเป็นประเด็นสำคัญในการแข่งขันทางภูมิรัฐศาสตร์ แม้ว่าจีนจะเป็นหนึ่งในประเทศผู้นำทางด้านเอไอของโลก แต่จีนยังคงต้องพึ่งพาการนำเข้าเซมิคอนดักเตอร์จำนวนมาก และต้องเผชิญกับสงครามทางการค้าที่ทางสหรัฐอเมริกากีดกันการนำเข้าเซมิคอนดักเตอร์ขั้นสูงโดยเฉพาะ GPU ขั้นสูงจากบริษัท Nvidia โดยเฉพาะ GPU รุ่น A100

เมื่อปีที่แล้วมีรายงานเรื่อง Global AI Index 2024 ที่จัดทำโดย Tortoise Media เพื่อจัดอันดับประเทศต่างๆ ทั่วโลกเรื่องความก้าวหน้าเทคโนโลยีเอไอ ผลจัดอันดับ ระบุว่า สหรัฐฯ ยังครองผู้นำด้านเอไอโลก ทิ้งห่างจีนซึ่งอยู่ในอันดับ 2 มากขึ้นกว่าปีก่อนหน้านั้น โดยได้คะแนนเต็ม 100 คะแนน

ส่วนจีนได้ 54 คะแนน ทั้งสองประเทศนี้นำหน้าประเทศอื่นๆ อย่างมีนัยสำคัญ มีสิงคโปร์อันดับ 3 คะแนนตามห่างๆ ที่ 34 คะแนน ส่วนสหราชอาณาจักร อันดับ 4 และฝรั่งเศส อันดับ 5 เพราะมีผลงานพัฒนาโมเดลภาษาขนาดใหญ่ และมีการลงทุนในภาครัฐและการประมวลผลที่ค่อนข้างสูง

จากข้อมูลต่างๆ ทำให้ผู้เชี่ยวชาญจำนวนมากเชื่อว่า จีนยังตามหลังสหรัฐอเมริกาเรื่องเทคโนโลยีเอไออย่างน้อยอีก 3-5 ปี และอุตสาหกรรมเอไอยังถูกควบคุมโดยบริษัทเทคโนโลยีรายใหญ่ในสหรัฐ ที่มีโมเดลเอไอชั้นนำอย่าง ChatGPT และ Gemini ซึ่งโมเดลเอไอน่าจะถูกผูกขาดโดยผู้ผลิตโมเดลเหล่านี้ แม้จะมีโมเดลเปิดเผยโค้ด (Open source) ขนาดใหญ่ที่สามารถใช้ได้ฟรีอย่าง Llama ของบริษัท Meta และ Mistral ของบริษัทในฝรั่งเศส

แต่การใช้โมเดลต่างๆ เหล่านี้ยังต้องพึ่งพาชิปประมวลผลชั้นนำที่ถูกควบคุมโดย บริษัท Nvidia ของสหรัฐอเมริกา จึงแทบเป็นไปไม่ได้เลยที่จีนจะสามารถตามได้ทันในเวลาอันสั้น

อดีต CEO ของ Google อย่าง Eric Schmidt ถึงกับยอมรับว่า “ผมเคยคิดว่าเราอยู่เหนือกว่าจีนหลายปี แต่จีนได้ไล่ตามทันในช่วง 6 เดือนที่ผ่านมาอย่างน่าทึ่ง” ความสำเร็จของ DeepSeek ไม่เพียงท้าทายความเป็นผู้นำบริษัทอย่าง OpenAI, Google และ Meta เท่านั้น แต่ยังสะท้อนให้เห็นถึงข้อจำกัดของการใช้เงินทุนมหาศาลในการพัฒนาเอไอ

การเปิดตัวของ DeepSeek ที่มีผลต่อวงการเอไอ คงไม่ใช่แค่ว่าโมเดลนี้จะเก่งกว่าโมเดลอื่นอย่างไร เพราะแต่ละตัวมีจุดเด่นจุดด้อยต่างกัน ที่น่าสนใจ คือ บริษัทสตาร์ตอัปจีนรายนี้ ทำโมเดลนี้ได้อย่างไร ใช้ข้อมูลขนาดใหญ่จากที่ไหน ใช้อัลกอริทึมในการประมวลผลอย่างไร และที่สำคัญคือใช้ GPU ในการประมวลผลอย่างไรในเมื่อประเทศจีนถูกกีดกันการนำเข้า GPU ชั้นนำอย่าง A100 โดย โมเดล DeepSeek ใช้เงินลงทุนเพียง 5.6 ล้านดอลลาร์ เทียบกับคู่แข่งอย่าง GPT-4 ที่ใช้งบประมาณถึง 80-100 ล้านดอลลาร์

แม้จะมีการระบุว่า DeepSeek ใช้ GPU รุ่น H800 รุ่นที่มีประสิทธิภาพการประมวลผลรองลงมา แต่มีอัลกอริทึมในการจัดการทรัพยากรในการประมวลผลได้มีประสิทธิภาพ ทำให้ต้นทุนประมวลผลต่ำลง แต่มีการโต้แย้งมาว่า การใช้งบประมาณและทรัพยากรน้อยนั้น อาจไม่ใช่การเปรียบเทียบที่ยุติธรรม เนื่องจาก DeepSeek ใช้โมเดลเผยโค้ดแบบ open-source จาก Meta และ Alibaba มาต่อยอด โดยไม่ได้นับรวมต้นทุนการพัฒนาโมเดลพื้นฐานเหล่านั้น ต่างจาก OpenAI ที่พัฒนาโมเดลตั้งแต่เริ่มต้น นอกจากนั้น ยังมีข้อถกเถียงกันว่า DeepSeek ได้สร้างนวัตกรรมเองทั้งหมดหรือเป็นการลอกเลียนแบบจากโมเดลของบริษัทในสหรัฐอเมริกา

ที่สำคัญยิ่งความสำเร็จของ DeepSeek ยังมีข้อน่าสงสัยหลายเรื่อง เนื่องจากมีข้อมูลน้อยมากเกี่ยวกับทั้งเรื่องห้องปฏิบัติการ ผู้ก่อตั้งอย่าง Liang Wenfeng ทีมงาน ระบบประมวลผล และข้อมูล ต่างจากบริษัทเอไอในสหรัฐฯ ที่มีการเปิดเผยรายละเอียดอย่างชัดเจน ซึ่งเป็นไปตามหลักพัฒนาโมเดลเอไอที่ต้องการความโปร่งใสและมีความรับผิดชอบ ดังนั้นการใช้โมเดล DeepSeek อาจสร้างความกังวลกับผู้ใช้งานเรื่องความปลอดภัยของข้อมูล และความเสี่ยงที่ไม่ทราบว่าอัลกอริทึมพัฒนามาอย่างไร

การมาของ DeepSeek ไม่น่าจะทำให้จีนสามารถแซงหน้าสหรัฐอเมริกาได้โดยเร็ว เพราะหากจีนต้องการแสดงความก้าวหน้าด้านเอไออย่างแท้จริง ควรนำเสนอนวัตกรรมที่สร้างใหม่ แทนที่จะเป็นเพียงการปรับปรุงเล็กน้อยจากสิ่งที่สหรัฐฯ ได้พัฒนาไว้แล้ว ดังนั้น ความสำเร็จของ DeepSeek จึงอาจเป็นเพียงการพัฒนาต่อยอดมากกว่าการปฏิวัติวงการเอไออย่างที่หลายคนเข้าใจ

แต่ DeepSeek น่าทำให้วงการเอไอสั่นสะเทือนในเรื่องราคาพอควร เพราะโมเดล DeepSeek R1 ที่สามารถคิดได้อย่างมีเหตุผล ถูกเปิดให้ใช้ฟรี เมื่อเทียบกับโมเดลอย่าง ChatGPT o1 ที่ผู้ใช้ต้องเสียค่าใช้จ่ายรายเดือน นอกจากนี้นักพัฒนาสามารถเรียกใช้โมเดล DeepSeek ได้ถูกกว่าโมเดลของบริษัทเทคโนโลยีรายใหญ่ในอเมริกาถึง 20 เท่า และการที่ DeepSeek เลือกเปิดเผยโค้ดแบบ open-source ยิ่งสร้างผลกระทบต่อวงการเอไออย่างมาก เพราะทำให้นักพัฒนารายย่อยสามารถต่อยอดเทคโนโลยีได้ง่ายขึ้น

ปรากฏการณ์ DeepSeek กำลังบ่งชี้ถึงการเปลี่ยนแปลงครั้งสำคัญในวงการเอไอโลก จากยุคที่เน้นการลงทุนมหาศาลในการฝึกฝนโมเดล สู่ยุคที่ให้ความสำคัญกับประสิทธิภาพและนวัตกรรม สิ่งนี้อาจนำไปสู่การเปลี่ยนแปลงในโมเดลธุรกิจของบริษัทเอไอทั่วโลก โดยเฉพาะเรื่องของราคา และการผูกขาด GPU ที่ทำให้ต้นทุนการพัฒนาเอไอสูง และอาจส่งผลกระทบต่อดุลอำนาจในโลกเทคโนโลยีในอนาคตอันใกล้