'วิศวกรข้อมูล' แชร์เคล็ดวิชาสะกิดใจซีอีโอก่อนกระโจนหา บิ๊กดาต้า

'วิศวกรข้อมูล' แชร์เคล็ดวิชาสะกิดใจซีอีโอก่อนกระโจนหา บิ๊กดาต้า

สรุปย่อจากการบรรยายของนักวิชาการนิด้าในงาน Metalex2019 ที่ออกโรง “แตะเบรก” องค์กรทั้งรัฐและเอกชนที่กำลังจะลงทุน “ขับเคลื่อนองค์กรด้วยข้อมูล” ชี้ระหว่างทางเต็มไปด้วยขวากหนาม ต้องอาศัยทั้งเงินทุนก้อนใหญ่ ความตั้งใจมุ่งมั่นและความฉลาด

หลายองค์กรในไทยทั้งไซส์เล็กและไซส์ใหญ่กำลังตื่นตัวที่จะปรับเปลี่ยนหรือผลักดันองค์กร ให้ไปสู่จุดที่ขับเคลื่อนด้วยข้อมูล (Data Driven Organization) โดยการใช้ประโยชน์จาก “บิ๊กดาต้า” ที่ได้จัดเก็บไว้เป็นจำนวนมากและยังไม่ได้นำออกมาใช้ จึงแสวงหา “เครื่องมือ” มาช่วยจัดการและหาประโยชน์จากข้อมูลเหล่านั้น

แบรนด์เสื้อผ้า ZARA เป็นตัวอย่างที่เห็นได้ชัดเจนถึงความสำเร็จระดับโลกขององค์กรที่ขับเคลื่อนด้วยข้อมูล ที่ ผศ.วรพล พงษ์เพ็ชร อาจารย์ประจำหลักสูตรการวิเคราะห์ธุรกิจและวิทยาการข้อมูล คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์ (นิด้า) หยิบยกมาเสนอ โดยระบุว่า แม้ว่าแบรนด์นี้จะมีมายาวนานแต่เพิ่งดังระดับโลกเมื่อ 5-7 ก่อนนี้เอง

157460721969

กลยุทธ์ที่ใช้คือ การวิเคราะห์ข้อมูลสินค้าที่ตกค้างในร้าน เชื่อมโยงกับพฤติกรรมลูกค้าในร้าน แล้วก็พบว่า แฟชั่นที่สาวเอเชียเมินกลับเป็นที่ต้องการของสาวอเมริกา ทางแบรนด์จึงแจ้งให้ทีมผลิตในโซนอเมริกาทำการผลิตตามข้อมูลที่วิเคราะห์ได้ อีกทั้งใช้โมเดลการสำรวจข้อมูลนี้กับภูมิภาคอื่นๆ จึงทำให้แบรนด์ขยับขึ้นมาครองใจหนุ่มสาวทั่วโลกได้สำเร็จ

“ส่วนองค์กรในไทย แม้จะมีจำนวนมากที่ใช้ประโยชน์จากบิ๊กดาต้าแต่ที่ทำสำเร็จตามเป้าหมายมีไม่ถึง 10 ราย เหตุเพราะขาดความรู้และเข้าใจที่แท้จริงในเทคโนโลยีนี้ รวมถึงคาดไม่ถึงว่าจะต้องใช้งบลงทุนมหาศาล” ผศ.วรพล กล่าวบรรยายในงาน “METALEX2019 : AI FORUM 2019” เป็นไกด์ไลน์ให้องค์กรตระหนักรู้ก่อนที่จะกระโดดเข้าสู่โลกข้อมูล

157460739573
ผศ.วรพล พงษ์เพ็ชร ผู้เชี่ยวชาญด้าน Data Mining, Big Data Management และ Social Network Analysis ได้สรุปย่อบทเรียนจากวิชา Big Data Analysis ในหลักสูตรปริญญาโท Business Analytics and Data Science (BADS) รายแรกของประเทศ ขณะนี้เป็นปีที่ 3 จำกัดจำนวนรับปีละ 40 คนจากผู้สมัคร 280 คนเมื่อปีล่าสุด และในปี 2563 นิด้าจะเปิดหลักสูตรใหม่ด้าน Supply Chain Analysis เตรียมพร้อมบุคลากรสำหรับช่วยยกระดับพลิกโฉมอุตสาหกรรมโลจิสติกส์ในอนาคต

เริ่มด้วย เงินลงทุน การที่จะปรับองค์กรหรือการที่จะผลักดันองค์กรให้ไปสู่จุดที่เป็นองค์กรที่ขับเคลื่อนด้วยข้อมูลนั้น มีค่าใช้จ่ายสูงมากและยิ่งองค์กรที่มีขนาดใหญ่ก็จะมีค่าใช้จ่ายยิ่งสูงขึ้น จากประสบการณ์การทำงานพบตัวเลขถึง 70 ล้านบาทสำหรับการจัดทำระบบจัดเก็บข้อมูล ยังไม่รวมค่าวิเคราะห์ข้อมูลอีก 50 ล้านบาทและค่าจ้างนักวิทยาศาสตร์ข้อมูลหรือวิศวกรข้อมูลอีกต่างหาก

องค์กรจึงต้องวางแผนแล้วดำเนินงานทีละสเต็ป โดยขั้นตอนการศึกษาเพื่อวางแผนนี้ควรจะใช้บริการหน่วยงานวิชาการอย่างมหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี (มจธ.) หรือ นิด้า และหลีกเลี่ยงที่จะใช้บริการ vendors ซึ่งไม่มีหน้าที่ในขั้นตอนนี้ 
นอกจากนี้ การทำบิ๊กดาต้าจำเป็นต้องใช้ “ไอที โนว์ฮาว” องค์ความรู้ด้านไอทีที่มีความหลากหลาย ซึ่งเป็นบุคลากรสาขาที่ขาดแคลนในไทย โดยทั่วไปหากขั้นตอนแรกใช้บริการของ vendors ก็จะนำเข้าผู้เชี่ยวชาญจากสิงคโปร์และอินเดีย หมายถึงต้นทุนค่าใช้จ่ายที่เพิ่มขึ้นขององค์กร

157460725054

“การวางแผนที่มีประสิทธิภาพแล้วดำเนินการทีละขั้นตอนตามแผน จะทำให้รู้ว่า เทคโนโลยีอะไรบ้างที่จำเป็นต้องลงทุนซื้อ และควรจะซื้อก็ต่อเมื่อพิจารณาแล้วว่าจำเป็นเท่านั้น และหากเป็นไปได้ควรที่จะสร้างบุคลากรด้านดาต้าซายน์ขององค์กรเอง หรือต้องมีบุคลากรที่มีความรู้ความเข้าใจด้านนี้  เพื่อลดการพึ่งพาหรือผูกความหวังทุกอย่างไว้กับ vendors เพียงรายเดียว”

ขณะเดียวกันจะต้องมี “บิสซิเนส โนว์ฮาว” หมายความว่า ผู้ประกอบการต้องทำความรู้จักข้อมูลของตนเอง ขณะเดียวกันก็ต้องรู้ว่า ขอบข่ายข้อมูลที่ vendors ควรจะรู้นั้นมีอะไรบ้าง เพื่อให้ได้คำตอบหรือข้อมูลใหม่ๆ

ขั้นตอนถัดจากการวางแผนงานแล้วก็เป็นส่วนของ “ดาต้า” เริ่มจากการทำ “ดาต้าคลีนอัพ” ซึ่งเป็นหัวใจของการทำดาต้าอนาไลติกส์ ยกตัวอย่างง่ายๆ เช่น ข้อมูลระหว่าง วัน/เดือน/ปี กับ ปี/เดือน/วัน เราสามารถแยกและเข้าใจได้ แต่คอมพิวเตอร์ไม่รับรู้ จึงต้องนำมาจัดทำใหม่หรือนำมาทำความสะอาด อีกสิ่งที่ท้าทายคือ ตารางข้อมูลที่จัดเก็บเป็นแฟ้มเอกสาร ซึ่งพบเป็นปกติของหน่วยงานราชการ แต่เป็นความยากสุดๆ สำหรับขั้นตอนการทำความสะอาดข้อมูล

ผู้เชี่ยวชาญจากนิด้ายังแนะนำอีกว่า “ข้อมูลที่เก็บไว้มากและนาน ย่อมหมายถึงต้นทุนที่เพิ่มขึ้น” พร้อมทั้งอ้างอิงถึง IBM ที่ประมาณไว้คร่าวๆ ว่ากว่า 60% ของข้อมูลที่ไม่ได้ถูกใช้ทันทีจะหมดคุณค่าฉับพลัน อีกทั้งมีการประมาณไว้ว่า องค์กรทั่วไปนำข้อมูลมาประมวลวิเคราะห์เพียงแค่ 1%ของข้อมูลที่มีเท่านั้น ยิ่งเมื่อมีเทคโนโลยีที่สามารถเก็บข้อมูลได้ในราคาที่ลดลงเรื่อยๆ องค์กรก็ยิ่งมีแนวโน้มที่จะเก็บข้อมูลไว้ก่อนแทนที่จะหาแนวทางในการนำข้อมูลมาประมวลผลและใช้ทันที

157460727978

ผลสืบเนื่องต่อมาคือ ความลำบากที่จะนำข้อมูลเหล่านี้มาวิเคราะห์ประมวลผลเพื่อใช้งาน และยิ่งเมื่อขนาดของข้อมูลเหล่านี้ใหญ่ขึ้นอย่างรวดเร็วมาก ค่าใช้จ่ายในการประมวลผลและวิเคราะห์ข้อมูลก็มากขึ้นตาม ทำให้องค์กรส่วนใหญ่เลือกที่จะเก็บข้อมูลเหล่านี้เอาไว้ก่อน ตัวอย่างเช่น ข้อมูลความคิดเห็นของลูกค้าที่เก็บไว้จำนวนมากแต่ไม่มีเครื่องมือที่จะนำมาวิเคราะห์อย่างจริงจัง หรือข้อมูลการโต้ตอบต่างๆที่ผ่านอีเมลของบริษัทที่ต้องจัดเก็บไว้ แต่ไม่เคยได้ถูกนำมาวิเคราะห์ความเชื่อมโยงต่างๆ ที่อาจจะเป็นประโยชน์ต่อองค์กร

“เราต้องเข้าใจก่อนว่าองค์กรอยู่ในระดับความพร้อมขั้นไหน และยังขาดอะไรบ้างในการพัฒนาตัวเองไปสู่ขั้นถัดไป แน่นอนว่าการรู้จุดแข็งของตนเองเป็นเรื่องที่ดี แต่ก็ไม่ควรจะมองข้ามจุดอ่อนที่มีอยู่ด้วย เพื่อพัฒนาองค์กรให้มีศักยภาพอย่างตรงจุด สามารถนำข้อมูลไปใช้ได้อย่างชาญฉลาด และพร้อมก้าวสู่การเป็น data/AI driven organization อย่างเต็มตัวได้” ผศ.วรพล กล่าว