ทักษะจำเป็นในยุค Big DATA ควรค่าประดับResume หางานง่าย รายได้สูง
“Big Data” ได้เข้ามามีบทบาทในทุกภาคส่วน โดยเฉพาะในกลุ่มภาคธุรกิจที่เรื่องข้อมูล กลายเป็นความรอดของธุรกิจนั้นๆ เพราะหากนำข้อมูลที่มีอยู่จำนวนมหาศาลมาวิเคราะห์เชิงลึกได้อย่างแม่นยำ จะช่วยวางแผนธุรกิจ รวมถึงสร้างความแตกต่างให้ธุรกิจมีความโดดเด่น
ทว่าการมีพนักงานที่มีทักษะในการทำความเข้าใจ วิเคราะห์และใช้ประโยชน์จากข้อมูล (data literacy) หรือที่หลายคนเรียกตำแหน่งนี้ว่า Data Scientist นั้น ในปัจจุบันต้องยอมรับว่า Data Scientist
Data Scientist คือใคร?
Data Scientist หรือนักวิทยาศาสตร์ข้อมูล จะเป็นผู้ที่ทำงานวิเคราะห์ Big Data หรือข้อมูลจำนวนมหาศาลในรูปแบบออนไลน์และออฟไลน์ที่มีอยู่ในองค์กร ซึ่งข้อมูลเหล่านี้จะเป็นประโยชน์ต่อธุรกิจ สร้างสรรค์โปรโมชั่น พัฒนาผลิตภัณฑ์ และยังช่วยให้เข้าใจพฤติกรรมผู้บริโภคมากขึ้น
อดีตก่อนนำข้อมูลไปใช้ ต้องผ่านขั้นตอนการตั้งสมมติฐาน ทดลอง และหาผลลัพธ์ ซึ่งถือเป็นกระบวนการหนึ่งของนักวิทยาศาสตร์ (Scientist) โดยรวมแล้วบทบาทความรับผิดชอบของอาชีพ Data Scientist นั้นค่อนข้างกว้าง ขึ้นอยู่กับข้อกำหนดของแต่ละองค์กร บางคนอาจจะทำหน้าที่วิเคราะห์ข้อมูลเพียงอย่างเดียว ขณะที่บางองค์กรต้องการคนที่สามารถนำข้อมูลมาพัฒนาผลิตภัณฑ์ได้
กระบวนการทำงานของอาชีพ Data Scientist คือ
ตั้งสมมติฐาน → ค้นคว้าหาข้อมูล → วิเคราะห์ข้อมูล → สร้างแบบจำลอง → สื่อสารผลลัพธ์
- ทักษะที่จำเป็นในยุค DATA
Data Scientist คืออาชีพที่บูรณาการองค์ความรู้หลายด้าน ทั้งทักษะทางตรง (Hard skill) และ ทักษะทางอ้อม (Soft skill) ประกอบไปด้วย
ความรู้ด้านคณิตศาสตร์และสถิติ
Data Scientist คือบุคคลที่มีความรู้คณิตศาสตร์เชิงลึกและสถิติ เพื่อนำมากลั่นกรองและตีความผลลัพท์ของข้อมูล เช่น การเรียนรู้ด้วยตนเองของโปรแกรมต่างๆ (Machine Learning) การทำเหมืองข้อมูล (Data Mining) หรือพีชคณิต (Algebra)
การเขียนโปรแกรม
มีความชำนาญการใช้โปรแกรมคอมพิวเตอร์และการเขียนโค้ด ซึ่งจะเป็นประโยชน์ในการจัดการข้อมูลขนาดใหญ่ และสร้างแบบจำลองในการพัฒนาระบบหรือผลิตภัณฑ์ รวมถึงทักษะการนำเสนอข้อมูลเชิงภาพ (Visualization) สื่อสารข้อมูลออกเป็นกราฟหรือภาพที่เข้าใจได้ง่าย
ความรู้ด้านธุรกิจและการตลาด
ทักษะนี้สามารถศึกษาเพิ่มเติมนอกเหนือจากสาขาที่เรียนได้ อาจอาศัยประสบการณ์การทำงานร่วมด้วย ความรู้ด้านธุรกิจและทักษะการตลาดเป็นสิ่งสำคัญที่ไม่แพ้ความรู้เฉพาะทางเลย เพราะจะช่วยให้ Data Scientist เข้าใจกลไกทางธุรกิจและคาดการณ์เทรนด์การตลาดได้ โดยพื้นฐานแล้วต้องเป็นผู้ที่สนใจโซเชียลมีเดียและสนใจเรื่องในกระแสสังคม เพื่อนำมาเชื่อมโยงกับความต้องการของผู้บริโภค ซึ่งจะเป็นประโยชน์ในการพัฒนาธุรกิจ
ทักษะการสื่อสาร
การสื่อสารอาจเป็นทักษะที่ถูกมองข้าม ทั้งที่จริงแล้วเป็นสิ่งสำคัญมาก เพราะ Data Scientist คือคนที่ต้องสื่อสารกับเพื่อนร่วมงานฝ่ายอื่นๆ เช่น ฝ่ายการตลาด ธุรกิจ เซลส์ ที่อาจไม่มีความรู้ด้าน Data โดยตรง พูดง่ายๆ ก็คือสามารถอธิบายเรื่องยากให้คนทั่วไปเข้าใจได้ โดยการเลือกวิธีนำเสนอที่เหมาะสมกับข้อมูลแต่ละประเภท ข้อมูลบางอย่างอาจจะเหมาะทำเป็นกราฟ แผนภูมิ หรือ Infographics
- ติดทักษะ มีอาวุธติดตัว เพิ่มคุณค่าบนเรซูเม่
โดยทักษะที่ควรค่าแก่การประดับบนเรซูเม่มีดังต่อไปนี้
1. ความสามารถในการจัดการข้อมูล ความสามารถในการจัดการข้อมูลดิบหรือข้อมูลที่ยังไม่สามารถนำมาใส่เป็นตารางในฐานข้อมูลได้ เช่น เสียงตอบรับของลูกค้า, คลิปเสียง, บล็อก, โพสต์บนโซเชียล, หรือแม้แต่วิดีโอ ซึ่งนักวิทยาศาสตร์ข้อมูลจำเป็นต้องรู้วิธีการใช้ซอฟต์แวร์สำหรับประมวลผลข้อมูลดิบเหล่านี้โดยเฉพาะ เช่น NoSQL, Microsoft HDI Insight, Polybase, Apache Hadoop, Presto ฯลฯ
2. มีความรู้ด้านคณิตศาสตร์และสถิติเป็นอย่างดี โดยจำเป็นต้องเข้าใจหลักการด้านสถิติทุกประเภท เช่น การจัดเรียงและกระจายข้อมูล การทดสอบความน่าเชื่อถือ รวมทั้งการทำนายข้อมูลในอนาคตโดยใช้หลักของแคลคูลัสและพีชคณิต
3. นำข้อมูลมานำเสนอเป็นเรื่องราวได้ อย่างการประมวลผลข้อมูลมาแสดงในเชิงกราฟิก เช่น กราฟและแผนภูมิรูปแบบต่างๆ
4. ทักษะการเขียนโปรแกรม เนื่องจากอาชีพนี้จำเป็นต้องใช้ซอฟต์แวร์ที่ต้องเขียนโค้ดเองเป็นส่วนใหญ่ โดยเฉพาะภาษา R และ Python ที่นิยมนำมาใช้ในงานวิเคราะห์ข้อมูล
5. การชอบความท้าทายและเอาชนะ อย่างการเข้าร่วมกิจกรรมแข่งการแฮ็กหรือ Hackathons อย่าง Hackerearthและ NMIMSรวมทั้งการเข้าสัมมนา และการแข่งขันอื่นๆ ที่เกี่ยวข้อง
6. การทำงานเป็นโปรเจ็กต์ โดยเฉพาะประสบการณ์เชิงปฏิบัติที่หน้างานจริง
7. วุฒิการศึกษาที่เกี่ยวข้อง บริษัทส่วนใหญ่ต้องการนักวิทยาศาสตร์ข้อมูลมีวุฒิระดับปริญญาโทในด้านวิทยาศาสตร์คอมพิวเตอร์, สถิติ, และวิทยาศาสตร์กายภาพ
ทักษะในเชิงเทคนิคเฉพาะตัว (Technical Skills) การที่จะประสบความสำเร็จในอาชีพ Data Scientist ต้องมีความเชี่ยวชาญด้านเทคโนโลยีที่หลากหลาย โดยเฉพาะอย่างยิ่งเทคโนโลยี Open-source เช่น R Language, Java, C++, Python Programming, Hadoop และมีความรู้เกี่ยวกับเทคโนโลยีฐานข้อมูล NoSQL ต่างๆ เช่น MongoDB, HBase, และ CouchDB โดยมีทักษะ 5 ด้าน ดังนี้
- เก่งทั้ง Python และ R นักวิทยาศาสตร์ข้อมูลต้องมีความเชี่ยวชาญทั้งศาสตร์ด้านสถิติ และการเขียนโปรแกรมคอมพิวเตอร์ เพราะถือว่าเป็นหัวใจสำคัญของอาชีพนี้ เพื่อที่ก้าวเป็น “Enterprise Data Scientist” ไม่ใช่แค่นักวิทยาศาสตร์ข้อมูล จำเป็นต้องเรียนรู้การเขียนโปรแกรม R และ Python บนแนวระบบข้อมูลขนาดใหญ่ เช่น Hadoop, Oracle หรือ SAP HANA เพื่อให้สามารถสร้างการใช้งานทั้งวิเคราะห์ลูกค้าและการตลาด
- เชี่ยวชาญใช้เครื่องมือ Hadoop และ NoSQL เพราะทั้งสองตัวเป็นเครื่องมือ Open-source ยอดนิยมสำหรับการจัดการข้อมูลขนาดใหญ่ เพื่อเร่งขับเคลื่อนนวัตกรรมด้วยข้อมูล ดังนั้นจึงต้องคุ้นเคยกับส่วนประกอบต่าง ๆ ของ Hadoop เช่น Distributed File System, MapReduce และ Flume ส่วน NoSQL สำหรับการทำงานกับข้อมูลที่ไม่มีโครงสร้าง ไม่ว่าจะอยู่ในรูปแบบของเสียง วิดีโอ การอัปเดตโซเชียลมีเดีย ซึ่งการมีทักษะด้านนี้เพื่อสนับสนุนการทำงานของระบบ
- แปลงข้อมูลดิบเป็นรูปแบบภาพ (Data Visualization) ทักษะนี้จะช่วยให้นักวิทยาศาสตร์ข้อมูลเห็นภาพของข้อมูลได้อย่างรวดเร็วว่ามีอะไรบ้างที่น่าสนใจ และสามารถนำไปเป็นแนวทางการวิเคราะห์เจาะลึกข้อมูลที่มีความซับซ้อน ซึ่งช่วยในการวิเคราะห์ให้มีประสิทธิภาพยิ่งขึ้น โดยสามารถจัดทำในรูปแบบชาร์ต ตาราง กราฟ แผนที่ และอินโฟกราฟิก เพื่อสร้างความเข้าใจให้กับผู้ปฏิบัติงาน นักการตลาด ผู้บริหาร สามารถนำข้อมูลเพื่อเป็นการตัดสินใจได้อย่างรวดเร็ว
- ทักษะ Machine Learning & Deep Learning ทักษะนี้ถือว่ามีความจำเป็นต้องเข้าใจอย่างลึกซึ้งเกี่ยวกับการทำเหมืองข้อมูล นักวิทยาศาสตร์ข้อมูลต้องมีทักษะสร้างโมเดลในลักษณะ AI และ machine learning เพื่อการเรียนรู้ของเครื่องคอมพิวเตอร์จากข้อมูลที่เราป้อนเข้าไปได้อย่างมีประสิทธิภาพ ทำนายหรือแก้โจทย์พร้อมทั้งส่งผลลัพธ์ออกมาเป็นโค้ด เพื่อเป็นข้อมูลวิทยาการ นำไปให้ประโยชน์ต่อไป
- แปลงข้อมูลให้พร้อมใช้งาน (Data Wrangling) ทักษะการปรับเปลี่ยนหน้าตาข้อมูลดิบให้อยู่ในรูปแบบที่เหมาะสมกับการทำ Data Analysis แม้ว่านักวิทยาศาสตร์ข้อมูลจะเก่งสถิติหรือการเขียนโปรแกรมโค้ดเพียงใดก็ตาม ซึ่งต้องรู้จักบริบทต่าง ๆ ทั้งพฤติกรรมของมนุษย์ เพื่อหาความหมายของข้อมูล สร้างสมมติฐาน ทดสอบโมเดล และหาผลลัพธ์ที่น่าเชื่อถือเหมาะสมกับธุรกิจรวมทั้งสถานการณ์เพื่อทำนายเทรนด์ต่าง ๆ จากข้อมูล
ทักษะทั่วไปในกระบวนการคิดและวิเคราะห์ (Non-Technical Skills) แม้ว่าจะเป็นทักษะรอบด้านของบุคคล ซึ่งประกอบด้วยกระบวนการคิด หรือกระทั่งการสื่อสาร แต่ถือว่ามีความจำเป็นเพราะช่วยส่งเสริมการทำงานให้มีประสิทธิภาพดียิ่งขึ้น โดยมี 5 ทักษะ ดังนี้
- ความเชี่ยวชาญทางธุรกิจ นักวิทยาศาสตร์ข้อมูลต้องมีความเชี่ยวชาญทางธุรกิจที่แข็งแกร่งในอุตสาหกรรมที่ตนเองทำงาน เพื่อที่จะเข้าใจธุรกิจได้อย่างลึกซึ้ง รวมถึงรู้ถึงเป้าหมายของบริษัท และวิธีทำงานที่สนับสนุนเป้าหมายเหล่านั้นให้สำเร็จ เพราะหน้าที่ของนักวิทยาศาสตร์ข้อมูลต้องระบุปัญหาที่สำคัญของธุรกิจ โดยสามารถในการแยกแยะว่าปัญหาใดมีความสำคัญต่อการแก้ไขสำหรับธุรกิจนั้น และสามารถกำหนดกลยุทธ์ใหม่ ๆ ที่สามารถนำมาใช้ประโยชน์ได้
- มีสัญชาตญาณเกี่ยวกับข้อมูล นักวิทยาศาสตร์ข้อมูลที่ดี ไม่ใช่คนที่ป้อนข้อมูลที่เป็นไปได้ทั้งหมดลงในโมเดลการเรียนรู้ของเครื่องและวิเคราะห์ผลลัพธ์ สิ่งสำคัญที่สุด ต้องคิดว่าข้อมูลนั้นสมเหตุสมผลหรือไม่ นักวิทยาศาสตร์ข้อมูลที่ประสบความสำเร็จต้องมองหาสถานการณ์ที่เป็นไปได้ทั้งหมดและปรับให้เข้ากับสถานการณ์ และมักจะมองหาคำถามใหม่ ๆ ที่จะถามอยู่เสมอ
- ทักษะด้านนวัตกรรมและสร้างสรรค์ (Learning Model) ต้องบอกว่า นักวิทยาศาสตร์ข้อมูลไม่เพียงแต่เล่นกับข้อมูลเท่านั้น แต่ต้องมีนวัตกรรมและความคิดสร้างสรรค์ มีความกระตือรือร้นที่จะเรียนรู้เพิ่มเติม และค้นหาสิ่งแปลกใหม่ ด้วยความคิดที่นอกกรอบบนพื้นการวิเคราะห์ที่แม่นยำจะช่วยเพิ่มมูลค่าและนำมาซึ่งผลลัพธ์ที่สร้างผลกำไรให้กับองค์กรได้อย่างยอดเยี่ยม
- อัปเดตเทคโนโลยีและเทรนด์ใหม่อยู่เสมอ ทักษะนี้จริง ๆ แล้วเหมือนง่าย ๆ แต่ด้วยการพัฒนาข้อมูลที่เกิดขึ้นอย่างรวดเร็ว มันจึงเป็นเรื่องยากที่จะติดตามทุกสิ่ง ซึ่งหมายความว่าการเป็นนักวิทยาศาสตร์ข้อมูลต้องเรียนรู้เครื่องมือและเทคนิคใหม่ ๆ อยู่เสมอเพื่อที่จะได้อยู่ในระดับแนวหน้าของสาขานี้ โดยจากการทำแบบสำรวจเครื่องมือ SAS, R, Python เมื่อปี 2563 แสดงให้เห็นว่าการตั้งค่าเครื่องมือเปลี่ยนแปลงไปมากเพียงใดในช่วงไม่กี่ปีที่ผ่านมา
- ทำงานเป็นทีม โดยเฉพาะการสร้างความสัมพันธ์ที่ดีกับวิศวกรข้อมูลและผู้เชี่ยวชาญด้านไอที เดิมทีนักวิทยาศาสตร์ข้อมูลมักจะถูกคาดหวังจากองค์กรสำหรับการวิเคราะห์ข้อมูลทั้งหมด แต่ปัจจุบันการทำงานเริ่มมีทีมวิศวกรข้อมูล หรือผู้เชี่ยวชาญด้านไอทีที่ทำงานเคียงข้าง ดังนั้นการมีความสัมพันธ์ที่ดีในทีมก็เป็นสิ่งสำคัญเช่นกัน
อย่างไรก็ตาม “Data Scientist” กลายเป็นที่ต้องการขององค์กรทั่วโลก ในปี 2012 บทความใน “Harvard Business Review” กล่าวว่า Data Scientist คืองานที่เซ็กซี่ที่สุดในศตวรรษที่ 21 เพราะ Data Scientist เป็นบุคคลที่ใครๆ ต่างต้องการ แต่หาตัวได้ยาก
นอกจากนี้ข้อมูลของ indeed.com หนึ่งในเว็บไซต์หางานที่ได้รับความนิยมสูงสุดในสหรัฐฯ พบว่าความต้องการ “Data Scientist” ของบริษัทต่างๆ กำลังเพิ่มขึ้นอย่างรวดเร็ว ในช่วงปี 2014 – 2017 และ IBM ยังคาดการณ์ว่าความต้องการ Data Scientist จะเพิ่มขึ้นอีกประมาณ 39% ในช่วงปี 2015 – 2020
จากกระแสความต้องการตัว “Data Scientist” ในช่วงหลายปีที่ผ่านมา พิสูจน์ได้ว่าความเซ็กซี่ของงานนี้เป็นจริงและไม่ได้เป็นเพียงแนวโน้มระยะสั้น โดยในปี 2017 เว็บไซต์ค้นหางานชื่อดังอย่าง Glassdoor จัดอันดับ Data Scientist ให้เป็นอาชีพที่ดีที่สุดในสหรัฐฯ และเป็นอาชีพที่ดีที่สุดลำดับต้นๆ ของอังกฤษในปีเดียวกัน ซึ่งการจัดลำดับอ้างอิงมาจากปัจจัยด้านค่าแรง ความพึงพอใจในการทำ งาน และโอกาสในการทำงานในอนาคต
อ้างอิง: imarticus.org, JobsDB ,brandbuffet.in.th