เอสเอ็มอี บิ๊กดาต้าของ สสว. ความร่วมมือเปิดข้อมูลภาครัฐ
ข้อมูลขนาดใหญ่ที่นำไปวิเคราะห์หรือทำการพยากรณ์ได้ จำเป็นต้องได้ข้อมูลดิบทั้งหมด
การทำระบบ บิ๊ก ดาต้า จะมีองค์ประกอบที่สำคัญหลายด้านทั้งเรื่อง เทคโนโลยี คน และกลยุทธ์การนำข้อมูลไปใช้ แต่ปัจจัยสำคัญที่สุด คือ การรวบรวมข้อมูลจากแหล่งต่างๆ มาอยู่ที่เดียวกันเพื่อทำระบบประมวลผล บ่อยครั้งหน่วยงานไม่สามารถหาข้อมูลได้ เพราะหน่วยงานอื่นๆ (หรือแม้แต่หน่วยงานภายใน) ไม่ให้ข้อมูล ทำให้ไม่มีข้อมูลเพียงพอวิเคราะห์
ช่วง 2-3 ปีที่ผ่านมาผมมีโอกาสร่วมเป็นที่ปรึกษาในโครงการพัฒนาระบบเอสเอ็มอี บิ๊ก ดาต้า ของสํานักงานส่งเสริมวิสาหกิจขนาดกลางและขนาดย่อม (สสว.) ซึ่งรวบรวมข้อมูลของผู้ประกอบการเอสเอ็มอีในประเทศ แล้วนำมาวิเคราะห์ แสดงผลในรูปแดชบอร์ด เปิดสาธารณะให้คนทั่วไปเข้าดูได้ที่ www.sme.go.th มีแดชบอร์ดต่างๆ เช่น ข้อมูลจำนวนผู้ประกอบการ ข้อมูลงบการเงิน ข้อมูลเปรียบเทียบงบการเงินตามผลประกอบการธุรกิจ ข้อมูลจ้างงาน มูลค่านำเข้า ส่งออก ทั้งที่แยกตามกลุ่มสินค้ากระทรวงพาณิชย์หรือตามกลุ่มสินค้าธนาคารแห่งประเทศไทย และแยกตามการค้าชายแดน
แม้ปัจจุบันภาครัฐมีระบบข้อมูลเปิด แต่ระบบส่วนใหญ่ เป็นการเปิดข้อมูลรายเรคคอร์ด ไม่สามารถนำไปวิเคราะห์เป็นภาพรวมได้ ซ้ำร้ายบางหน่วยงานเปิดข้อมูลในลักษณะของไฟล์เอกสารที่ทำให้ไม่สามารถนำไปประมวลต่อได้ แต่หากเราต้องการระบบฐานข้อมูลขนาดใหญ่ที่สามารถนำไปวิเคราะห์ได้หรือทำการพยากรณ์ได้นั้น จำเป็นจะต้องได้ข้อมูลดิบทั้งหมดมา ไม่ควรเป็นข้อมูลสรุปหรือเป็นข้อมูลรายเรคอร์ดเพียงบางส่วน
เอสเอ็มอี บิ๊กดาต้า มีข้อมูลทั้งหมดที่เข้ามาจากหลายแห่ง เช่น ข้อมูลสำรวจสำมโนอุตสาหกรรมของสำนักงานสถิติแห่งชาติ ตั้งแต่ปี 2550 ข้อมูลนิติบุคคล รวมถึงงบการเงินของทุกบริษัทจากกรมพัฒนาธุรกิจการค้า ตั้งแต่ปี 2554 ข้อมูลนำเข้าส่งออกของกรมศุลกากรเป็นรายเดือน ตั้งแต่ปี 2556 และข้อมูลของการส่งประกันสังคมของบริษัทต่างๆ เป็นรายเดือน ซึ่งข้อมูลทั้งหมดนี้นับได้เป็นพันล้านเรคอร์ด
การมีข้อมูลจำนวนมหาศาลทำให้ สสว.สามารถวิเคราะห์ข้อมูลในแง่ต่างๆ ได้ นอกจากสามารถนำมาจำแนกผู้ประกอบการตามประเภทธุรกิจที่แบ่งขนาดเป็นไมโคร เล็ก และกลาง แล้ว สสว.ยังสามารถวิเคราะห์ข้อมูลด้านต่างๆ ที่เกี่ยวข้องกับเอสเอ็มอีได้ด้วย เช่น จำนวนผู้ประกอบแบ่งตามจังหวัด กลุ่มจังหวัด หรือหมวดธุรกิจ การวิเคราะห์การจ้างงานตามประเภทธุรกิจ และการวิเคราะห์การนำเข้าส่งออกตามประเภทสินค้า ขนาดธุรกิจ ตามประเทศหรือกลุ่มประเทศ
แดชบอร์ดของ เอสเอ็มอี บิ๊กดาต้า ที่สสว.เผยแพร่เป็นประโยชน์ต่อประชาชนทั่วไป ที่ต้องการข้อมูลด้านต่างๆ ที่เกี่ยวกับเอสเอ็มอี หากเราศึกษาข้อมูลเหล่านี้ดีๆ ก็สามารถวิเคราะห์แนวโน้มต่างๆ ของเอสเอ็มอีได้แยกตามกลุ่มธุรกิจ หรือแม้แต่รายจังหวัด ข้อมูลที่ สสว. แสดงจะเป็นข้อมูลภาพรวมไม่ได้แสดงข้อมูลของผู้ประะกอบหรือบุคคลเป็นรายๆ
การทำและเผยแพร่ บิ๊กดาต้าของสสว. เป็นตัวอย่างที่ดีของหน่วยงานภาครัฐที่รวบรวมข้อมูล เพื่อให้ประชาชน ธุรกิจนำไปใช้ประโยชน์ ปัจจุบันมีหลายหน่วยงานที่เผยแพร่ข้อมูลขนาดใหญ่ออกมา เช่น ดีบีดี ดาต้าแวร์เฮ้าส์ ของกรมพัฒนาธุรกิจการค้า เป็นแหล่งค้นหาข้อมูลนิติบุคคล และประเภทธุรกิจในประเทศไทย และสถิติข้อมูลการเงินของธนาคารแห่งประเทศไทย เป็นต้น
แม้หลายหน่วยงานภาครัฐจะผลักดันบิ๊กดาต้า แต่ส่วนใหญ่ประสบปัญหานำข้อมูลขนาดใหญ่ของหน่วยงานอื่นมาใช้ และทำได้เพียงแลกเปลี่ยนข้อมูลบางส่วน และอาจได้มาเป็นรายเรคคอร์ด ทำให้ข้อมูลระบบบิ๊กดาต้า เป็นเพียงข้อมูลในหน่วยงานที่อาจไม่ครอบคลุมทุกมิติ หากหน่วยงานภาครัฐยอมให้ข้อมูลดิบแลกเปลี่ยนระหว่างหน่วยงาน ข้อมูลวิเคราะห์ต่างๆ ของภาครัฐจะแม่นยำและถูกต้องยิ่งขึ้น รัฐบาลและประชาชนได้ประโยชน์มากขึ้นจากระบบที่สามารถพัฒนาขึ้นมาได้ในอนาคต