ข้อมูลใน “มุมมืด”
ไฟฟ้าและน้ำมัน เป็นตัวขับเคลื่อนเศรษฐกิจและสังคมโลกในศตวรรษที่ 20 ขณะที่ ข้อมูล ทำหน้าที่เดียวกันในศตวรรษที่ 21 ข้อมูลที่กล่าวนี้กินความตั้งแต่การใช้จ่ายส่วนบุคคล ช่วงเวลาและสถานที่ใช้โทรศัพท์ การลงทุนของภาครัฐและเอกชน ฯลฯ ไปจนถึงข้อมูลสุขภาพส่วนตัวและสังคม
เมื่อไม่นานมานี้มี นักคิดเสนอว่าข้อมูลควรกินความไปถึงข้อมูลที่เก็บไว้เเต่ไม่ใช้ประโยชน์ ข้อมูลที่บกพร่องข้อมูลที่ไม่รู้ว่ามีอยู่ ข้อมูลที่แอบซ่อนอยู่ ฯลฯ โดยลักษณะหลังนี้เรียกว่า “ข้อมูลในมุมมืด” หรือ Dark Data (DD) ซึ่งมีบทบาทสำคัญอย่างยิ่งอย่างที่คนส่วนใหญ่ไม่ตระหนักถึง มันสามารถช่วยให้การตัดสินใจในการดำเนินชีวิตและการประกอบกิจกรรมทางเศรษฐกิจรอบคอบมากขึ้น
ตัวอย่าง DD ได้แก่
(ก) สมมุติว่าต้องการสรรหาคนดีมีความสามารถมาทำงาน โดยใช้วิจารณญาณอันเป็นเลิศของคณะกรรมการถึง 15 คน โดยผลออกมาว่า ก. ได้ 6 คะแนน / ข. 4 คะแนน / มีกรรมการงดออกเสียง 5 คน จากคะเเนนผลก็คือเลือกนาย ก.
แต่หากดูคะแนนให้ดีจะเห็นว่ามี DD อยู่ 5 คนที่ไม่ออกเสียงซึ่งหากเเม้นเทคะแนนให้ ข. เพียง 3 คะแนน ข. ก็ได้รับเลือก แต่ก็ไม่มีวันรู้ว่าจะเลือกเช่นนี้หรือไม่ จึงเกิดข้อสงสัยได้ ลักษณะเช่นนี้จึงต้องใคร่ครวญผลการตัดสินเป็นพิเศษ
(ข) ในการเก็บสถิติการรักษาพยาบาลหนึ่งของยุโรปมีฐานข้อมูลว่าผู้ป่วยไข้จากการบาดเจ็บ 165,559 คน พบว่ามีอยู่ 19,289 คน ที่ไม่รู้ว่าผลการรักษาหลังจากออกจากโรงพยาบาลไปเเล้ว 30 วันเป็นอย่างไร ในขณะที่ 146,270 คนที่เหลือหายเป็นปกติในเวลาเท่ากัน
เมื่อดูตัวเลขนี้ก็อาจสบายใจว่าการรักษามีประสิทธิภาพ แต่การมี DD ที่ไม่รู้ว่าตายหรือป่วยเรื้อรังหรือพิการนั้นเป็นอย่างไร ไม่รู้ว่าคนเหล่านี้ได้รับการรักษาแตกต่างจาก 146,270 คนหรือไม่ ดังนั้นจึงเป็นเรื่องน่ากังวลเกี่ยวกับวิธีการรักษาพยาบาลที่ให้
(ค) โรคหัดเป็นโรคที่อาจทำให้ถึงพิการหรือตายได้ แต่ที่โรคไม่อาละวาดเหมือนโควิด-19 ก็เพราะมีวัคซีนที่มีประสิทธิภาพมาก ในประเทศที่โครงการฉีดวัคซีนประสบผลสำเร็จแทบจะไม่มีปัญหาคุกคามสุขภาพเลย
อย่างไรก็ดีในบางประเทศพ่อแม่เริ่มจะไม่ยอมให้ฉีดวัคซีนป้องกันโรคหัดกันเพราะไม่เห็นมีคนป่วยด้วยโรคนี้เลย หากพ่อแม่จำนวนมากไม่เข้าใจเรื่อง DD ที่แอบซ่อนอยู่ในสถิติคนฉีดวัคซีนหัด อาจเกิดเป็นปัญหาโรคระบาดหัดได้ในประเทศนั้นในอนาคตอันใกล้
(ง) ในต่างจังหวัดบ้านเรามีการโฆษณา “ยาผีบอก” รักษาโรคมะเร็งหาย ในทีวีดาวเทียมกันมากโดยไม่มีหลักฐานวิทยาศาสตร์หนุนหลัง วิธีการโฆษณาที่ดูจะได้ผลก็คือเอาคนที่กินยานี้และหายหลายคนมาเป็นพยาน
ดูเผิน ๆ ก็ดีมีหลักฐาน แต่ DD ก็คือไม่รู้ว่ามีคนกินยานี้กี่คนและหายกี่คน เพราะคนที่กินยาแต่รักษาไม่ได้ตายไปหมดเเล้ว ไม่สามารถมาบอกได้
(จ) โพลเก็บข้อมูลจากประชาชนเรื่องใดก็แล้วแต่มันจะมี DD แอบซ่อนอยู่ หากสำรวจทางโทรศัพท์โดยใช้เครื่องติดบ้าน (เรียกว่า landline) ก็จะได้ผู้ตอบสูงอายุที่อยู่บ้าน ส่วนเสียงของคนวัยกลางคนหรือวัยรุ่นจะไม่ปรากฏอยู่ในกลุ่มคนที่เลือกถามมาเพราะคนเหล่านี้ใช้โทรศัพท์แบบมือถือ ถ้าไม่อ่าน DD ให้ดีจะถูกหลอกโดยตั้งใจหรือไม่ตั้งใจได้
(ฉ) ยาที่เรากินนั้นมักมั่นใจว่าได้ผลกับเราเพราะผ่านการตรวจสอบทดลองมามากและยาวนาน อย่างไรก็ดีในการทดลองยากับกลุ่มคน คนที่ขาดไปมักเป็นหญิงท้องกับชนกลุ่มน้อย ผลที่ออกมาคือเป็นผลดีต่อกลุ่มที่ทดลอง
แต่เมื่อเอามาใช้จริง คนที่รับกรรมก็คือหญิงและทารกตลอดจนชนกลุ่มน้อยเพราะไม่ได้อยู่ในกลุ่มทดลอง มันอาจไม่ได้ผลและมีผลข้างเคียงที่ร้ายแรงได้
ยาจำนวนมากจึงมักกันเหนียวด้วยการห้ามหญิงท้องกับทารกบริโภคทั้ง ๆ ที่อาจเป็นผลดีก็เป็นได้ ส่วนชนกลุ่มน้อยนั้นช่างมันเพราะมีพันธุ์กรรมแตกต่างกันอย่างสรุปไม่ได้ว่าจะเป็นผลดีกับกลุ่มใด
ตัวอย่างข้างบนนี้คือส่วนหนึ่งของ DD ที่พบกันในชีวิตประจำวัน DD อีกลักษณะหนึ่งเกิดขึ้นกับธุรกิจหรือภาครัฐ ได้แก่ข้อมูลที่มองไม่เห็น แอบซ่อนไว้ ถูกมองข้าม ถูกละเลย เก็บไว้มากมาย ฯลฯ แต่ไม่ถูกนำมาใช้
ตัวอย่างเช่น
(ก) ธุรกิจเก็บคำตำหนิ เสียงบ่นเกี่ยวกับบริษัทและสินค้า และการบริการจากภาครัฐที่มีการเก็บเป็นระบบ โดยละเลยส่วนที่มาจากเสียงบ่นจากปากผู้บริโภค
(ข) มีข้อมูลเก็บไว้นานแล้วจำนวนมากเป็นกระดาษไม่ถูกนำมาใช้ทั้งที่อาจเป็นประโยชน์ เช่น สถิติเกี่ยวกับสภาวะอากาศ
(ค) อีเมล ข้อมูลจากเซนเซอร์ ข้อมูลจากการสำรวจข้อมูลโซเชียลมีเดีย ฯลฯ จากการสื่อสารกับลูกค้าจำนวนมากที่สามารถเอามาใช้ให้เป็นประโยชน์ในการเข้าใจความต้องการของลูกค้ามักถูกละเลย
(ง) องค์กรมักรัฐละเลยข้อมูลที่เป็นลบกับภาพลักษณ์ เช่น ตัวเลขการว่างงานหรืออัตรา เงินเฟ้อ ตลอดจนคำวิจารณ์จากประชาชนในเรื่องการให้บริการต่าง ๆ จนทำให้ไม่เข้าใจสถานการณ์ที่แท้จริง
(จ) DD ตัวหนึ่งที่ต้องระวังคือตัวเลขอาชญากรรมซึ่งจำนวนมากไม่มีการแจ้งความเป็นหลักฐาน จนทำให้ดูต่ำกว่าความเป็นจริง
(ฉ) ตัวอย่างของการละเลยอย่างไม่ตั้งใจของการทดลองทางวิทยาศาสตร์ดังที่เกิดขึ้นในกรณีของการศึกษาในตอนต้นของเรื่องมะเร็งปอด โดยละเลยการพิจารณาเอาการสูบบุหรี่เป็นปัจจัยสำคัญจนกว่าจะทราบความจริงเกี่ยวกับผลร้ายของบุหรี่ต่อปอดมะเร็งอย่างชัดเจนก็ถึงปี ค.ศ. 1964
(ช) DD ที่ต้องระวังคือเนื้อหาที่ถูกกรองโดยแพลตฟอร์มของโซเชียลมีเดีย กล่าวคือมันจะป้อนให้เราเฉพาะเรื่องที่ เราชอบ และเชื่อโดยดูจากลักษณะการเข้าร่วมของเราที่ผ่านมา หากไม่ระวังจะถูก “ทำให้หลง” เพราะพบแต่ข้อมูลที่ถูกกรองมาและเสริมความชอบของตัวเราจนทำให้เสียโอกาสในการได้รับเนื้อหาที่ทำให้เราเป็นคนรอบด้านมากขึ้น
การตระหนักถึงการมีอยู่ของ “ข้อมูลในมุมมืด” จะทำให้ไม่เสียโอกาสในการใช้ประโยชน์จากข้อมูลที่เรามีและ “ไม่มี” ประการสำคัญจะไม่ถูกหลอกเพราะเห็นแต่ข้อมูลที่เรามีโดยเฉพาะในเรื่องการตัดสินใจในการดำเนินชีวิตด้านสุขภาพ
ไอเดียเรื่อง DD นี้ ผู้ชี้ให้เห็นคือ David Hand ดังปรากฏในหนังสือ Dark Data : Why What You Don’t Know Matter (2020) ซึ่งได้รับการกล่าวถึงมากในการนำมาใช้ประโยชน์ในการตัดสินใจในด้านต่าง ๆ
มนุษย์ทุกคนเผชิญกับการตัดสินใจอยู่ตลอดเวลา สำคัญมากบ้างน้อยบ้างแตกต่างกันออกไป แต่ทุกการเลือกล้วนมีต้นทุน “ค่าเสียโอกาส” ทั้งสิ้น การตระหนักถึงการมีอยู่ของ “ข้อมูลในมุมมืด” จะช่วยให้สามารถประเมินทางเลือกได้อย่างชาญฉลาดยิ่งขึ้น.