ข้อมูลใน “มุมมืด”

ข้อมูลใน “มุมมืด”

ไฟฟ้าและน้ำมัน เป็นตัวขับเคลื่อนเศรษฐกิจและสังคมโลกในศตวรรษที่ 20 ขณะที่ ข้อมูล ทำหน้าที่เดียวกันในศตวรรษที่ 21 ข้อมูลที่กล่าวนี้กินความตั้งแต่การใช้จ่ายส่วนบุคคล ช่วงเวลาและสถานที่ใช้โทรศัพท์ การลงทุนของภาครัฐและเอกชน ฯลฯ ไปจนถึงข้อมูลสุขภาพส่วนตัวและสังคม

เมื่อไม่นานมานี้มี นักคิดเสนอว่าข้อมูลควรกินความไปถึงข้อมูลที่เก็บไว้เเต่ไม่ใช้ประโยชน์   ข้อมูลที่บกพร่องข้อมูลที่ไม่รู้ว่ามีอยู่   ข้อมูลที่แอบซ่อนอยู่    ฯลฯ    โดยลักษณะหลังนี้เรียกว่า “ข้อมูลในมุมมืด” หรือ Dark Data (DD) ซึ่งมีบทบาทสำคัญอย่างยิ่งอย่างที่คนส่วนใหญ่ไม่ตระหนักถึง          มันสามารถช่วยให้การตัดสินใจในการดำเนินชีวิตและการประกอบกิจกรรมทางเศรษฐกิจรอบคอบมากขึ้น

                        ตัวอย่าง DD ได้แก่  

(ก) สมมุติว่าต้องการสรรหาคนดีมีความสามารถมาทำงาน โดยใช้วิจารณญาณอันเป็นเลิศของคณะกรรมการถึง 15 คน  โดยผลออกมาว่า ก. ได้ 6 คะแนน  /   ข. 4 คะแนน  /  มีกรรมการงดออกเสียง 5 คน   จากคะเเนนผลก็คือเลือกนาย ก.  

แต่หากดูคะแนนให้ดีจะเห็นว่ามี DD อยู่ 5 คนที่ไม่ออกเสียงซึ่งหากเเม้นเทคะแนนให้ ข. เพียง 3 คะแนน   ข. ก็ได้รับเลือก    แต่ก็ไม่มีวันรู้ว่าจะเลือกเช่นนี้หรือไม่ จึงเกิดข้อสงสัยได้    ลักษณะเช่นนี้จึงต้องใคร่ครวญผลการตัดสินเป็นพิเศษ

(ข) ในการเก็บสถิติการรักษาพยาบาลหนึ่งของยุโรปมีฐานข้อมูลว่าผู้ป่วยไข้จากการบาดเจ็บ 165,559 คน   พบว่ามีอยู่ 19,289 คน  ที่ไม่รู้ว่าผลการรักษาหลังจากออกจากโรงพยาบาลไปเเล้ว 30 วันเป็นอย่างไร   ในขณะที่ 146,270 คนที่เหลือหายเป็นปกติในเวลาเท่ากัน

   เมื่อดูตัวเลขนี้ก็อาจสบายใจว่าการรักษามีประสิทธิภาพ  แต่การมี DD ที่ไม่รู้ว่าตายหรือป่วยเรื้อรังหรือพิการนั้นเป็นอย่างไร    ไม่รู้ว่าคนเหล่านี้ได้รับการรักษาแตกต่างจาก 146,270 คนหรือไม่  ดังนั้นจึงเป็นเรื่องน่ากังวลเกี่ยวกับวิธีการรักษาพยาบาลที่ให้

(ค)  โรคหัดเป็นโรคที่อาจทำให้ถึงพิการหรือตายได้   แต่ที่โรคไม่อาละวาดเหมือนโควิด-19 ก็เพราะมีวัคซีนที่มีประสิทธิภาพมาก   ในประเทศที่โครงการฉีดวัคซีนประสบผลสำเร็จแทบจะไม่มีปัญหาคุกคามสุขภาพเลย  

 อย่างไรก็ดีในบางประเทศพ่อแม่เริ่มจะไม่ยอมให้ฉีดวัคซีนป้องกันโรคหัดกันเพราะไม่เห็นมีคนป่วยด้วยโรคนี้เลย    หากพ่อแม่จำนวนมากไม่เข้าใจเรื่อง DD ที่แอบซ่อนอยู่ในสถิติคนฉีดวัคซีนหัด   อาจเกิดเป็นปัญหาโรคระบาดหัดได้ในประเทศนั้นในอนาคตอันใกล้

   (ง)  ในต่างจังหวัดบ้านเรามีการโฆษณา “ยาผีบอก” รักษาโรคมะเร็งหาย ในทีวีดาวเทียมกันมากโดยไม่มีหลักฐานวิทยาศาสตร์หนุนหลัง     วิธีการโฆษณาที่ดูจะได้ผลก็คือเอาคนที่กินยานี้และหายหลายคนมาเป็นพยาน  

 ดูเผิน ๆ ก็ดีมีหลักฐาน   แต่ DD ก็คือไม่รู้ว่ามีคนกินยานี้กี่คนและหายกี่คน  เพราะคนที่กินยาแต่รักษาไม่ได้ตายไปหมดเเล้ว  ไม่สามารถมาบอกได้

(จ) โพลเก็บข้อมูลจากประชาชนเรื่องใดก็แล้วแต่มันจะมี DD แอบซ่อนอยู่   หากสำรวจทางโทรศัพท์โดยใช้เครื่องติดบ้าน (เรียกว่า landline) ก็จะได้ผู้ตอบสูงอายุที่อยู่บ้าน   ส่วนเสียงของคนวัยกลางคนหรือวัยรุ่นจะไม่ปรากฏอยู่ในกลุ่มคนที่เลือกถามมาเพราะคนเหล่านี้ใช้โทรศัพท์แบบมือถือ    ถ้าไม่อ่าน DD ให้ดีจะถูกหลอกโดยตั้งใจหรือไม่ตั้งใจได้

(ฉ) ยาที่เรากินนั้นมักมั่นใจว่าได้ผลกับเราเพราะผ่านการตรวจสอบทดลองมามากและยาวนาน  อย่างไรก็ดีในการทดลองยากับกลุ่มคน     คนที่ขาดไปมักเป็นหญิงท้องกับชนกลุ่มน้อย   ผลที่ออกมาคือเป็นผลดีต่อกลุ่มที่ทดลอง    

แต่เมื่อเอามาใช้จริง คนที่รับกรรมก็คือหญิงและทารกตลอดจนชนกลุ่มน้อยเพราะไม่ได้อยู่ในกลุ่มทดลอง   มันอาจไม่ได้ผลและมีผลข้างเคียงที่ร้ายแรงได้    

ยาจำนวนมากจึงมักกันเหนียวด้วยการห้ามหญิงท้องกับทารกบริโภคทั้ง ๆ ที่อาจเป็นผลดีก็เป็นได้    ส่วนชนกลุ่มน้อยนั้นช่างมันเพราะมีพันธุ์กรรมแตกต่างกันอย่างสรุปไม่ได้ว่าจะเป็นผลดีกับกลุ่มใด

ตัวอย่างข้างบนนี้คือส่วนหนึ่งของ DD ที่พบกันในชีวิตประจำวัน    DD อีกลักษณะหนึ่งเกิดขึ้นกับธุรกิจหรือภาครัฐ   ได้แก่ข้อมูลที่มองไม่เห็น   แอบซ่อนไว้    ถูกมองข้าม    ถูกละเลย    เก็บไว้มากมาย   ฯลฯ   แต่ไม่ถูกนำมาใช้  

ตัวอย่างเช่น

 (ก) ธุรกิจเก็บคำตำหนิ   เสียงบ่นเกี่ยวกับบริษัทและสินค้า และการบริการจากภาครัฐที่มีการเก็บเป็นระบบ   โดยละเลยส่วนที่มาจากเสียงบ่นจากปากผู้บริโภค    

(ข) มีข้อมูลเก็บไว้นานแล้วจำนวนมากเป็นกระดาษไม่ถูกนำมาใช้ทั้งที่อาจเป็นประโยชน์  เช่น   สถิติเกี่ยวกับสภาวะอากาศ  

(ค)  อีเมล  ข้อมูลจากเซนเซอร์    ข้อมูลจากการสำรวจข้อมูลโซเชียลมีเดีย   ฯลฯ   จากการสื่อสารกับลูกค้าจำนวนมากที่สามารถเอามาใช้ให้เป็นประโยชน์ในการเข้าใจความต้องการของลูกค้ามักถูกละเลย     

 (ง) องค์กรมักรัฐละเลยข้อมูลที่เป็นลบกับภาพลักษณ์  เช่น  ตัวเลขการว่างงานหรืออัตรา     เงินเฟ้อ    ตลอดจนคำวิจารณ์จากประชาชนในเรื่องการให้บริการต่าง ๆ จนทำให้ไม่เข้าใจสถานการณ์ที่แท้จริง  

 (จ)  DD ตัวหนึ่งที่ต้องระวังคือตัวเลขอาชญากรรมซึ่งจำนวนมากไม่มีการแจ้งความเป็นหลักฐาน      จนทำให้ดูต่ำกว่าความเป็นจริง 

 (ฉ) ตัวอย่างของการละเลยอย่างไม่ตั้งใจของการทดลองทางวิทยาศาสตร์ดังที่เกิดขึ้นในกรณีของการศึกษาในตอนต้นของเรื่องมะเร็งปอด โดยละเลยการพิจารณาเอาการสูบบุหรี่เป็นปัจจัยสำคัญจนกว่าจะทราบความจริงเกี่ยวกับผลร้ายของบุหรี่ต่อปอดมะเร็งอย่างชัดเจนก็ถึงปี ค.ศ. 1964   

(ช) DD ที่ต้องระวังคือเนื้อหาที่ถูกกรองโดยแพลตฟอร์มของโซเชียลมีเดีย    กล่าวคือมันจะป้อนให้เราเฉพาะเรื่องที่            เราชอบ และเชื่อโดยดูจากลักษณะการเข้าร่วมของเราที่ผ่านมา     หากไม่ระวังจะถูก “ทำให้หลง” เพราะพบแต่ข้อมูลที่ถูกกรองมาและเสริมความชอบของตัวเราจนทำให้เสียโอกาสในการได้รับเนื้อหาที่ทำให้เราเป็นคนรอบด้านมากขึ้น

การตระหนักถึงการมีอยู่ของ “ข้อมูลในมุมมืด” จะทำให้ไม่เสียโอกาสในการใช้ประโยชน์จากข้อมูลที่เรามีและ “ไม่มี”  ประการสำคัญจะไม่ถูกหลอกเพราะเห็นแต่ข้อมูลที่เรามีโดยเฉพาะในเรื่องการตัดสินใจในการดำเนินชีวิตด้านสุขภาพ

ไอเดียเรื่อง DD นี้   ผู้ชี้ให้เห็นคือ David Hand ดังปรากฏในหนังสือ Dark Data :  Why What You Don’t  Know Matter (2020)  ซึ่งได้รับการกล่าวถึงมากในการนำมาใช้ประโยชน์ในการตัดสินใจในด้านต่าง ๆ

มนุษย์ทุกคนเผชิญกับการตัดสินใจอยู่ตลอดเวลา    สำคัญมากบ้างน้อยบ้างแตกต่างกันออกไป    แต่ทุกการเลือกล้วนมีต้นทุน “ค่าเสียโอกาส” ทั้งสิ้น     การตระหนักถึงการมีอยู่ของ “ข้อมูลในมุมมืด”  จะช่วยให้สามารถประเมินทางเลือกได้อย่างชาญฉลาดยิ่งขึ้น.