จุดเริ่มต้นเครื่องมือทำนายคำพิพากษาศาลไทยโดยใช้เทคโนโลยีปัญญาประดิษฐ์
ความไม่รู้กฎหมายไม่เป็นข้อแก้ตัว (ignorantia juris non excusat) เป็นหลักการสำคัญในกฎหมายทั่วโลกรวมถึงประเทศไทย กล่าวคือบุคคลไม่อาจอาศัยข้ออ้างว่าตนไม่รู้ถึงเนื้อหาของกฎหมายขึ้นเป็นข้อแก้ตัวเพื่อให้พ้นจากความรับผิดได้
ข้อเท็จจริงจากการวิจัยในหลายประเทศ รวมถึงประเทศไทยชี้ให้เห็นตรงกันว่า ความสามารถในการเข้าถึงกระบวนการยุติธรรมยังคงเป็นปัญหาที่สำคัญ ซึ่งรวมไปถึงความเป็นไปได้ในการได้รับคำปรึกษาทางด้านกฎหมายเกี่ยวกับสิทธิ หน้าที่ ผลประโยชน์ รวมไปถึงความรับผิดที่ตนอาจมีหากเกิดข้อพิพาทขึ้น
ด้วยข้อจำกัดของทรัพยากรทั้งในแง่เงินทุน บุคลากรที่มีความรู้ความสามารถ เทคโนโลยีสมัยใหม่จึงอาจเป็นทางเลือกมาใช้แก้ปัญหาดังกล่าวได้ จากข้อมูลของสภาทนายความแห่งประเทศไทย ปัจจุบันประเทศไทยมีทนายความที่ได้ใบอนุญาตทั้งสิ้นจำนวน 77,664 คน หรือเฉลี่ยประชากรไทย 1,000 คนต่อทนายความหนึ่งคนโดยประมาณ ซึ่งยังไม่นับว่ามีทนายความที่ยังคงดำรงวิชาชีพทนายอยู่น้อยกว่านั้นมาก
อีกทั้งทนายที่ว่าความในแต่ละสาขาก็มีค่าตอบแทน มีสาขาที่เชี่ยวชาญ และมีกลุ่มของผู้รับคำปรึกษาที่แตกต่างกันออกไป และค่าใช้จ่ายโดยรวมในการเข้าสู่กระบวนการยุติธรรมยังคงอยู่ในอัตราที่สูง รวมทั้งเมื่อพิจารณาด้านความสามารถในการระงับข้อพิพาทของสถาบันระงับข้อพิพาทหลัก เช่น ศาลยุติธรรม
จะพบว่า จำนวนคดีพิพาทในชั้นศาลนั้นมีมากเกินกว่าศาลจะสามารถตัดสินได้ภายในกรอบเวลาอันสั้น ข้อจำกัดจากทั้งฝั่งอุปสงค์และอุปทานในระบบยุติธรรมดังกล่าว จึงเป็นที่มาสำคัญของปัญหาการเข้าถึงกระบวนการยุติธรรมที่สำคัญ
อย่างไรก็ดี ในทางทฤษฎีนั้น มีเพียงข้อพิพาทจำนวนหนึ่งเท่านั้นที่จำเป็นต้องผ่านการพิจารณาในชั้นศาล หรือผ่านกระบวนการระงับข้อพิพาทอื่นใด (alternative dispute resolutions) ในทางกฎหมายและเศรษฐศาสตร์ หากคู่พิพาทสามารถทราบถึงผลคำพิพากษาในชั้นศาลได้ล่วงหน้าด้วยความมั่นใจระดับหนึ่ง (predictability with reasonable certainty)
โดยอาจอ้างอิงจากผลการตัดสินคดีที่มีข้อเท็จจริงคล้ายคลึงกันในอดีต ประกอบกับเนื้อหาของบทบัญญัติในกฎหมาย คู่ความอาจสามารถตกลงไกล่เกลี่ยกันเองได้โดยไม่จำเป็นต้องใช้กระบวนการระงับข้อพิพาท ซึ่งเป็นการประหยัดค่าใช้จ่ายที่จะเกิดขึ้นทั้งทางตรงและทางอ้อม
คณะผู้วิจัยโครงการการวิเคราะห์คดีละเมิดด้วยปัญญาประดิษฐ์ สนับสนุนโดย สำนักงานการวิจัยแห่งชาติ ภายใต้แผนงานยุทธศาสตร์เป้าหมาย (Spearhead) ด้านสังคม คนไทย 4.0 จึงริเริ่มพัฒนาอัลกอริทึมปัญญาประดิษฐ์ ที่สามารถทำนายคำพิพากษาจากข้อเท็จจริงแห่งข้อพิพาท เพื่อช่วยเป็น “ผู้ให้คำแนะนำ” แก่คู่พิพาทได้ในราคาที่ถูก เข้าถึงได้ง่าย และมีความแม่นยำที่น่าพึงพอใจ
ถึงกระนั้น หนทางสู่การสร้างเครื่องมือทำนายคำพิพากษานั้นมิสามารถสร้างขึ้นได้ในเวลาอันสั้น ผู้เขียนในฐานะส่วนหนึ่งของผู้ที่พยายามแก้ไข้ปัญหานี้ ปัจจุบันได้ดำเนินโครงการมาจนถึงปีที่ 2
ระยะที่ 2 ได้ตั้งเป้าทดลองสร้างระบบค้นคืนข้อกฎหมายที่เกี่ยวข้องกับคำพิพากษา เพื่อเป็นรากฐานต่อการสร้างอัลกอริทึมปัญญาประดิษฐ์ที่ใช้ทำนายคำพิพากษาต่อไป
ในการสร้างคลังข้อมูล คณะผู้วิจัยได้เลือกใช้ข้อมูลจากคดีละเมิด (tort) ที่มีจำนวนคดีความขึ้นสู่ศาลชั้นฎีกามากที่สุดในช่วงหลายปีที่ผ่านมา โดยดึงข้อมูลจากฐานข้อมูลคำพิพากษาฉบับย่อในเว็บไซต์ของศาลฎีกาที่มีการเผยแพร่ต่อสาธารณะ
หลังจากนั้นจึงสร้างอัลกอริทึมที่สามารถแยกข้อเท็จจริงที่เป็นคำฟ้อง และข้อเท็จจริงที่เป็นคำให้การออกมาจากคำพิพากษาทั้งหมด เพื่อนำมาใช้วิเคราะห์ต่อไป
คณะผู้วิจัยเริ่มต้นการศึกษาโดยตั้งคำถามก่อนว่า “ข้อเท็จจริงแบบนี้ ควรจะใช้มาตราไหนของกฎหมาย?” แล้วจัดทำโมเดล หรือแบบจำลองขึ้นมาเพื่อให้เรียนรู้คู่ของมาตราในกฎหมาย และข้อเท็จจริง โดยใช้โมเดลโครงข่ายประสาทเทียมรูปแบบต่าง ๆ บนสถาปัตยกรรมการจำแนกข้อมูลสองประเภท (Binary Classification)
เพื่อให้สามารถบอกได้ว่า ข้อเท็จจริงในแต่ละคดีนั้นควรปรับใช้ข้อกฎหมายในมาตราใด นอกจากนี้ ทางคณะผู้วิจัยได้ต่อยอดนำ “เนื้อหาของบทบัญญัติของกฎหมาย” มาวิเคราะห์เพิ่มเติมเพื่อให้การทำนายมาตราใช้การเรียนรู้จากเนื้อความของบทบัญญัติของกฎหมายประกอบด้วย
โดยการนำโมเดลเดียวกันนี้ไปใช้บนสถาปัตยกรรมโครงข่ายประสาทเทียมสยาม (Siamese Neural Network) ในการหาความคล้ายระหว่างคำฟ้องและเนื้อหาข้อกฎหมายก่อนทำนาย และทดสอบประสิทธิภาพการทำนายข้อกฎหมายที่พบได้น้อยหรือไม่ปรากฏในข้อมูลชุดฝึกของโมเดล
จากผลการวิจัยพบว่า โมเดลที่คณะผู้วิจัยทดลองในเบื้องต้นสามารถเรียนรู้ข้อเท็จจริงทางกฎหมายแล้วทำนายมาตราที่เกี่ยวข้องด้วยค่าความแม่นยำ (accuracy) เกินกว่าร้อยละ 70 บนสถาปัตยกรรมการจำแนกข้อมูลสองประเภท
และสังเกตเห็นว่าการใช้คำให้การประกอบคำฟ้องเป็นข้อมูลรับเข้าของโมเดลส่วนใหญ่ไม่ได้ส่งผลต่อการทำนายข้อกฎหมายในบางมาตรา อีกทั้ง ในการทดสอบผ่านสถาปัตยกรรมโครงข่ายประสาทเทียมสยาม ปรากฏว่าโมเดลส่วนใหญ่ทำนายได้ดีใกล้เคียงกับการทดลองที่มีการเรียนรู้ตามมาตราเฉพาะแม้จะมีข้อมูลชุดฝึกที่จำกัด
นอกจากนั้น โมเดลเหล่านี้ยังให้ประสิทธิภาพที่ดีกว่าเครื่องมือค้นหาและสืบค้นข้อมูล (Elasticsearch) ซึ่งเป็นตัวชี้วัดมูลฐานในการสร้างระบบค้นคืนทั่วไป และเป็นการค้นหาที่ใช้เพียงคำหลัก (keywords) ด้วยค่าความแม่นยำ (f1-score@3) มากกว่าร้อยละ 50 ในประมวลกฎหมายวิธีพิจารณาความแพ่งมาตรา 55
อาจกล่าวได้ว่า โมเดลปัญญาประดิษฐ์ที่พัฒนาจนเสร็จสิ้นในปีนี้ มีศักยภาพที่จะพัฒนาเป็นระบบค้นคืนมาตราที่ครอบคลุมข้อกฎหมายที่กว้างและหลากหลายมากขึ้น รวมถึงเป็นประโยชน์ต่อการวิจัยปัญญาประดิษฐ์เชิงนิติศาสตร์ด้านอื่นๆ ได้
นับเป็นก้าวสำคัญของการพัฒนาวงการนิติศาสตร์ไทยที่เกิดขึ้นได้จากการผนวกเอาเทคโนโลยีและวิทยาการเข้ามาใช้อย่างน่าสนใจ
ในอนาคตหากโมเดลและระเบียบวิธีการต่างๆ รวมทั้งคลังข้อมูลคำพิพากษาที่สร้างขึ้นเกิดการพัฒนาต่อยอด และได้รับการสนับสนุนข้อมูลที่ครบถ้วน จนกระทั่งมีประสิทธิภาพที่สูงขึ้นได้จริง การเข้าถึงคำแนะนำทางกฎหมายสำหรับบุคคลทั่วไป และการค้นคว้าสำหรับนักกฎหมายจะเป็นไปได้อย่างมีประสิทธิภาพ รวดเร็ว และทั่วถึงก็จะใกล้เข้าสู่ความจริงมากยิ่งขึ้น
เรียกได้ว่า ขั้นตอนนี้จะเป็นการสานต่อองค์ความรู้ที่เพิ่มโอกาสให้ “กฎหมาย” ก็จะกลายเป็นสิ่งที่เข้าถึงได้สำหรับทุกคนอย่างแท้จริง
ดาวน์โหลดเอกสารได้ฟรีที่ https://www.khonthai4-0.net/