นักวิจัยจาก MIT ค้นพบวิธีที่เรียบง่ายยิ่งขึ้นในการใช้งาน Computer Vision

08.12.2022

งานวิจัยชิ้นใหม่จาก MIT เปิดเผยให้เห็นถึงเทคนิคที่สามารถขยายต่อยอดการใช้งานได้ด้วยการสังเคราะห์ข้อมูลเพื่อยกระดับความแม่นยำของโมเดล AI สำหรับการจดจำภาพ

การเตรียมพร้อม Machine Learning หรือ ML ในการทำงานนั้นต้องมีการฝึกฝนโมเดลของระบบเสียก่อน โมเดลการฝึกเพื่อระบุสิ่งสำคัญในภาพนั้นต้องใช้ตัวอย่างนับล้านรวมกันเพื่อให้เกิดชุดข้อมูลขนาดใหญ่ที่ลดความผิดพลาดและเพิ่มความแม่นยำให้เกิดขึ้นในระดับสูงสุด แต่อย่างไรก็ตามการใช้ข้อมูลภาพจริงก็ทำให้เกิดข้อวิตกกังวลในประเด็นพื้นฐานและจริยธรรมเช่นกัน

ความกังวลดังกล่าวเกิดขึ้นทั้งในเรื่องของกฎหมายการทำซ้ำข้อมูล การลุกล้ำข้อมูลส่วนบุคคล ไปจนถึงการมีอคติสำหรับกลุ่มชาติพันธุ์หรือเชื้อชาติก็เป็นไปได้เช่นกัน เพื่อหลีกเลี่ยงปัญหาดังกล่าวนักวิจัยจึงเลือกใช้ภาพที่ถูกสร้างขึ้นมาจากโปรแกรม เพื่อใช้ในการสังเคราะห์ข้อมูลสำหรับการฝึกอบรม แต่เทคนิคเหล่านี้มีข้อจำกัดเพราะความรู้ระดับผู้เชี่ยวชาญนั้นจำเป็ฯจะต้องถูกออกแบบอย่างพิถีพิถันในระดับสูง เรียกได้ว่าเป็นงานทำมือก็ไม่ผิดนักหากต้องการให้การฝึกระบบเกิดผลลัพธ์ที่ยอดเยี่ยม

นักวิจัยจาก MIT-IBM Watson AI Lab และพันธมิตรจึงได้ค้นหาวิธีใหม่ ๆ แทนการออกแบบปรับปรุงโปรแกรมที่สร้างภาพขึ้นมาเพื่อฝึกฝนงานที่มีลักษณะจำเพาะ เช่น การใช้งานวิเคระาห์มะเร็งทางการแพทย์เป็ต้น พวกเขารวมชุดข้อมูลสาธารณะกว่า 21,000 ชุดจากอินเทอร์เน็ต และใช้ข้อมูลภาพพื้นฐานเหล่านี้เพื่อสร้างภาพให้ฝึกระบบ Computer Vision

โมเดลที่เกิดขึ้นจะถูกฝึกผ่านชึดข้อมูลภาพที่มีรายละเอียดเหล่านี้สามารถระบุสิ่งที่เห็นได้อย่างแม่นยำมากกว่าการฝึกด้วยวิทีสังเคราะห์ผ่านโมเดลอื่น ๆ ในขณะที่โมเดลใหม่นี้ศักยภาพที่เกิดขึ้นอาจยังไม่เท่ากับระบบที่ถูกฝึกด้วยข้อมูลจริง นักวิจัยได้แสดงให้เห็นว่าการเพิ่มขึ้นของโปรแกรมภาพในชุดข้อมูลยังช่วยเพิ่มประสิทธิภาพของโมเดล ทำให้ในอนาคตจะสามรถฝึกให้มีความแม่นยำเพิ่มขึ้นได้อย่างแน่นอน

ML โดยทั่วไปแล้วจะถูกฝึกมาก่อน หมายความว่าระบบนั้น ๆ จะถูกฝึกกับชุดข้อมูลหนึ่งชุดก่อนเพื่อให้สามารถสร้างพารามิเตอร์ที่จะช่วยจัดการกับภาระหน้าที่ต่าง ๆ ได้ โมเดลที่ใช้วิเคราะห์ฟิล์มเอกซ์เรย์อาจถูกเตรียมฝึกมากับชุดข้อมูลภาพสังเคราะห์ขนาดใหญ่ก่อนที่จะมาฝึกจริงกับภาระที่ต้องเจอ ทำให้ใช้ชุดข้อมูลของฟิล์มจริง ๆ น้อยกว่ามากในการฝึกระบบ เทคนิคใหม่นั้นทำให้ความแตกต่างระหว่างการฝึกด้วยภาพจริงและข้อมูลที่สังเคราะห์ขึ้นมาลดลงมาถึง 38%

เทคโนโลยีใหม่นี้จะช่วยให้การฝึก ML สำหรับการวิเคราะห์ภาพนั้นมีความแม่นยำมากขึ้น ใช้ชุดตัวอย่างจริงสำหรับการฝึกระบบน้อยลง ลดต้นทุนด้านการฝึก รวมถึงข้อสุ่มเสี่ยงต่าง ๆ ด้านจริยธรรมและความปลอดภัยด้านข้อมูลส่วนบุคคลของตัวอย่างได้อีกด้วย

ที่มา:
news.mit.edu

Tags:

ai, Computer Vision, MIT, ซิจัยและพัฒนา

Thossathip Soonsarthorn

"Judge a man by his questions rather than his answers" Voltaire