หลายครั้งการออกแบบคำสั่งหรือเขียนโปรแกรมการทำงานสำหรับุ่นยนต์นั้นมีความซับซ้อนและยุ่งยาก ทีมนักวิจัยจาก MIT จึงได้พัฒนาวิธีออกแบบการทำงานของหุ่นยนต์เสียใหม่ด้วยการสังเกตการทำงานของมนุษย์ผ่านระบบการเรียนรู้แทน
จากการเขียนโปรแกรมให้หุ่นยนต์ที่เคยเป็นเรื่องยาก สู่ปัจจุบันที่มีความสะดวกและง่ายดายมากขึ้นทุกทีโดยไม่จำเป็นต้องมีความเชี่ยวชาญในการเขียนโปรแกรมระดับสูงอีกต่อไป ด้วยการเรียนรู้โดยการสังเกตการทำงานมนุษย์ทำให้หุ่นยนต์สามารถทำงานได้หลากหลายกิจกรรมรวมไปถึงหลากหลายบริบทการทำงาน หรือจะคิดว่าการฝึกหุ่นยนต์นั้นเหมือนเป็นการฝึกแรงงานใหม่ก็ได้
นักวิจัยจาก MIT จึงได้ออกแบบระบบที่ทำให้หุ่นยนต์สามารถเรียนรู้การทำงานที่มีความซับซ้อนซึ่งปรกติจะเป็นการวางกฎวางเงื่อนไขที่สามารถสร้างความสับสนให้กับระบบได้ ยกตัวอย่างการทำงานบ้าน ๆ เช่น การจัดโต๊ะอาหารเย็นเป็นต้น
หัวใจหลักของการทำงานสำหรับนักวิจัย คือ Planning with Uncertain Specifications (PUnS) หรือการวางแผนสำหร้บความเจาะจงที่ไม่แน่นอน ซึ่งเป็นระบบที่ทำให้หุ่นยนต์มีความสามารถวางแผนได้เหมือนมนุษย์ เพื่อให้ตัดสินใจกับความคลุมเคลือที่หลากหลายได้อย่างมีประสิทธิภาพตรงกับเป้าหมายที่อยากให้ดำเนินการ ระบบจะเลือกทำกิจกรรมที่ขึ้นอยู่กับความเชื่อมั่นต่อหน้าที่ที่ต้องทำ
นักวิจัยได้ใช้ชุดข้อมูลที่มีรายละเอียดการจัดวางวัตถุ 8 ชิ้น ได้แก่ แก้วน้ำร้อน แก้วน้ำดื่ม ส้อม มีด จานอาหารเย็น จานขนาดเล็ก และชาม ซึ่งสามารถจัดวางได้หลากหลายรูปแบบ ในตอนแรกหุ่นยนต์ได้ทำการสังเกตตัวอย่างการจัดโต๊ะของมนุษย์แบบสุ่มขึ้น จากนั้นจึงให้แขนกลจัดโต๊ะภายใต้เงื่อนไขที่กำหนด โดยทดลองจัดจริงและใช้โปรแกรมจำลองซึ่งมีพื้นฐานจากการสังเกต
เพื่อให้การทดลองมีความก้าวหน้า หุ่นยนต์จำเป็นต้องชั่งน้ำหนักความเป็นไปได้ในการลำดับการจัดวางแม้ในเวลาที่ของบางชิ้นถูกนำออกไป วางซ้อนกัน หรือซ่อนอย่างจงใจโดยผู้วิจัย โดยทั่วไปแล้วการทำแบบนี้จะสร้างความสับสนให้กับหุ่นยนต์มากเกินไป แต่หุ่นยนต์ของทีมวิจัยสามารถจัดการได้อย่างไร้ข้อผิดพลาดในการทดสอบจริงหลายครั้งหลายรูปแบบ และมีความผิดพลาดเพียงหยิบมือเท่านั้นเมื่อเทียบกับการจำลองการทำงานกว่าหมื่นครั้ง
หุ่นยนต์นั้นสามารถวางแผนลำดับขั้นการทำงานได้ดีเมื่อมีความจำเพาะเจาะจงที่ชัดเจน ซึ่งจะช่วยอธิบายภาระหน้าที่ที่ต้องทำ การตัดสินใจดำเนินการ สภาพแวดล้อมและเป้าหมายสุดท้าย การเรียนรู้การจัดโต๊ะด้วยการเฝ้าสังเกตนั้นเต็มไปด้วยความจำเพาะเจาะจงที่ไม่แน่นอน สิ่งจองต้องวางในตำแหน่งที่แน่นอนขึ้นอยู่กับรายการอาหารและตำแหน่งที่นั่งแขก ซึ่งต้องวางในลำดับที่แน่นอนขึ้นอยู่กับว่าอาหารชนิดในพร้อมเสิร์ฟก่อนหรือมารยาทการเสิร์ฟอาหารของแต่ละสังคม ทำให้การทำความเข้าใจเพื่อวางแผนของหุ่นยนต์ด้วยเทคนิคในปัจจุบันนั้นไม่เหมาะกับการเผชิญกับความจำเพาะเจาะจงที่ไม่แน่นอนเหล่านี้
หนึ่งในวิธิทำความเข้าใจสำหรับการวางแผนยอดนิยม คือ Reinforcement Learning (RL) หรือการเรียนแบบเสริมกำลัง ซึ่งเป็นเทคนิคการลองผิดลองถูกที่ใช้รางวัลและการลงโทสำหรับกิจกรรมที่ดำเนินการจนเสร็จสิ้นแล้ว แต่สำหรับหน้าที่ที่มีความจำเพาะเจาะจงแบบไม่แน่นอนจึงเป็นเรื่องยากที่จะให้รางวัลและลงโทษมีความแตกต่างกันอย่างชัดเจน ในระยะสั้นพบว่าหุ่นยนต์ไม่สามารถเรียนรู้สิ่งที่ถูกต้องจากความผิดพลาดได้อย่างครบถ้วน
ระบบ PUnS ทำให้หุ่นยนต์สามารถใช้ความเชื่อกับความเป็นไปได้ของความจำเพาะเจาะจงที่มากมาย ความเชื่อนั้นสามารถใช้ได้กับทั้งรางวัลและการทำโทษ ซึ่งมันเหมือนกับการที่หุ่นยนต์วางเดิมพันว่าอะไรที่จำเป็นจะต้องทำในหน้าที่และดำเนินการอย่างไรถึงจะทำให้ความเชื่อนั้นเป็นที่น่าพึงพอใจ แทนที่มนุษย์จะต้องกำหนดเงื่อนไขทุกอย่างให้ชัดเจน
ที่มา:
News.mit.edu