DeepMind เผยแพร่งานวิจัยใหม่โชว์ผลการฝึกปัญญาประดิษฐ์ให้หัดเล่นฟุตบอลตั้งแต่พื้นฐาน ตั้งแต่เริ่มยืน, วิ่งไล่ลูกบอล ไปจนถึงการเลี้ยงหลบ, เข้าสกัด และการเล่นเป็นทีม
งานวิจัยนี้เป็นการฝึก DeepMind ให้ควบคุมหุ่นที่ถูกเรียกว่า “agent” ซึ่งหมายถึงหุ่นจำลอง 3 มิติในระบบคอมพิวเตอร์ที่มีการกำหนดเงื่อนไขกลไกการเคลื่อนไหวร่างกายตามหลักฟิสิกส์เลียนแบบธรรมชาติของร่างกายคน (ซึ่งใช้เอนจิน MujoCo ที่บริษัทซื้อมา) ให้เรียนรู้วิธีการเล่นฟุตบอลโดยเริ่มตั้งแต่ศูนย์ในระดับที่ agent ไม่รู้แม้กระทั่งวิธีทรงตัวให้ยืนอยู่ในสนามฟุตบอลได้ จนกระทั่งมันรู้จักวิธีเล่นฟุตบอลกันเป็นทีม
ภายใน 3 วันหลังเริ่มการเทรนให้ DeepMind (เทียบเท่ากับการจำลองเกมการแข่งฟุตบอลจริง 5 ปี) มันการเริ่มรู้จักการควบคุมร่างกายของ agent ให้เคลื่อนที่หาลูกฟุตบอลและพยายามกระแทกลูกบอลให้ไปเข้าประตูทีมฝั่งตรงข้าม
ผ่านไป 50 วันหลังการเทรน DeepMind รู้จักการสั่งให้ agent เล่นฟุตบอลโดยการพยายาม “เตะ” ลูกฟุตบอล ไม่ใช่แค่การวิ่งชนกระแทกลูกบอลอีกต่อไป นอกจากนี้มันยังรู้จักการออกบอลไปยังพื้นที่ว่างที่ไม่มีผู้เล่นฝ่ายตรงข้าม รู้จักการหลบหลีกคู่ต่อสู้ ทั้งยังพัฒนาการเคลื่อนที่ตอนไม่มีบอลด้วย
ทั้งหมดที่กล่าวมานี้คือภาพรวมของการฝึกให้ปัญญาประดิษฐ์รู้จักเกมฟุตบอลและเริ่มหัดเล่นด้วยตัวมันเอง เสมือนการปล่อยให้คนทำความรู้จักการเล่นฟุตบอลด้วยตนเอง แตกต่างกันแต่เพียงแค่ว่านี่คือการฝึกให้ปัญญาประดิษฐ์ควบคุมร่างกายของหุ่นในโลกเสมือนแห่งคอมพิวเตอร์ให้เรียนรู้และค่อยๆ พัฒนาทักษะกีฬาแทนการใช้ร่างกายจริง
แน่นอนว่าเมื่อมองดูภาพการเล่นฟุตบอลของ DeepMind แล้ว มันช่างแตกต่างจากภาพที่เราเห็นจากเกมฟุตบอลอย่าง FIFA หรือ PES แบบคนละเรื่อง ซึ่งเกมเหล่านี้ก็มีโหมดที่ผู้เล่นสามารถแข่งกับทีมของคอมพิวเตอร์หรือปล่อยให้คอมพิวเตอร์ควบคุมทีมแข่งกันเอง และแน่นอนว่าโหมดเกมเหล่านั้นล้วนมีปัญญาประดิษฐ์อยู่เบื้องหลังคอยควบคุมตัวผู้เล่นต่างๆ ในเกมให้เคลื่อนไหวและพยายามเอาชนะคู่แข่ง
ปัญญาประดิษฐ์ในเกมเหล่านั้นมีความซับซ้อนในการเรียนรู้และควบคุมการเคลื่อนที่ต่างๆ น้อยกว่าสิ่งที่ DeepMind ถูกฝึกให้ทำ ไม่ว่าจะเป็นเรื่องของฟิสิกส์เชิงกลของร่างกาย agent (หรือก็คือตัวผู้เล่นในเกมฟุตบอล) ซึ่งในเกมมีรายละเอียดซับซ้อนน้อยกว่าเอนจิน MujoCo ที่ DeepMind ต้องคอยควบคุม ไหนจะวิธีการเคลื่อนไหวร่างกายที่เกมอย่าง FIFA หรือ PES นั้นมีการออกแบบท่วงท่าหรือรูปแบบการเคลื่อนไหวเตรียมข้อมูลเอาไว้ให้พร้อมอยู่ก่อนแล้ว เหลือเพียงให้ปัญญาประดิษฐ์ของเกมเลือกดึงเอาชุดรูปแบบการเคลื่อนไหวเหล่านั้นมาใช้ให้เหมาะสมต่อสถานการณ์
ในแง่การเคลื่อนที่ในเชิงแทคติคการเล่นร่วมกันเป็นทีม หากมองถึงความลื่นไหลของเกมอย่าง FIFA หรือ PES ก็ดูเหมือนคอมพิวเตอร์จะรู้จักวิธีการเล่นเป็นทีมอย่างมีประสิทธิภาพ แต่นั่นก็เพราะว่าในการพัฒนาเกมย่อมต้องใส่ข้อมูลแทคติกเหล่านี้เอาไว้ให้คอมพิวเตอร์อยู่ก่อนแล้วเช่นกัน ในขณะที่ DeepMind นั้นต้องเรียนรู้เรื่องเหล่านี้ใหม่หมดด้วยตัวมันเองทุกอย่าง ต้องลองผิดลองถูกด้วยตัวมันเอง เปรียบเหมือนคนที่ต้องหัดเล่นฟุตบอลโดยหัดคิดเอง ปราศจากโค้ชที่จะคอยมาสอนว่าทำแบบไหนจึงจะเป็นวิธีที่ดีและถูกต้อง
เบื้องหลังการเรียนรู้วิธีเล่นฟุตบอลของ DeepMind นั้น ทีมงานได้แบ่งขั้นตอนการฝึกปัญญาประดิษฐ์ออกเป็น 3 ช่วงใหญ่ๆ โดยแรกเริ่มพื้นฐานการเรียนรู้เรื่องการขยับร่างกาย, วิธีการทรงตัว, การยืน, การวิ่ง, การเหวี่ยงเท้าเพื่อเตะ เหล่านี้อาศัยการฝึกปัญญาประดิษฐ์ด้วยข้อมูลจากการทำ motion capture จากร่างกายคนจริงๆ ในขั้นตอนนี้เป็นการเทรนให้ปัญญาประดิษฐ์เรียนรู้การควบคุม agent แบบเดี่ยว
ขั้นถัดมาคือการฝึกให้ DeepMind เข้าใจพื้นฐานการเล่นฟุตบอล โดยให้เลือกนำเอาการเคลื่อนไหวร่างกายที่มันได้เรียนมาจากข้อมูล motion captue ในขั้นตอนแรกมาใช้ในการเล่นฟุตบอลขึ้นพื้นฐาน ปัญญาประดิษฐ์จะถูกฝึกให้มันพยายามทำสิ่งต่างๆ เช่น การเคลื่อนที่ร่างกาย agent ให้ไปยังตำแหน่งต่างๆ ตามที่ถูกกำหนด, การเลี้ยงลูกฟุตบอลในทิศทางต่างๆ ตามที่โจทย์ระบุ รวมถึงการเตะลูกฟุตบอลให้เข้าประตู เหล่านี้อาศัยการปล่อยให้ปัญญาประดิษฐ์ใช้เวลาฝึกฝนโดยงัดเอาข้อมูลการเคลื่อนไหวร่างกายที่เรียนรู้ไว้มาใช้ให้บรรลุเป้าหมาย ซึ่งขั้นตอนนี้ก็เป็นการเทรนปัญญาประดิษฐ์ให้ควบคุม agent แบบเดี่ยวเช่นกัน
และการฝึกขั้นสูงสุดก็คือการฝึกเรื่องการเล่นร่วมกันของ agent มากกว่า 1 ตัว มีทั้งการฝึกการผ่านบอลให้กัน, การหาตำแหน่ง, การสกัดฝ่ายตรงข้าม โดย DeepMind จะตัองดึงเอาสิ่งที่มันได้เรียนรู้ผ่านการฝึกใน 2 ขั้นตอนแรกมาใช้งานให้บรรลุเป้าหมาย
ด้วยการปล่อยให้มันเรียนรู้และฝึกที่นานพอ DeepMind สามารถเล่นฟุตบอลโดยรู้จักทักษะการเล่นหลากหลายชนิด ไม่ว่าจะเป็นการแตะหลบเพื่อเลี้ยงบอลผ่านคู่ต่อสู้, การบังบอล, การวางบอลยาว, การจ่ายบอลทะลุช่อง, การวิ่งหาตำแหน่งรับบอล, การโยกหลอก, การเข้าสกัด, การพลิกบอล, การงัดบอลโด่งข้ามคู่ต่อสู้, การสกัดบอลหน้าประตู, การถอยไปยืนตำแหน่งเกมรับ, การซ้อนตำแหน่งเพื่อนร่วมทีม
เรียกได้ว่าน่าสนใจมากกับการเห็นคอมพิวเตอร์หัดเล่นฟุตบอลได้ภายในเวลาไม่กี่วัน
ที่มา – The Next Web, DeepMind