Open AI เปิดโอเพนซอส Point-E ซึ่งเป็นระบบปัญญาประดิษฐ์ที่สามารถสร้างภาพ 3 มิติด้วยการที่ผู้ใช้ป้อนข้อความลงไป พร้อมปล่อยงานวิจัยแสดงรายละเอียดการทำงานของ Point-E
Point-E ได้รับการเทรนโดยชุดข้อมูลหลายล้านชุด โดยประกอบด้วยโมเดลปัญญาประดิษฐ์ 2 ตัว คือ โมเดลที่เปลี่ยนจากข้อความไปเป็นรูปภาพที่ทำงานเหมือนกับ DALL-E 2 หรือ Stable Diffusion และโมเดลที่เปลี่ยนจากรูปภาพไปเป็นภาพ 3 มิติอีกที
หลักการทำงานของ Point-E คือ เมื่อผู้ใช้ป้อนข้อความรูปภาพที่ต้องการลงไป AI ในโมเดลแรกจะเปลี่ยนข้อความเป็นรูปภาพเพื่อป้อนเข้าสู่โมเดลที่ 2 โดยโมเดลที่ 2 จะทำงานโดยการสร้างกลุ่มจุด (point clouds)ขึ้นมาตามรูปภาพจากโมเดลแรก จากนั้น AI ก็จะเชื่อมจุดให้เป็นตาข่ายขึ้นมาเป็นภาพ 3 มิติ
ในเปเปอร์ยังระบุว่า Point-E สามารถสร้างภาพ 3 มิติ ภายใน 1-2 นาทีเพียงแค่ใช้จีพียู Nvidia V100 เพียงแค่ตัวเดียว ทั้งนี้ รูปภาพที่สร้างขึ้นมาอาจมีรูปร่างบิดเบี้ยวไปบ้าง และบางทีก็อาจจะสร้างรูปภาพมาไม่ตรงกับข้อความที่ผู้ใช้ป้อนไป
ทั้งนี้ OpenAI ไม่ได้กล่าวถึงปัญหาเรื่องลิขสิทธิ์ผลงานแต่อย่างใด นักวิจัยยังคาดว่า Point-E จะยังมีปัญหาอื่น ๆ ตามมาด้วยอย่างการที่อาจจะถูกนำไปใช้สร้างภาพที่เป็นอันตราย นักวิจัยจึงมองว่า Point-E เป็นเพียงจุดเริ่มต้นเท่านั้น ก่อนที่จะมีการพัฒนาโมเดลสร้างภาพ 3 มิติต่อไป
อ่านงานวิจัยฉบับเต็มได้ที่ OpenAI
ที่มา: TechCrunch