Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้ – SMS Marketing ราคาถูกที่สุด
แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model – MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา
Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้
ที่น่าสนใจคือ Ferret เผยแพร่ในรูปแบบโอเพนซอร์ส non-commercial สามารถนำไปวิจัยพัฒนาต่อได้แบบไม่แสวงหาผลประโยชน์ ซึ่งนักวิจัยด้าน AI มองว่าเป็นก้าวที่ดีของแอปเปิล ที่ปกติไม่ค่อยโอเพนซอร์สงานวิจัยที่มีโอกาสพัฒนาเป็นผลิตภัณฑ์ได้แบบนี้
ที่มา: VentureBeat
🚀🚀Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity. 📰https://t.co/gED9Vu0I4y1⃣ Ferret enables referring of an image region at any shape2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc
— Zhe Gan (@zhegan4) October 12, 2023