OpenAI เริ่มดูดเว็บไปฝึก AI เอง ประกาศ User-Agent และ IP ให้จำกัดการดูดเว็บได้ – SMS Marketing ราคาถูกที่สุด
![](https://sms.deecommerce.co.th/blog/wp-content/uploads/2023/08/4adda28208ab8a1cf92a43db0c7509cb-KXRecV.png)
119views
OpenAI เริ่มทำ web crawler สำหรับดูดเว็บของตัวเอง แม้ในเว็บจะไม่ได้ระบุว่าจะดูดเว็บไปทำอะไรแต่ก็ระบุว่าข้อมูลที่ดูดไปอาจจะใช้สำหรับโมเดลปัญญาประดิษฐ์ในอนาคต
ตัว crawler จะใช้ User-Agent ว่า GPTBot สามารถกำหนดห้ามเข้าส่วนต่างๆ ของเว็บได้ทางไฟล์ robots.txt และทาง OpenAI ยังประกาศหมายเลขไอพีขาออก เพื่อให้เว็บไซต์บล็อคหรือตรวจสอบได้ว่าเป็น crawler ของ OpenAI จริง
ที่ผ่านมา OpenAI ไม่ได้เปิดเผยว่าตัว GPT ตัวหลังๆ ฝึกจากชุดข้อมูลใดบ้าง และแม้ว่าจะมีระบบปลั๊กอินให้ดูดเว็บได้ แต่ก็เป็นการอ่านเนื้อหาในเว็บเข้าไปให้ ChatGPT สรุปมาอีกทีเท่านั้น ไม่ใช่การฝึกโมเดลโดยตรง
ที่มา – OpenAI