Mar. 08, 2023 at 3:06 pm

กูเกิลโชว์ USM โมเดลแยกแยะเสียงพูดที่รองรับมากกว่า 300 ภาษา มีภาษายาวีด้วย – SMS Marketing ราคาถูกที่สุด

3 years agoNo tags

253views

ทีมวิจัย Google Research เผยแพร่ข้อมูลของโมเดลแยกแยะเสียงพูดตัวใหม่ชื่อ Universal Speech Model (USM) ที่รองรับภาษามากกว่า 300 ภาษา ซึ่งครอบคลุมถึงภาษาที่อาจไม่ได้มีผู้ใช้งานเยอะนัก (จากภาพของกูเกิลจะเห็นคำว่า “ภาษายาวี” อยู่ด้วย)

โมเดล USM เป็นก้าวแรกสู่เป้าหมาย โมเดลเดียวรองรับ 1,000 ภาษา (1,000 Languages Intitiative) ที่กูเกิลเคยประกาศไว้ช่วงปลายปี 2022 โดยตอนนี้ USM ถูกนำไปใช้แล้วกับ YouTube ในการฟังเสียงจากวิดีโอแล้วสร้างเป็นซับไตเติลในภาษาต่างๆ

USM เลือกใช้แนวทาง self-supervised learning เรียนรู้จากการฟังเสียงพูดในภาษาต่างๆ โดยไม่จำเป็นต้องมีป้ายกำกับ (labeled) ซึ่งมีข้อจำกัดเรื่องปริมาณข้อมูลตัวอย่างเสียงที่มีป้ายกำกับ โดยเฉพาะภาษาที่มีผู้ใช้น้อย ในอีกทาง โมเดลจำเป็นต้องใช้ทรัพยากรประมวลผลให้มีประสิทธิภาพ เพราะต้องขยายจำนวนภาษาที่รองรับให้มากขึ้นเรื่อยๆ ด้วย

เทคนิคที่ USM ใช้งานคือ self-supervised learning with fine-tuning เพิ่มขั้นตอนการปรับแต่ง เพื่อให้ประสิทธิภาพของโมเดลออกมาดีขึ้น กระบวนการเทรนแบ่งเป็น 3 ขั้นตอนคือ

self-supervised learning จากเสียงพูด ใช้อัลกอริทึม BERT-based Speech pre-Training
with Random-projection Quantizer (BEST-RQ) ปี 2022 ที่อิงจากอัลกอริทึม BERT ของกูเกิลเมื่อปี 2018 ขั้นตอนนี้กินพลังประมวลผลราว 80% ของทั้งกระบวนการ
multi-objective supervised pre-training เพิ่มข้อมูลประเภทข้อความ (text data) ให้โมเดลมีความรู้เพิ่มขึ้น กูเกิลบอกว่าขั้นที่สองนี่จะทำหรือไม่ก็ได้ (optional) แต่ทำแล้วได้ผลลัพธ์ที่ดีขึ้น
fine-tune ปรับแต่งงานบางส่วนโดยใช้ข้อมูล supervised data อีกเล็กน้อย

ผลที่ได้คือโมเดล USM สามารถทำคะแนนผ่านชุดทดสอบ YouTube Captions ได้ดีกว่าโมเดลอื่น เช่น Whisper-v2 ที่เทรนด้วย labeled data โดยใช้ข้อมูลการเทรนน้อยกว่า และมีอัตราการผิดพลาดน้อยกว่า

กูเกิลบอกว่าสถาปัตยกรรมของ USM น่าจะถูกนำมาใช้เป็นพื้นฐานของโมเดลรุ่นถัดๆ ไปที่จะสามารถพิชิตเป้าหมายแยกแยะ 1,000 ภาษาได้สำเร็จ

ที่มา – Google AI Blog

Topics:

Google

Speech Recognition

Artificial Intelligence

Bulk SMS และ SMS OTP

ราคาถูกพิเศษ สำหรับปริมาณมาก ติดต่อ LINE @deecom

Technology

Tesla ส่งมอบรถ 4.8 แสนคัน ในไตรมาส 4/2023 รวมตลอดปี 2023 ส่งมอบกว่า 1.8 ล้านคัน – SMS Marketing ราคาถูกที่สุด

2 years ago

1.2k

Tesla รายงานตัวเลขการผลิตและการส่งมอบรถ ของไตรมาสที่ 4 ปี 2023 ผลิตรถยนต์ได้ 494,989 คัน (เป็น Model 3/Y 476,777 คัน) และส่งมอบรถยนต์ 484,507 คัน (เป็น Model 3/Y...

Technology

[Counterpoint] ปี 2023 ตลาดสมาร์ทโฟนพรีเมียมราคาสูง เติบโต 6% สวนทางกับตลาดรวม – SMS Marketing ราคาถูกที่สุด

2 years ago

1.3k

บริษัทวิจัยตลาด Counterpoint รายงานภาพรวมตลาดสมาร์ทโฟนระดับพรีเมียม (ราคาสูงกว่า 600 ดอลลาร์ หรือประมาณ 20,000 บาท) ในปี 2023 ซึ่งปีที่ผ่านมา ภาพรวมตลาดสมาร์ทโฟนหดตัวจากหลายปัจจัย แต่มีสมาร์ทโฟนกลุ่มพรีเมียมราคาสูงนี้ที่้ยังเติบโต โดยคาดว่าเติบโตประมาณ 6% จากปีก่อน ทำให้จำนวนส่งมอบทำสถิติสูงสุดอีกปี และคิดเป็นจำนวนเครื่องเกือบ 1...

Technology

มิกกี้เมาส์เวอร์ชันแรกกลายเป็นสาธารณสมบัติแล้ว หลังลิขสิทธิ์หมดอายุ – SMS Marketing ราคาถูกที่สุด

2 years ago

1.4k

ภาพยนตร์สั้นคลาสสิคของ Disney ที่แจ้งเกิดให้กับมิกกี้เมาส์และมินนี่เมาส์ ในชื่อว่า Steamboat Willie ได้กลายเป็นสาธารณสมบัติ หรือ Public Domain แล้วในวันที่ 1 มกราคม 2024 ที่ผ่านมา Steamboat Willie กำกับโดย Walt Disney...

Technology

2023 เป็นปีแรกที่ Apple ไม่มี iPad รุ่นใหม่ออกมาเลย จากที่มีรุ่นใหม่ออกมาตลอด 12 ปี – SMS Marketing ราคาถูกที่สุด

2 years ago

1.4k

ถึงแม้จะผ่านปี 2023 ไปแล้ว และคนที่รอมาตลอดก็คงทราบกันดีว่าในปีที่ผ่านมา แอปเปิลไม่ได้ออก iPad รุ่นใหม่มาเลย จากที่ปกติต้องมีอัพเดตบ้างอย่างน้อยสักรุ่นทุกปี ซึ่งถือเป็นปีแรกนับตั้งแต่ iPad รุ่นแรกเปิดตัวในปี 2010 อย่างไรมีสินค้าเกี่ยวกับ iPad ที่ออกรุ่นใหม่ในปี 2023 นั่นคือ Apple Pencil พอร์ต...

กูเกิลโชว์ USM โมเดลแยกแยะเสียงพูดที่รองรับมากกว่า 300 ภาษา มีภาษายาวีด้วย – SMS Marketing ราคาถูกที่สุด

Bulk SMS และ SMS OTP

ราคาถูกพิเศษ สำหรับปริมาณมาก ติดต่อ LINE @deecom

Tesla ส่งมอบรถ 4.8 แสนคัน ในไตรมาส 4/2023 รวมตลอดปี 2023 ส่งมอบกว่า 1.8 ล้านคัน – SMS Marketing ราคาถูกที่สุด

[Counterpoint] ปี 2023 ตลาดสมาร์ทโฟนพรีเมียมราคาสูง เติบโต 6% สวนทางกับตลาดรวม – SMS Marketing ราคาถูกที่สุด

มิกกี้เมาส์เวอร์ชันแรกกลายเป็นสาธารณสมบัติแล้ว หลังลิขสิทธิ์หมดอายุ – SMS Marketing ราคาถูกที่สุด

2023 เป็นปีแรกที่ Apple ไม่มี iPad รุ่นใหม่ออกมาเลย จากที่มีรุ่นใหม่ออกมาตลอด 12 ปี – SMS Marketing ราคาถูกที่สุด

Bulk SMS ข้อดีที่ไม่มีใครเหมือน?

SMS Marketing ส่ง SMS หลายเบอร์พร้อมกัน คืออะไร?

SMS OTP สำคัญต่อธุรกิจอย่างไร?

ไขข้อสงสัย 1 ข้อความ SMS ใส่ได้กี่ตัวอักษร

Contact Info

Search

popular posts

Telegram เปิดให้สมัครบัญชีใหม่โดยไม่ต้องใช้เบอร์มือถือจากซิมแล้ว – SMS Marketing ราคาถูกที่สุด

SMS Gateway คืออะไร หลักการทำงานอย่างไร

Bulk SMS และ SMS OTP

ราคาถูกพิเศษ สำหรับปริมาณมาก ติดต่อ LINE @deecom

You Might Also Like