Google เปิดตัว Gemini 3.5 Live Translate โมเดลด้านเสียงรุ่นล่าสุดที่มาพร้อมขีดความสามารถในการแปลภาษาแบบพูดโต้ตอบ (Speech-to-Speech) ได้แบบเกือบเรียลไทม์ รองรับการใช้งานมากกว่า 70 ภาษาทั่วโลก
หัวใจสำคัญของ Gemini 3.5 Live Translate คือ
ความสามารถในการประมวลผลเสียงแบบต่อเนื่อง ต่างจากระบบเดิมที่ต้องรอให้ผู้พูดหยุดพูดก่อนจึงจะเริ่มแปล โมเดลใหม่นี้สามารถวิเคราะห์และสร้างเสียงแปลออกมาได้ทันทีในขณะที่อีกฝ่ายกำลังพูด โดยยังคงน้ำเสียง จังหวะการพูด และระดับเสียงของผู้พูดต้นทางเอาไว้ ทำให้การสนทนามีความลื่นไหลและดูเป็นธรรมชาติมากขึ้น
ฟีเจอร์เด่นที่น่าสนใจของ Gemini 3.5 Live Translate
- รองรับมากกว่า 70 ภาษา ช่วยทลายกำแพงภาษาในการสื่อสารทั่วโลก
- ระบบตรวจจับภาษาอัตโนมัติ: ไม่ต้องตั้งค่าให้ยุ่งยาก โมเดลสามารถวิเคราะห์และแปลภาษาต้นทางได้ทันที
- ทนทานต่อเสียงรบกวน ออกแบบมาให้ใช้งานได้ดีแม้ในสภาพแวดล้อมที่มีเสียงดังหรือคาดเดาไม่ได้
- ความปลอดภัย เสียงที่สร้างนี้ จะมีลายน้ำ SynthID ฝังอยู่ เพื่อความโปร่งใสและป้องกันการปลอมแปลงเสียงนำไปใช้ในทางที่ผิด
Google เริ่มทยอยปล่อยอัปเดต Gemini 3.5 Live Translate ให้ใช้งานได้แล้วในหลายแพลตฟอร์ม
- สำหรับผู้ใช้ทั่วไป: สามารถใช้งานผ่านแอป Google Translate ทั้งบน Android และ iOS โดยมาพร้อมโหมด “Listening Mode” ใหม่ ให้ผู้ใช้ฟังเสียงแปลผ่านหูฟัง หรือแนบหูฟังเหมือนรับโทรศัพท์ได้โดยตรง
- สำหรับ Google Meet: ช่วยให้การประชุมออนไลน์ข้ามภาษาเป็นเรื่องง่าย รองรับการแปลได้มากกว่า 2,000 คู่ภาษา (อัปเกรดจากเดิมที่แปลได้เพียง 5 ภาษา) เริ่มต้นใช้งานในกลุ่มธุรกิจผ่าน Workspace ในเดือนนี้
- สำหรับนักพัฒนา: สามารถเข้าถึงผ่าน Gemini Live API และ Google AI Studio เพื่อนำไปประยุกต์ใช้ในแอปพลิเคชันต่างๆ เช่น ระบบแปลภาษาสำหรับ Grab หรือแพลตฟอร์มการสื่อสารอื่นๆ ได้
อ้างอิง และ cover Google Blog
อ่านบทความและข่าวอื่นๆเพิ่มเติมได้ที่ it24hrs.com
เปิดตัว Gemini 3.5 Live Translate แปลภาษาแบบพูดโต้ตอบเกือบเรียลไทม์และเป็นธรรมชาติกว่าเดิม
อย่าลืมกดติดตามอัพเดตข่าวสาร ทิปเทคนิคดีๆกันนะคะ Please follow us
Youtube it24hrs
Twitter it24hrs
Tiktok it24hrs
facebook it24hrs
