Voxtral โมเดลฟัง-เข้าใจเสียงสุดล้ำจาก Mistral AI


Voxtral โมเดลฟัง-เข้าใจเสียงสุดล้ำจาก Mistral AI


สายทำคอนเทนต์ สายเทคฯ ห้ามพลาด! Mistral AI เปิดตัว Voxtral โมเดลสุดล้ำที่ทั้งถอดเสียงและเข้าใจบริบทได้ในตัวเดียว ไม่ต้องต่อโมเดลเพิ่มให้วุ่น มีให้เลือก 2 ไซซ์-เล็ก 3B และใหญ่จัดเต็ม 24B ใช้ได้ฟรีแบบโอเพ่นซอร์สภายใต้ลิขสิทธิ์ Apache 2.0

จุดเด่นคือรองรับไฟล์เสียงยาวถึง 40 นาที แถมสรุปเนื้อหา-ถามตอบในตัว รองรับหลายภาษาทั้งอังกฤษ สเปน ฝรั่งเศส เยอรมัน ยันฮินดี! และที่เด็ดสุดคือประสิทธิภาพเหนือกว่า Whisper large-v3 แบบชัดเจน แถมยังชน GPT-4o mini กับ Gemini 2.5 Flash ได้ทุกสนาม

ราคาก็เร้าใจสุด ๆ เริ่มต้นเพียง 0.001 ดอลลาร์ต่อนาที หรือแค่ประมาณ 0.037 บาท ถูกกว่า Whisper และ ElevenLabs เกือบครึ่ง งานนี้ทั้งมือใหม่และโปรฯ เอาไปรันเองก็ได้ โหลดจาก Hugging Face หรือจะใช้ผ่าน API ก็สะดวก

ใครสายเสียง-สายสื่อ-สาย AI นี่แหละของจริงที่ต้องจับตา Mistral เค้าคอนเฟิร์มแล้วว่าฟีเจอร์ใหม่ยังมาอีกเพียบ งานนี้ประเทศไทยไม่ลองไม่ได้แล้ว!


เครดิต :
เครดิต : ที่นี่ดอทคอม ทันทุกเรื่องฮิต


ข่าวดารา ข่าวในกระแส บน Facebook อัพเดตไว เร็วทันใจ คลิกที่นี่!!
กระทู้เด็ดน่าแชร์