Google เปิดตัวโมเดลขนาดเล็กรุ่นใหม่ ‘เจมินาย 3.1 แฟลช ไลต์(Gemini 3.1 Flash Lite)’ ชูจุดเด่น ‘ความเร็วสูง’ ควบคู่ ‘ต้นทุนต่ำ’ เจาะกลุ่มบริษัทและนักพัฒนาที่ต้องรองรับทราฟฟิกปริมาณมหาศาล โดยเน้นงานที่ต้องประมวลผลบ่อยและจำนวนมาก เช่น ระบบแชต, โมเดอเรชันคอนเทนต์ และบริการเรียลไทม์ในระดับองค์กร
Google ให้บริการ ‘เจมินาย 3.1 แฟลช ไลต์’ ผ่าน ‘เจมินาย API’ โดยนักพัฒนาทั่วไปสามารถทดลองใช้งานในรูปแบบ Developer Preview ผ่าน Google AI สตูดิโอ(Google AI Studio) ส่วนลูกค้าองค์กรจะเข้าถึงได้ผ่าน แพลตฟอร์ม Vertex AI(เวอร์เท็กซ์ AI) บริษัทระบุว่าโมเดลใหม่นี้ถูกจัดวางให้เป็นรุ่นที่ ‘เร็วที่สุดและคุ้มค่าที่สุด’ ในตระกูล ‘เจมินาย 3(Gemini 3)’ ออกแบบมาสำหรับงาน ‘ความถี่สูง·ปริมาณมาก’ ที่ตัวแปรหลักคือ ‘เวลาแฝง(latency)’ และ ‘ต้นทุนการรัน’
ด้านราคา Google เริ่มคิดค่าบริการที่ ‘100 ล้านโทเคน’ โดยอัตราเริ่มต้นอยู่ที่ ‘อินพุต 0.25 ดอลลาร์’ (ประมาณ 370 บาท) ต่อ 1 ล้านโทเคน และ ‘เอาต์พุต 1.50 ดอลลาร์’ (ประมาณ 2,217 บาท) ต่อ 1 ล้านโทเคน อยู่ในโซนต้นทุนที่ต่ำที่สุดกลุ่มหนึ่งของไลน์อัปโมเดล AI จาก Google เอง ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับทีมที่ต้องการกด ‘ต้นทุนการอนุมาน(inference cost)’ ซึ่งเป็นส่วนสำคัญของ ‘TCO’ ในบริการขนาดใหญ่
ด้านประสิทธิภาพ Google เปิดเผยผลเบนช์มาร์กว่า ‘เจมินาย 3.1 แฟลช ไลต์’ ให้ค่า ‘time to first answer token’ หรือเวลาส่งโทเคนคำตอบตัวแรก ‘เร็วขึ้นราว 2.5 เท่า’ เมื่อเทียบกับ ‘เจมินาย 2.5 แฟลช(Gemini 2.5 Flash)’ ส่วนความเร็วในการสร้างเอาต์พุตโดยรวม ‘เพิ่มขึ้นราว 45%’ ขณะเดียวกันด้านคุณภาพการตอบยังคง ‘ใกล้เคียงหรือดีกว่าเดิม’ จุดขายสำคัญอยู่ที่การลดดีเลย์ของโทเคนแรก ซึ่งส่งผลโดยตรงต่อความรู้สึกใช้งานในบริการแชตและแอปโต้ตอบ พร้อมเพิ่ม throughput สำหรับคำตอบยาวในเวลาเดียวกัน
เพื่อชูจุดแข็งในสมรภูมิโมเดลเบา Google ยังเปิดเผยตัวเลขเทียบกับคู่แข่ง ‘อย่างเป็นรูปธรรม’ ด้วย โดยระบุว่า ‘เจมินาย 3.1 แฟลช ไลต์’ ทำคะแนน Elo ที่ 1,432 บนกระดานจัดอันดับ Arena AI ส่วนด้านความสามารถการให้เหตุผลเชิงวิชาการ โมเดลทำได้ ‘86.9%’ บนเบนช์มาร์ก GPQA Diamond และ ‘76.8%’ บน MMMU Pro ซึ่งเป็นชุดทดสอบความสามารถ ‘มัลติโหมดัล(multimodal)’ ในระดับสูง ‘ความคิดเห็น’ สำหรับฝั่งองค์กร ตัวเลขเหล่านี้ส่งสัญญาณว่าโมเดลไม่ได้เป็นเพียงตัวเลือก ‘ราคาถูก’ แต่สามารถรักษาคุณภาพในระดับใช้งานจริงได้ ช่วยลดกำแพงความกังวลเรื่องคุณภาพเมื่อเทียบกับโมเดลใหญ่ราคาแพง
Google ชี้ว่า ‘เจมินาย 3.1 แฟลช ไลต์’ ถูกออกแบบโดยตั้งต้นจากงานที่มี ‘ความถี่ใช้งานสูง’ เช่น ‘การแปลภาษา’, ‘โมเดอเรชันเนื้อหา’, งาน ‘ปฏิบัติตามคำสั่งในระดับใหญ่(instruction following)’ สำหรับระบบหลังบ้านของนักพัฒนา นอกจากนี้ยังรองรับเวิร์กโฟลว์ที่ซับซ้อนขึ้น เช่น การสร้าง UI และองค์ประกอบอินเทอร์เฟซ, การสร้างซิมูเลชัน และการจัดการ ‘ข้อมูลเชิงโครงสร้าง(structured data)’ ให้ทำงานร่วมกับระบบเดิมในองค์กรได้
ควบคู่กับการเปิดตัวโมเดลใหม่ Google ยังเพิ่มฟีเจอร์ ‘ปรับระดับการคิด(thinking level)’ ในทั้ง Google AI สตูดิโอและ เวอร์เท็กซ์ AI โดยเปิดให้นักพัฒนาปรับ ‘ปริมาณการให้เหตุผล’ ของโมเดลตามระดับความยากของงาน เพื่อจูนสมดุลระหว่าง ‘ต้นทุน’, ‘ความเร็ว’ และ ‘ความแม่นยำ’ ได้ละเอียดขึ้น ‘ความคิดเห็น’ ฟีเจอร์นี้สะท้อนแนวโน้มใหม่ของตลาด ที่โมเดลไม่ได้ถูกมองแค่เป็นกล่องดำประสิทธิภาพสูง แต่ต้องเป็นเครื่องมือที่ ‘ปรับจูนการใช้ทรัพยากรได้ตามบริบทงานจริง’
ในมุมมองตลาด ขณะที่ ‘AI สร้างสรรค์(Generative AI)’ กำลังขยับจาก ‘ระยะทดลอง(proof-of-concept)’ เข้าสู่ ‘ระยะปฏิบัติการจริง(production)’ โฟกัสจึงย้ายจากแค่ ‘คะแนนเบนช์มาร์ก’ ไปสู่ ‘ต้นทุนต่อคำตอบ’ และ ‘เวลาแฝงต่อคำขอ’ การเปิดตัว ‘เจมินาย 3.1 แฟลช ไลต์’ จึงถูกมองว่าเป็นหมากสำคัญของ Google ในการเสนอ ‘โมเดลความเร็วสูง ต้นทุนต่ำ’ ที่ออกแบบมาสำหรับสิ่งแวดล้อมที่มีทราฟฟิกหนาแน่นและต้องการความเสถียรในระดับอินฟราสตรักเจอร์ขององค์กรโดยเฉพาะ
ความคิดเห็น 0