เมื่อสัปดาห์ที่ผ่านมา Google เปิดตัว Gemini 2.5 Flash Image โมเดล AI ล่าสุดในตระกูล Gemini ที่สามารถ สร้างและแก้ไขภาพด้วยคำสั่งภาษาเดียว ได้อย่างแม่นยำ พร้อมทั้งสามารถผสานภาพหลายภาพ และรักษาความคงที่ของตัวละครในแต่ละฉาก นับเป็นก้าวสำคัญของเทคโนโลยี Generative AI ที่เหนือกว่าการสร้างภาพแบบเดิมอย่างชัดเจน
ความสามารถเด่นของ Gemini 2.5 Flash Image
- Prompt-based image editing สามารถแก้ไขภาพอย่างละเอียด เช่น ลบสิ่งไม่ต้องการ เปลี่ยนพื้นหลัง ปรับท่าทาง หรือให้โทนสีใหม่ด้วยข้อความเดียว
- Multi-image fusion ผสานภาพหลายภาพเข้าด้วยกันแบบ Real-time เช่น ย้ายวัตถุจากภาพหนึ่งไปยังอีกภาพ ให้ลุคภาพเดียวที่สมจริง
- Character & style consistency โมเดลสามารถรักษาความเหมือนของตัวละครในภาพแม้ปรับท่าทางหรือสไตล์ เช่น เปลี่ยนเสื้อผ้าหรือฉาก แต่ยังจำได้ว่าเป็นตัวเดิม
- รองรับ Prompt Editing และ AI Studio Integration เป็นส่วนหนึ่งของ Google AI Studio และ Vertex AI พร้อมฟีเจอร์รีมิกซ์และ deploy ได้ทันที
- Transparent Watermark via SynthID ภาพที่สร้างหรือแก้ด้วยโมเดลนี้จะมี SynthID ซ่อนแบบดิจิทัล และมี watermark เพื่อยืนยันว่าเป็นภาพ AI-generated
สถานะ และการเข้าถึง
Gemini 2.5 Flash และ Pro พร้อมใช้งานทั่วไปแล้ว ส่วนรุ่น Lite ที่เน้นความเร็วและความคุ้มค่าสำหรับงานเบื้องต้นก็เปิดตัวแล้วเช่นกัน โดยมีราคาเฉลี่ยไม่แพง (ประมาณ $0.10/ล้านโทเค็นอินพุต) นอกจากนี้ ยังเปิดโอกาสให้นักพัฒนาเข้าถึงผ่าน Vertex AI และ AI Studio ในโหมด Preview
กระแสตอบรับจากผู้ใช้ และดีไซเนอร์
- Adobe Firefly & Adobe Express ได้นำ Gemini 2.5 Flash Image มารวมใน Text-to-Image Module ช่วยให้สร้างภาพ และปรับแต่งข้ามแอปได้อย่างลื่นไหล
- ผู้ใช้ Reddit รายงานว่า โมเดลนี้มีคุณภาพโดดเด่น กว่ารุ่นก่อนอย่างมาก และง่ายต่อการใช้เพื่อสร้างสรรค์ภาพต่าง ๆ
ประโยชน์ต่อธุรกิจ และองค์กรไทย
- ฟรีแลนซ์/เอเจนซีโฆษณา เมื่อสามารถสร้างภาพโฆษณาจากคำสั่งเดียว ตอบโจทย์การปรับคอนเทนต์เร็วลงและประหยัดค่าออกแบบ
- อีคอมเมิร์ซ สร้างภาพสินค้าหลายซีนในฉากเดียว เพิ่ม engagement โดยไม่ต้องเซ็ตสตูดิโอใหม่
- องค์กรการศึกษา/สตาร์ทอัพ พัฒนาดีไซน์แบบอัตโนมัติ ใช้ร่วมกับระบบ e-learning หรือแอปต้นแบบได้ง่าย
- บริษัทที่ใช้บริการ Cloud หากต้องการใช้กับระบบของตน สามารถรันผ่าน Vertex AI ซึ่งรองรับ Multi-modal generation
ด้านเทคนิค-การใช้งานจริงใน Vertex AI
ผ่าน Vertex AI นักพัฒนาสามารถใช้โมเดลนี้สร้างและแก้ภาพด้วย prompt, รองรับ multi-image, และ deploy ผ่าน API ได้ทันที พร้อมการควบคุมการใช้งานด้วย “thinking budgets” ที่ปรับสมดุลระหว่างคุณภาพ/ความเร็ว/ต้นทุน
สรุป
Gemini 2.5 Flash Image คือก้าวสำคัญของ Generative AI ที่มาพร้อมทั้งความเร็ว ความแม่นยำ และการรักษา Identity ในภาพ เหมาะสำหรับหลากหลายอุตสาหกรรม โดยเฉพาะเมื่อใช้งานผ่าน Vertex AI และ AI Studio ของ Google
หากธุรกิจหรือองค์กรไทยต้องการเริ่มต้นใช้งานระบบ AI สร้างภาพที่ทรงพลัง ตัวนี้คือจุดเริ่มต้นที่น่าสนใจและควรจับตาเป็นอย่างยิ่ง
สอบรายละเอียดเพิ่มเติม
- 02-120-9636
- [email protected]
- Line Official : @THAIDATAHOSTING