AI อะไรเนี่ย

Tools

Gemini API รองรับไฟล์ขนาดใหญ่ขึ้นและแหล่งอินพุตที่หลากหลายขึ้น

Gemini API รองรับไฟล์ขนาดใหญ่ขึ้นและแหล่งอินพุตที่หลากหลายขึ้น

ข่าวดีสำหรับนักพัฒนา — Google ปรับวิธีส่งไฟล์เข้า Gemini API ครั้งใหญ่ ทั้งเพิ่มเพดานไฟล์ inline และเปิดให้ชี้ไปที่ไฟล์ที่มีอยู่แล้วบนคลาวด์ได้โดยตรง

ไว้ทำอะไร
อัปเดตนี้เน้นเรื่อง “เอาข้อมูลเข้าโมเดล” ให้สะดวกขึ้น:

  • External URL (public / signed): ส่งลิงก์ไฟล์ที่เปิดได้บนเว็บ หรือ signed URL จากที่เก็บส่วนตัวอย่าง S3 / Azure Blob Storage ให้ Gemini ดึงไปอ่านเองได้เลย
  • ไฟล์บน Google Cloud Storage (GCS): ถ้าเก็บข้อมูลไว้บน GCS อยู่แล้ว สามารถ register URI ของไฟล์กับ Files API ไว้ครั้งเดียว แล้วเรียกใช้ซ้ำในหลาย ๆ request ได้ ไม่ต้องย้ายไฟล์ไปมา
  • เพิ่มเพดาน inline เป็น 100MB: สำหรับงาน prototyping หรือ real-time ตอนนี้ส่งไฟล์แบบ inline ได้สูงสุด 100MB เหมาะกับรูปใหญ่ ๆ ออดิโอสั้น ๆ หรือเอกสารยาวขึ้นใน request เดียว

ทำไมต้องสนใจ
ก่อนหน้านี้ถ้าใช้ไฟล์ใหญ่ ๆ ต้องอัปโหลดผ่าน Files API และไฟล์จะอยู่ได้แค่ 48 ชั่วโมง เหมาะกับเดโมแต่ไม่ค่อยสะดวกกับงาน production ที่ต้องพึ่งข้อมูลชุดเดิมตลอดเวลา ตอนนี้คุณเก็บไฟล์ไว้ใน storage เดิม แล้วให้ Gemini ไปอ่านตอนรันงานได้เลย ลดขั้นตอนอัปโหลดซ้ำ ๆ

เพดาน inline ที่สูงขึ้นก็ช่วยให้ลองไอเดียได้เร็วขึ้น ไม่ต้องเปิดบัคเก็ตหรือระบบเก็บไฟล์ก่อน อยากลอง prompt แบบ multimodal หนัก ๆ ก็แค่ส่งไฟล์ใหญ่ขึ้นได้ทันที แล้วค่อยย้ายไปใช้ GCS หรือ URL เมื่อจะ scale จริงจัง

ใช้ได้ที่ไหน / ลองได้ยังไง
ใช้ผ่าน SDK หรือ REST ของ Gemini เวอร์ชันล่าสุดได้เลย:

  • ส่งไฟล์ผ่าน public / signed URL เป็น input ให้โมเดล
  • register URI ของไฟล์บน GCS กับ Files API แล้วอ้างอิงตามชื่อ
  • ส่งไฟล์แบบ base64 inline ได้สูงสุด 100MB ตามชนิดไฟล์ที่รองรับ

รายละเอียดเรื่องชนิดไฟล์ ขนาด และการตั้งค่า auth สำหรับ GCS ดูได้ใน เอกสาร Gemini API

ลองได้ที่: ข่าว Increased file size limits และ expanded inputs ของ Gemini API — แล้วตามคู่มือใน เอกสาร Gemini API เพื่อเริ่มส่งไฟล์ใหญ่และ URL เข้าโมเดล