AI อะไรเนี่ย

Model

NVIDIA เปิดตัว Nemotron 3 Super: โมเดล AI แบบเปิดสำหรับ Agentic AI

NVIDIA เปิดตัว Nemotron 3 Super: โมเดล AI แบบเปิดสำหรับ Agentic AI

ข่าวดีสำหรับวงการ AI! NVIDIA เพิ่งเปิดตัวโมเดลใหม่ล่าสุดที่ชื่อว่า NVIDIA Nemotron 3 Super เป็นโมเดล AI แบบเปิด (open model) ที่ถูกออกแบบมาเพื่อพลิกโฉมโลกของ "Agentic AI" โดยเฉพาะเลย ตัวนี้มาพร้อมกับพารามิเตอร์ถึง 120 พันล้านตัว และมีจุดเด่นคือสามารถจัดการงานที่ซับซ้อนของระบบ Agentic AI ได้อย่างมีประสิทธิภาพและแม่นยำสูง ที่สำคัญคือมันให้ปริมาณงาน (throughput) สูงขึ้นถึง 5 เท่า และแม่นยำขึ้น 2 เท่า เมื่อเทียบกับ Nemotron Super รุ่นก่อนหน้า แถมยังมาพร้อมหน้าต่างบริบท (context window) ขนาดใหญ่ถึง 1 ล้านโทเค็น ที่จะช่วยแก้ปัญหา "บริบทล้น" และ "ภาษีการคิด" ในเวิร์กโฟลว์แบบ multi-agent ที่เราเจออยู่บ่อยๆ

Nemotron 3 Super คืออะไร และทำไมต้องสนใจ?

ลองจินตนาการถึง AI ที่ไม่ได้แค่ตอบคำถามเรา แต่สามารถทำงานหลายๆ อย่างต่อเนื่องกันได้เหมือนผู้ช่วยส่วนตัวที่ฉลาดมากๆ นั่นแหละคือแนวคิดของ Agentic AI ที่กำลังจะมาเปลี่ยนโลก Nemotron 3 Super เป็นหัวใจสำคัญในการทำให้ Agentic AI เหล่านี้ทำงานได้อย่างมีประสิทธิภาพ NVIDIA ออกแบบโมเดลนี้มาเป็นพิเศษสำหรับ NVIDIA Blackwell ซึ่งเป็นแพลตฟอร์มที่ทรงพลังสุดๆ

ทำไม Nemotron 3 Super ถึงน่าสนใจ? อย่างแรกเลยคือมันเป็นโมเดลแบบไฮบริด (hybrid mixture-of-experts หรือ MoE) ที่มีพารามิเตอร์รวม 120 พันล้านตัว แต่จะมีพารามิเตอร์ที่ทำงานจริงเพียง 12 พันล้านตัวเท่านั้น ทำให้มีประสิทธิภาพสูงขึ้นมาก สิ่งที่เจ๋งอีกอย่างคือมันมาพร้อมหน้าต่างบริบทกว้างถึง 1 ล้านโทเค็น ซึ่งเป็นเรื่องใหญ่มากๆ สำหรับ Agentic AI ที่มักจะต้องจำข้อมูลจำนวนมหาศาลตลอดการทำงาน หน้าต่างบริบทที่ใหญ่ขนาดนี้ช่วยให้ Agent เก็บข้อมูลสถานะของเวิร์กโฟลว์ทั้งหมดไว้ในหน่วยความจำได้ ทำให้ไม่หลงประเด็น (goal drift) และลด "ภาษีการคิด" (thinking tax) ที่เกิดจากการประมวลผลโมเดลขนาดใหญ่ซ้ำๆ ในทุกขั้นตอนของงานที่ซับซ้อน ใครอยากรู้รายละเอียดเพิ่มเติม สามารถอ่านบทความประกาศอย่างเป็นทางการได้ที่ NVIDIA Blog Announcement

ความลับเบื้องหลังประสิทธิภาพระดับ Super

Nemotron 3 Super ไม่ได้แค่ใหญ่ แต่ยังฉลาดสุดๆ ด้วยสถาปัตยกรรมไฮบริดที่รวมเอาสามนวัตกรรมหลักเข้าไว้ด้วยกัน:

  1. สถาปัตยกรรมไฮบริด: ใช้ทั้ง Mamba layers เพื่อเพิ่มประสิทธิภาพการใช้หน่วยความจำและการประมวลผลได้ถึง 4 เท่า และใช้ transformer layers เพื่อการให้เหตุผลที่ซับซ้อนขึ้น
  2. Latent MoE: เทคนิคใหม่ที่ช่วยเพิ่มความแม่นยำโดยการเปิดใช้งาน "ผู้เชี่ยวชาญ" 4 คนพร้อมกัน แต่ใช้ต้นทุนเท่ากับ 1 คนเท่านั้น เพื่อสร้างโทเค็นถัดไปในการอนุมาน (inference)
  3. Multi-Token Prediction: สามารถทำนายคำในอนาคตได้หลายคำพร้อมกัน ทำให้การอนุมานเร็วขึ้นถึง 3 เท่า

นอกจากนี้ เมื่อรันบนแพลตฟอร์ม NVIDIA Blackwell โมเดลนี้ยังใช้ความแม่นยำแบบ NVFP4 ซึ่งช่วยลดความต้องการหน่วยความจำ และเร่งความเร็วการอนุมานได้ถึง 4 เท่าเมื่อเทียบกับ FP8 บน NVIDIA Hopper โดยไม่ลดทอนความแม่นยำเลย

ไม่น่าแปลกใจที่ Nemotron 3 Super ได้รับการจัดอันดับให้เป็นอันดับหนึ่งใน Artificial Analysis ในด้านประสิทธิภาพและความเปิดกว้าง พร้อมความแม่นยำที่โดดเด่นในบรรดาโมเดลขนาดเดียวกัน นอกจากนี้ ยังเป็นขุมพลังให้ Agent วิจัย NVIDIA AI-Q ขึ้นแท่นอันดับ 1 ใน DeepResearch Bench และ DeepResearch Bench II ซึ่งเป็นเกณฑ์มาตรฐานที่ใช้วัดความสามารถของระบบ AI ในการวิจัยที่ครอบคลุมหลายขั้นตอนจากเอกสารจำนวนมาก ลองเข้าไปดูอันดับได้ที่ DeepResearch Bench II Leaderboard

ใช้งานได้จริงในโลกธุรกิจ

Nemotron 3 Super ถูกออกแบบมาเพื่อจัดการกับงานย่อยที่ซับซ้อนภายในระบบ multi-agent ในหลากหลายอุตสาหกรรม บริษัทชั้นนำหลายแห่งเริ่มนำไปใช้งานแล้ว เช่น:

  • Perplexity: ให้ผู้ใช้เข้าถึง Nemotron 3 Super สำหรับการค้นหาข้อมูล และเป็นหนึ่งใน 20 โมเดลที่ทำงานร่วมกันใน Computer
  • CodeRabbit และ Greptile: นำไปใช้เป็น AI agent สำหรับการพัฒนาซอฟต์แวร์ เพื่อเพิ่มความแม่นยำและลดต้นทุน
  • Edison Scientific และ Lila Sciences: ใช้ในการค้นหาวรรณกรรมเชิงลึก, วิทยาศาสตร์ข้อมูล และความเข้าใจระดับโมเลกุลในกลุ่มวิทยาศาสตร์ชีวภาพ
  • Amdocs, Palantir, Cadence, Dassault Systèmes และ Siemens: กำลังนำโมเดลนี้ไปปรับใช้และปรับแต่งเพื่อทำให้เวิร์กโฟลว์ต่างๆ ในอุตสาหกรรมโทรคมนาคม, ความปลอดภัยทางไซเบอร์, การออกแบบเซมิคอนดักเตอร์ และการผลิตเป็นระบบอัตโนมัติ

ลองคิดดูสิว่า AI Agent สำหรับการพัฒนาซอฟต์แวร์สามารถโหลดโค้ดเบสทั้งหมดเข้ามาในบริบทได้พร้อมกัน ทำให้สามารถสร้างและดีบักโค้ดแบบครบวงจรโดยไม่ต้องแบ่งเอกสาร หรือในการวิเคราะห์ทางการเงิน มันสามารถโหลดรายงานหลายพันหน้าเข้าสู่หน่วยความจำได้ ทำให้ไม่ต้องคิดซ้ำๆ ในการสนทนาที่ยาวนาน ซึ่งช่วยเพิ่มประสิทธิภาพได้มหาศาล สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโมเดลพื้นฐานของ Nemotron สามารถดูได้ที่ NVIDIA Nemotron Foundation Models

เปิดกว้างสำหรับนักพัฒนา

สิ่งที่น่าตื่นเต้นที่สุดคือ NVIDIA ปล่อย Nemotron 3 Super ด้วย open weights ภายใต้ไลเซนส์ที่เปิดกว้างมากๆ นั่นหมายความว่านักพัฒนาทุกคนสามารถนำไปปรับใช้และปรับแต่งได้ ไม่ว่าจะบนเวิร์กสเตชัน, ในศูนย์ข้อมูล หรือบนคลาวด์

NVIDIA ยังใจดีถึงขั้นเผยแพร่ระเบียบวิธีที่ใช้ในการฝึกโมเดลทั้งหมด รวมถึงชุดข้อมูลการฝึกก่อนและหลังการฝึกกว่า 10 ล้านล้านโทเค็น, สภาพแวดล้อมการฝึก 15 แบบสำหรับการเรียนรู้แบบเสริมกำลัง (reinforcement learning) และสูตรการประเมินผล ซึ่งทั้งหมดนี้จะช่วยให้นักวิจัยและนักพัฒนาสามารถปรับแต่งโมเดล หรือสร้างโมเดลของตัวเองต่อยอดจาก Nemotron 3 Super ได้ง่ายขึ้นมากๆ ใครสนใจอยากลองนำไปใช้ สามารถเข้าไปดาวน์โหลดโมเดลได้เลยที่ Get Nemotron 3 Super Model

Nemotron 3 Super ไม่ได้เป็นแค่โมเดล AI ใหม่ แต่มันคือประตูบานใหม่สู่ยุคของ Agentic AI ที่จะเปลี่ยนวิธีการทำงานและสร้างสรรค์สิ่งต่างๆ ของเราให้มีประสิทธิภาพและฉลาดล้ำยิ่งขึ้น

อ่านต่อ: อยากรู้รายละเอียดเชิงลึกเพิ่มเติมเกี่ยวกับ NVIDIA Nemotron 3 Super เข้าไปอ่านบล็อกโพสต์ฉบับเต็มได้เลย ที่นี่