NVIDIAModel

NVIDIA เปิดตัว Nemotron 3 Super: โมเดล AI แบบเปิดสำหรับ Agentic AI

เขียนโดย

ร่างเนื้อหาด้วย AI ตรวจทานและแก้ไขโดยคน

อ่าน ~8 นาที

NVIDIA เปิดตัว Nemotron 3 Super: โมเดล AI แบบเปิดสำหรับ Agentic AI

ข่าวดีสำหรับวงการ AI! NVIDIA เพิ่งเปิดตัวโมเดลใหม่ล่าสุดที่ชื่อว่า NVIDIA Nemotron 3 Super เป็นโมเดล AI แบบเปิด (open model) ที่ถูกออกแบบมาเพื่อพลิกโฉมโลกของ "Agentic AI" โดยเฉพาะเลย ตัวนี้มาพร้อมกับพารามิเตอร์ถึง 120 พันล้านตัว และมีจุดเด่นคือสามารถจัดการงานที่ซับซ้อนของระบบ Agentic AI ได้อย่างมีประสิทธิภาพและแม่นยำสูง ที่สำคัญคือมันให้ปริมาณงาน (throughput) สูงขึ้นถึง 5 เท่า และแม่นยำขึ้น 2 เท่า เมื่อเทียบกับ Nemotron Super รุ่นก่อนหน้า แถมยังมาพร้อมหน้าต่างบริบท (context window) ขนาดใหญ่ถึง 1 ล้านโทเค็น ที่จะช่วยแก้ปัญหา "บริบทล้น" และ "ภาษีการคิด" ในเวิร์กโฟลว์แบบ multi-agent ที่เราเจออยู่บ่อยๆ

Nemotron 3 Super คืออะไร และทำไมต้องสนใจ?

ลองจินตนาการถึง AI ที่ไม่ได้แค่ตอบคำถามเรา แต่สามารถทำงานหลายๆ อย่างต่อเนื่องกันได้เหมือนผู้ช่วยส่วนตัวที่ฉลาดมากๆ นั่นแหละคือแนวคิดของ Agentic AI ที่กำลังจะมาเปลี่ยนโลก Nemotron 3 Super เป็นหัวใจสำคัญในการทำให้ Agentic AI เหล่านี้ทำงานได้อย่างมีประสิทธิภาพ NVIDIA ออกแบบโมเดลนี้มาเป็นพิเศษสำหรับ NVIDIA Blackwell ซึ่งเป็นแพลตฟอร์มที่ทรงพลังสุดๆ

ทำไม Nemotron 3 Super ถึงน่าสนใจ? อย่างแรกเลยคือมันเป็นโมเดลแบบไฮบริด (hybrid mixture-of-experts หรือ MoE) ที่มีพารามิเตอร์รวม 120 พันล้านตัว แต่จะมีพารามิเตอร์ที่ทำงานจริงเพียง 12 พันล้านตัวเท่านั้น ทำให้มีประสิทธิภาพสูงขึ้นมาก สิ่งที่เจ๋งอีกอย่างคือมันมาพร้อมหน้าต่างบริบทกว้างถึง 1 ล้านโทเค็น ซึ่งเป็นเรื่องใหญ่มากๆ สำหรับ Agentic AI ที่มักจะต้องจำข้อมูลจำนวนมหาศาลตลอดการทำงาน หน้าต่างบริบทที่ใหญ่ขนาดนี้ช่วยให้ Agent เก็บข้อมูลสถานะของเวิร์กโฟลว์ทั้งหมดไว้ในหน่วยความจำได้ ทำให้ไม่หลงประเด็น (goal drift) และลด "ภาษีการคิด" (thinking tax) ที่เกิดจากการประมวลผลโมเดลขนาดใหญ่ซ้ำๆ ในทุกขั้นตอนของงานที่ซับซ้อน ใครอยากรู้รายละเอียดเพิ่มเติม สามารถอ่านบทความประกาศอย่างเป็นทางการได้ที่ NVIDIA Blog Announcement

ความลับเบื้องหลังประสิทธิภาพระดับ Super

Nemotron 3 Super ไม่ได้แค่ใหญ่ แต่ยังฉลาดสุดๆ ด้วยสถาปัตยกรรมไฮบริดที่รวมเอาสามนวัตกรรมหลักเข้าไว้ด้วยกัน:

  1. สถาปัตยกรรมไฮบริด: ใช้ทั้ง Mamba layers เพื่อเพิ่มประสิทธิภาพการใช้หน่วยความจำและการประมวลผลได้ถึง 4 เท่า และใช้ transformer layers เพื่อการให้เหตุผลที่ซับซ้อนขึ้น
  2. Latent MoE: เทคนิคใหม่ที่ช่วยเพิ่มความแม่นยำโดยการเปิดใช้งาน "ผู้เชี่ยวชาญ" 4 คนพร้อมกัน แต่ใช้ต้นทุนเท่ากับ 1 คนเท่านั้น เพื่อสร้างโทเค็นถัดไปในการอนุมาน (inference)
  3. Multi-Token Prediction: สามารถทำนายคำในอนาคตได้หลายคำพร้อมกัน ทำให้การอนุมานเร็วขึ้นถึง 3 เท่า

นอกจากนี้ เมื่อรันบนแพลตฟอร์ม NVIDIA Blackwell โมเดลนี้ยังใช้ความแม่นยำแบบ NVFP4 ซึ่งช่วยลดความต้องการหน่วยความจำ และเร่งความเร็วการอนุมานได้ถึง 4 เท่าเมื่อเทียบกับ FP8 บน NVIDIA Hopper โดยไม่ลดทอนความแม่นยำเลย

ไม่น่าแปลกใจที่ Nemotron 3 Super ได้รับการจัดอันดับให้เป็นอันดับหนึ่งใน Artificial Analysis ในด้านประสิทธิภาพและความเปิดกว้าง พร้อมความแม่นยำที่โดดเด่นในบรรดาโมเดลขนาดเดียวกัน นอกจากนี้ ยังเป็นขุมพลังให้ Agent วิจัย NVIDIA AI-Q ขึ้นแท่นอันดับ 1 ใน DeepResearch Bench และ DeepResearch Bench II ซึ่งเป็นเกณฑ์มาตรฐานที่ใช้วัดความสามารถของระบบ AI ในการวิจัยที่ครอบคลุมหลายขั้นตอนจากเอกสารจำนวนมาก ลองเข้าไปดูอันดับได้ที่ DeepResearch Bench II Leaderboard

ใช้งานได้จริงในโลกธุรกิจ

Nemotron 3 Super ถูกออกแบบมาเพื่อจัดการกับงานย่อยที่ซับซ้อนภายในระบบ multi-agent ในหลากหลายอุตสาหกรรม บริษัทชั้นนำหลายแห่งเริ่มนำไปใช้งานแล้ว เช่น:

  • Perplexity: ให้ผู้ใช้เข้าถึง Nemotron 3 Super สำหรับการค้นหาข้อมูล และเป็นหนึ่งใน 20 โมเดลที่ทำงานร่วมกันใน Computer
  • CodeRabbit และ Greptile: นำไปใช้เป็น AI agent สำหรับการพัฒนาซอฟต์แวร์ เพื่อเพิ่มความแม่นยำและลดต้นทุน
  • Edison Scientific และ Lila Sciences: ใช้ในการค้นหาวรรณกรรมเชิงลึก, วิทยาศาสตร์ข้อมูล และความเข้าใจระดับโมเลกุลในกลุ่มวิทยาศาสตร์ชีวภาพ
  • Amdocs, Palantir, Cadence, Dassault Systèmes และ Siemens: กำลังนำโมเดลนี้ไปปรับใช้และปรับแต่งเพื่อทำให้เวิร์กโฟลว์ต่างๆ ในอุตสาหกรรมโทรคมนาคม, ความปลอดภัยทางไซเบอร์, การออกแบบเซมิคอนดักเตอร์ และการผลิตเป็นระบบอัตโนมัติ

ลองคิดดูสิว่า AI Agent สำหรับการพัฒนาซอฟต์แวร์สามารถโหลดโค้ดเบสทั้งหมดเข้ามาในบริบทได้พร้อมกัน ทำให้สามารถสร้างและดีบักโค้ดแบบครบวงจรโดยไม่ต้องแบ่งเอกสาร หรือในการวิเคราะห์ทางการเงิน มันสามารถโหลดรายงานหลายพันหน้าเข้าสู่หน่วยความจำได้ ทำให้ไม่ต้องคิดซ้ำๆ ในการสนทนาที่ยาวนาน ซึ่งช่วยเพิ่มประสิทธิภาพได้มหาศาล สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโมเดลพื้นฐานของ Nemotron สามารถดูได้ที่ NVIDIA Nemotron Foundation Models

เปิดกว้างสำหรับนักพัฒนา

สิ่งที่น่าตื่นเต้นที่สุดคือ NVIDIA ปล่อย Nemotron 3 Super ด้วย open weights ภายใต้ไลเซนส์ที่เปิดกว้างมากๆ นั่นหมายความว่านักพัฒนาทุกคนสามารถนำไปปรับใช้และปรับแต่งได้ ไม่ว่าจะบนเวิร์กสเตชัน, ในศูนย์ข้อมูล หรือบนคลาวด์

NVIDIA ยังใจดีถึงขั้นเผยแพร่ระเบียบวิธีที่ใช้ในการฝึกโมเดลทั้งหมด รวมถึงชุดข้อมูลการฝึกก่อนและหลังการฝึกกว่า 10 ล้านล้านโทเค็น, สภาพแวดล้อมการฝึก 15 แบบสำหรับการเรียนรู้แบบเสริมกำลัง (reinforcement learning) และสูตรการประเมินผล ซึ่งทั้งหมดนี้จะช่วยให้นักวิจัยและนักพัฒนาสามารถปรับแต่งโมเดล หรือสร้างโมเดลของตัวเองต่อยอดจาก Nemotron 3 Super ได้ง่ายขึ้นมากๆ ใครสนใจอยากลองนำไปใช้ สามารถเข้าไปดาวน์โหลดโมเดลได้เลยที่ Get Nemotron 3 Super Model

Nemotron 3 Super ไม่ได้เป็นแค่โมเดล AI ใหม่ แต่มันคือประตูบานใหม่สู่ยุคของ Agentic AI ที่จะเปลี่ยนวิธีการทำงานและสร้างสรรค์สิ่งต่างๆ ของเราให้มีประสิทธิภาพและฉลาดล้ำยิ่งขึ้น

อ่านต่อ: อยากรู้รายละเอียดเชิงลึกเพิ่มเติมเกี่ยวกับ NVIDIA Nemotron 3 Super เข้าไปอ่านบล็อกโพสต์ฉบับเต็มได้เลย ที่นี่

Anthropic อัปเกรด Claude Opus เป็น 4.8 เพิ่มประสิทธิภาพ Benchmark และการทำงานร่วมกัน

Anthropic อัปเกรด Claude Opus เป็น 4.8 เพิ่มประสิทธิภาพ Benchmark และการทำงานร่วมกัน

Anthropic เปิดตัว Claude Opus 4.8 เวอร์ชันใหม่ที่ปรับปรุงประสิทธิภาพ Benchmark, ความน่าเชื่อถือของงาน Agentic และความเร็วในการประมวลผล โดยมีราคาเท่าเดิม

อ่านข่าวนี้

อยากให้แจ้งเตือน ตอน Newsletter เปิดตัวมั้ย?

เรากำลังวัดความสนใจก่อนเปิด weekly AI digest จริงๆ ใส่ email ไว้ เราจะ email ไปบอกตอนเปิดตัว — ส่งครั้งเดียว ไม่มี spam

เราใช้ email เฉพาะเพื่อแจ้งเปิดตัว newsletter เท่านั้น ไม่มี spam — อ่าน นโยบายความเป็นส่วนตัว