AI อะไรเนี่ย

Tools

AWS Nova Forge: สร้าง AI เฉพาะทางโดยไม่สูญเสียความสามารถทั่วไป

AWS Nova Forge: สร้าง AI เฉพาะทางโดยไม่สูญเสียความสามารถทั่วไป

โมเดลภาษาขนาดใหญ่ (LLMs) เก่งเรื่องงานทั่วไปก็จริง แต่พอต้องมาเจองานที่ต้องใช้ข้อมูลเฉพาะทางขององค์กรจริงๆ อย่างกระบวนการภายใน หรือศัพท์เฉพาะอุตสาหกรรม กลับเจอปัญหาบ่อยๆ เลยนะ การปรับแต่งโมเดลด้วย Supervised Fine-Tuning (SFT) ช่วยให้ LLMs เข้าใจบริบทเหล่านี้ได้ดีขึ้น แต่ก็มีข้อเสียใหญ่ๆ ที่เรียกว่า "Catastrophic Forgetting" หรือการที่โมเดล "ลืม" ความรู้เก่าๆ ไปหมดเลย พอเรียนรู้สิ่งใหม่ที่เฉพาะเจาะจง โมเดลก็จะเสียความสามารถทั่วไป เช่น การทำตามคำสั่ง การให้เหตุผล หรือความรู้กว้างๆ ที่เคยมีไป

Nova Forge คืออะไร?

AWS เข้าใจปัญหานี้ดี เลยเปิดตัว Amazon Nova Forge ซึ่งเป็นบริการใหม่ที่จะเข้ามาช่วยจัดการเรื่องนี้! Nova Forge ช่วยให้คุณสร้างโมเดล AI ขั้นสูงของคุณเองได้โดยใช้เทคโนโลยี Amazon Nova

ลูกค้าที่ใช้ Nova Forge สามารถเริ่มต้นพัฒนาโมเดลได้ตั้งแต่ "checkpoint" เริ่มต้น ผสมผสานข้อมูลเฉพาะขององค์กรเข้ากับชุดข้อมูลการฝึกฝนที่ Amazon Nova จัดเตรียมมาให้อย่างดี และที่สำคัญคือ โฮสต์โมเดลที่ปรับแต่งเองได้อย่างปลอดภัยบน AWS การทำแบบนี้จะช่วยให้โมเดลของเรามีความเชี่ยวชาญเฉพาะทาง โดยไม่ลืมความรู้พื้นฐานที่จำเป็นไปนะ เหมือนกับการที่เราเรียนรู้เรื่องใหม่ๆ โดยที่ไม่ทิ้งความรู้เก่าที่เรามีอยู่เลย

ทำอะไรได้บ้าง?

ทีม AWS China Applied Science ได้ทำการประเมิน Nova Forge อย่างละเอียด และผลลัพธ์ที่ได้ก็น่าทึ่งมากๆ! พวกเขาใช้ภารกิจการจำแนกข้อมูล Voice of Customer (VOC) ที่ค่อนข้างท้าทาย โดยมีตัวอย่างคอมเมนต์จากลูกค้ากว่า 16,000 ตัวอย่าง ซึ่งต้องจำแนกตามลำดับชั้นถึง 4 ระดับ (มีหมวดหมู่ย่อยถึง 1,420 หมวดหมู่)

ผลการทดลองแสดงให้เห็นว่าแนวทางการผสมข้อมูลของ Nova Forge ให้ประโยชน์ 2 ข้อหลักๆ:

  • เพิ่มประสิทธิภาพในงานเฉพาะด้าน: โมเดลทำคะแนน F1 score เพิ่มขึ้นถึง 17% ในงานจำแนกข้อมูลเฉพาะทาง
  • รักษาความสามารถทั่วไป: โมเดลยังคงรักษาคะแนน MMLU (Massive Multitask Language Understanding) และความสามารถในการทำตามคำสั่งไว้ได้ใกล้เคียงกับค่าเริ่มต้น หลังจากทำการ Fine-tuning แล้ว

นี่เป็นข้อพิสูจน์ว่า Nova Forge ช่วยให้องค์กรต่างๆ สามารถสร้าง AI ที่เชี่ยวชาญเฉพาะด้านได้ โดยไม่ต้องแลกมาด้วยการสูญเสียความสามารถทั่วไปของโมเดลเลย

ทำไมถึงสำคัญ?

ก่อนหน้านี้ องค์กรต่างๆ มักจะต้องเลือกระหว่างความเชี่ยวชาญเฉพาะทาง (เช่น การตอบคำถามเกี่ยวกับผลิตภัณฑ์ของตัวเองอย่างแม่นยำ) กับความฉลาดทั่วไป (เช่น การตอบคำถามทั่วๆ ไป การให้เหตุผล) ซึ่งจำกัดการใช้งานของโมเดลในหลายๆ กรณี แต่ด้วย Nova Forge ที่ทำงานร่วมกับบริการต่างๆ บน Amazon Bedrock ปัญหานี้ก็หมดไป เราสามารถมีโมเดล AI ที่ทั้งฉลาดและมีความเชี่ยวชาญเฉพาะทางได้ในเวลาเดียวกัน ซึ่งเป็นสิ่งสำคัญมากๆ ในยุคที่ธุรกิจต้องการความยืดหยุ่นและประสิทธิภาพสูง

ลองคิดดูสิ! ทีมดูแลลูกค้าอาจต้องการ LLM ที่เข้าใจและจัดหมวดหมู่ความคิดเห็นลูกค้าที่ซับซ้อนได้อย่างแม่นยำ (ความเชี่ยวชาญเฉพาะทาง) ในขณะเดียวกัน ทีมการตลาดอาจต้องการ LLM ตัวเดียวกันนี้เพื่อสร้างคอนเทนต์หรือสรุปข้อมูลทั่วไปได้ (ความสามารถทั่วไป) Nova Forge ทำให้สิ่งเหล่านี้เป็นไปได้โดยไม่ต้องกังวลเรื่องการลืมข้อมูลเดิม หรือที่เรียกว่า Catastrophic Interference ซึ่งเป็นปัญหาที่ทำให้โมเดลลืมความรู้เก่าเมื่อเรียนรู้สิ่งใหม่

เริ่มต้นใช้งานยังไง?

ถ้าคุณอยากมี AI ที่สามารถทำงานเฉพาะทางได้อย่างยอดเยี่ยม โดยไม่สูญเสียความสามารถทั่วไปที่เป็นพื้นฐาน ลองดู Amazon Nova Forge ได้เลย เป็นเครื่องมือที่จะช่วยให้องค์กรของคุณก้าวไปอีกขั้นในโลกของ AI

อ่านต่อ: สร้าง AI เฉพาะทางโดยไม่สูญเสียความสามารถทั่วไป: Nova Forge data mixing ในการปฏิบัติ เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับรายละเอียดทางเทคนิคและผลลัพธ์ที่น่าสนใจกันนะ!