Giới thiệu Amazon Nova Forge: Xây dựng các frontier model của riêng bạn bằng Nova

Tác giả: Danilo Poccia
Ngày phát hành: 02 DEC 2025
Chuyên mục: Amazon Bedrock, Amazon Machine Learning, Amazon Nova, Amazon SageMaker AI, Amazon SageMaker HyperPod, Announcements, Artificial Intelligence, Generative AI

Các tổ chức đang nhanh chóng mở rộng việc sử dụng AI tạo sinh (generative AI) trên mọi phương diện của doanh nghiệp. Các ứng dụng đòi hỏi chuyên môn sâu hoặc bối cảnh kinh doanh cụ thể cần những mô hình thực sự hiểu biết về kiến thức độc quyền, quy trình làm việc và các yêu cầu riêng của họ.

Mặc dù các kỹ thuật như prompt engineeringRetrieval Augmented Generation (RAG) hoạt động tốt cho nhiều trường hợp sử dụng, chúng có những hạn chế cơ bản khi cần nhúng kiến thức chuyên ngành vào sự hiểu biết cốt lõi của mô hình. Tinh chỉnh có giám sát (supervised fine-tuning) và học tăng cường (reinforcement learning) giúp tùy chỉnh mô hình, nhưng chúng lại can thiệp quá muộn trong vòng đời phát triển, chỉ thêm các lớp sửa đổi lên trên các mô hình đã được huấn luyện đầy đủ, do đó khó định hướng đến các lĩnh vực quan tâm cụ thể.

Khi các tổ chức cố gắng tùy chỉnh sâu hơn thông qua Continued Pre-Training (CPT) chỉ bằng dữ liệu độc quyền của họ, họ thường gặp phải hiện tượng quên thảm khốc (catastrophic forgetting), nơi các mô hình mất đi khả năng nền tảng khi học nội dung mới. Đồng thời, dữ liệu, tài nguyên tính toán và chi phí cần thiết để huấn luyện một mô hình từ đầu vẫn là một rào cản lớn đối với hầu hết các tổ chức.

Hôm nay, chúng tôi giới thiệu Amazon Nova Forge, một dịch vụ mới để xây dựng các frontier model của riêng bạn bằng Nova. Khách hàng của Nova Forge có thể bắt đầu phát triển từ các checkpoint ban đầu của mô hình, kết hợp bộ dữ liệu của họ với dữ liệu huấn luyện do Amazon Nova tuyển chọn và lưu trữ các mô hình tùy chỉnh của họ một cách an toàn trên AWS. Nova Forge là cách dễ dàng và hiệu quả nhất về chi phí để xây dựng frontier model của riêng bạn.

Các trường hợp sử dụng và ứng dụng
Nova Forge được thiết kế cho các tổ chức có quyền truy cập vào dữ liệu độc quyền hoặc dữ liệu đặc thù của ngành, những người muốn xây dựng AI thực sự hiểu lĩnh vực của họ. Điều này bao gồm:

  • Sản xuất và tự động hóa – Xây dựng các mô hình hiểu các quy trình chuyên biệt, dữ liệu thiết bị và quy trình làm việc đặc thù của ngành.
  • Nghiên cứu và phát triển – Tạo ra các mô hình được huấn luyện trên dữ liệu nghiên cứu độc quyền và kiến thức chuyên ngành.
  • Nội dung và truyền thông – Phát triển các mô hình hiểu được tiếng nói thương hiệu, tiêu chuẩn nội dung và các yêu cầu kiểm duyệt cụ thể.
  • Các ngành công nghiệp chuyên biệt – Huấn luyện các mô hình về thuật ngữ, quy định và các phương pháp hay nhất của ngành.

Tùy thuộc vào các trường hợp sử dụng cụ thể, Nova Forge có thể được sử dụng để thêm các khả năng khác biệt, nâng cao độ chính xác cho các tác vụ cụ thể, giảm chi phí và giảm độ trễ.

Cách Nova Forge hoạt động
Nova Forge giải quyết những hạn chế của các phương pháp tùy chỉnh hiện tại bằng cách cho phép bạn bắt đầu phát triển mô hình từ các checkpoint ban đầu qua các giai đoạn tiền huấn luyện (pre-training), huấn luyện giữa chừng (mid-training) và hậu huấn luyện (post-training). Bạn có thể kết hợp dữ liệu độc quyền của mình với dữ liệu do Amazon Nova tuyển chọn trong tất cả các giai đoạn huấn luyện, chạy quá trình huấn luyện bằng các công thức đã được kiểm chứng trên cơ sở hạ tầng được quản lý hoàn toàn của Amazon SageMaker AI. Cách tiếp cận trộn dữ liệu này giúp giảm đáng kể hiện tượng quên thảm khốc so với việc chỉ huấn luyện bằng dữ liệu thô, giúp bảo toàn các kỹ năng nền tảng—bao gồm trí thông minh cốt lõi, khả năng tuân theo chỉ dẫn chung và các lợi ích về an toàn—trong khi vẫn tích hợp kiến thức chuyên ngành của bạn.

Nova Forge cung cấp khả năng sử dụng các hàm phần thưởng (reward functions) trong môi trường của riêng bạn cho học tăng cường (reinforcement learning – RL). Điều này cho phép mô hình học hỏi từ phản hồi được tạo ra trong các môi trường đại diện cho trường hợp sử dụng của bạn. Ngoài các đánh giá đơn bước, bạn cũng có thể sử dụng bộ điều phối (orchestrator) của riêng mình để quản lý các lượt triển khai đa vòng (multi-turn rollouts), cho phép huấn luyện RL cho các quy trình agent phức tạp và các tác vụ ra quyết định tuần tự. Dù bạn đang sử dụng các công cụ hóa học để chấm điểm thiết kế phân tử, hay các mô phỏng robot thưởng cho việc hoàn thành nhiệm vụ hiệu quả và phạt các va chạm, bạn đều có thể kết nối trực tiếp các môi trường độc quyền của mình.

Bạn cũng có thể tận dụng bộ công cụ AI có trách nhiệm (responsible AI) tích hợp sẵn trong Nova Forge để cấu hình các cài đặt an toàn và kiểm duyệt nội dung cho mô hình của mình. Bạn có thể điều chỉnh các cài đặt để đáp ứng nhu cầu kinh doanh cụ thể của mình trong các lĩnh vực như an toàn, bảo mật và xử lý nội dung nhạy cảm.

Bắt đầu với Nova Forge
Nova Forge tích hợp liền mạch với các quy trình làm việc AWS hiện có của bạn. Bạn có thể sử dụng các công cụ và cơ sở hạ tầng quen thuộc trong Amazon SageMaker AI để chạy quá trình huấn luyện, sau đó nhập các mô hình Nova tùy chỉnh của bạn dưới dạng mô hình riêng tư trên Amazon Bedrock. Điều này mang lại cho bạn sự bảo mật, các API nhất quán và khả năng tích hợp rộng hơn với AWS giống như bất kỳ mô hình nào trong Amazon Bedrock.

Trong Amazon SageMaker Studio, giờ đây bạn có thể xây dựng frontier model của mình với Amazon Nova.

Amazon Nova Forge trong SageMaker AI console

Để bắt đầu xây dựng mô hình, hãy chọn checkpoint để sử dụng: đã tiền huấn luyện (pre-trained), đã huấn luyện giữa chừng (mid-trained), hoặc đã hậu huấn luyện (post-trained). Bạn cũng có thể tải lên bộ dữ liệu của mình tại đây hoặc sử dụng các bộ dữ liệu hiện có.

Các checkpoint của Amazon Nova Forge

Bạn có thể kết hợp dữ liệu huấn luyện của mình bằng cách trộn với các bộ dữ liệu được tuyển chọn do Nova cung cấp. Các bộ dữ liệu này, được phân loại theo lĩnh vực, có thể giúp mô hình của bạn duy trì hiệu suất chung và ngăn chặn hiện tượng overfitting hoặc quên thảm khốc.

Trộn dữ liệu trong Amazon Nova Forge

Tùy chọn, bạn có thể chọn sử dụng Reinforcement Fine-Tuning (RFT) để cải thiện độ chính xác thực tế và giảm ảo giác (hallucinations) trong các lĩnh vực cụ thể.

Reinforcement Fine-Tuning trong Amazon Nova Forge

Khi quá trình huấn luyện hoàn tất, hãy nhập mô hình vào Amazon Bedrock và bắt đầu sử dụng nó trong các ứng dụng của bạn.

Những điều cần biết
Amazon Nova Forge hiện có sẵn tại AWS Region US East (N. Virginia). Chương trình bao gồm quyền truy cập vào nhiều checkpoint của mô hình Nova, các công thức huấn luyện để trộn dữ liệu độc quyền với dữ liệu huấn luyện do Amazon Nova tuyển chọn, các công thức huấn luyện đã được kiểm chứng, và tích hợp với Amazon SageMaker AI và Amazon Bedrock.

Tìm hiểu thêm trong Hướng dẫn sử dụng Amazon Nova và khám phá Nova Forge từ console của Amazon SageMaker AI.

Các tổ chức quan tâm đến sự hỗ trợ từ chuyên gia cũng có thể liên hệ với Trung tâm Đổi mới AI Tạo sinh (Generative AI Innovation Center) của chúng tôi để được hỗ trợ thêm cho các sáng kiến phát triển mô hình của họ.

Tìm hiểu thêm
Trang sản phẩm chính của Amazon Nova

Các ra mắt khác của Amazon Nova:
Giới thiệu Amazon Nova 2 Sonic: Mô hình chuyển đổi giọng nói sang giọng nói thế hệ mới của chúng tôi cho AI đàm thoại
Giới thiệu Amazon Nova 2 Lite, một mô hình suy luận nhanh, hiệu quả về chi phí
Giới thiệu Amazon Nova 2 Omni trong bản Preview
Xây dựng các agent AI đáng tin cậy để tự động hóa quy trình làm việc UI với Amazon Nova Act, hiện đã có sẵn rộng rãi

Danilo

Về tác giả

Danilo Poccia

Danilo Poccia

Danilo làm việc với các startup và công ty ở mọi quy mô để hỗ trợ sự đổi mới của họ. Trong vai trò Chief Evangelist (EMEA) tại Amazon Web Services, anh tận dụng kinh nghiệm của mình để giúp mọi người biến ý tưởng thành hiện thực, tập trung vào kiến trúc serverless và lập trình hướng sự kiện, cũng như tác động kỹ thuật và kinh doanh của machine learning và điện toán biên. Anh là tác giả của cuốn sách AWS Lambda in Action do Manning xuất bản.