Đơn giản hóa ModelOps với Amazon SageMaker AI Projects sử dụng các template dựa trên Amazon S3

Tác giả: Christian Kamwangala, Paolo Di Francesco, và Sandeep Raveesh-Babu
Ngày phát hành: 30 JAN 2026
Chuyên mục: Amazon SageMaker, Amazon SageMaker AI, Amazon SageMaker Studio, Artificial Intelligence, Technical How-to

Việc quản lý các quy trình ModelOps có thể phức tạp và tốn thời gian. Nếu bạn đã từng gặp khó khăn trong việc thiết lập các template dự án cho nhóm khoa học dữ liệu của mình, bạn sẽ biết rằng phương pháp trước đây sử dụng AWS Service Catalog yêu cầu cấu hình danh mục đầu tư (portfolios), sản phẩm (products) và quản lý các quyền phức tạp—thêm đáng kể chi phí quản lý trước khi nhóm của bạn có thể bắt đầu xây dựng các pipeline học máy (ML).

Amazon SageMaker AI Projects hiện cung cấp một con đường dễ dàng hơn: các template dựa trên Amazon S3. Với khả năng mới này, bạn có thể lưu trữ các template AWS CloudFormation trực tiếp trong Amazon Simple Storage Service (Amazon S3) và quản lý toàn bộ vòng đời của chúng bằng cách sử dụng các tính năng S3 quen thuộc như phiên bản hóa (versioning), chính sách vòng đời (lifecycle policies)replication S3 Cross-Region. Điều này có nghĩa là bạn có thể cung cấp cho nhóm khoa học dữ liệu của mình các template dự án an toàn, được kiểm soát phiên bản và tự động hóa với chi phí quản lý thấp hơn đáng kể.

Bài viết này khám phá cách bạn có thể sử dụng các template dựa trên Amazon S3 để đơn giản hóa các quy trình ModelOps, trình bày những lợi ích chính so với việc sử dụng các phương pháp Service Catalog, và minh họa cách tạo một giải pháp ModelOps tùy chỉnh tích hợp với GitHub và GitHub Actions—cung cấp cho nhóm của bạn khả năng cấp phát môi trường ML đầy đủ chức năng chỉ với một cú nhấp chuột.

Amazon SageMaker AI Projects là gì?

Các nhóm có thể sử dụng Amazon SageMaker AI Projects để tạo, chia sẻ và quản lý các dự án ModelOps được cấu hình đầy đủ. Trong môi trường có cấu trúc này, bạn có thể tổ chức mã, dữ liệu và thử nghiệm—tạo điều kiện thuận lợi cho việc cộng tác và khả năng tái tạo.

Mỗi dự án có thể bao gồm các pipeline tích hợp và phân phối liên tục (CI/CD), kho lưu trữ mô hình (model registries), cấu hình triển khai và các thành phần ModelOps khác, tất cả đều được quản lý trong SageMaker AI. Các template có thể tái sử dụng giúp chuẩn hóa các thực hành ModelOps bằng cách mã hóa các phương pháp hay nhất cho xử lý dữ liệu, phát triển mô hình, huấn luyện, triển khai và giám sát. Dưới đây là các trường hợp sử dụng phổ biến mà bạn có thể điều phối bằng cách sử dụng SageMaker AI Projects:

  • Tự động hóa các quy trình ML: Thiết lập các quy trình CI/CD tự động xây dựng, kiểm thử và triển khai các mô hình ML.
  • Thực thi quản trị và tuân thủ: Giúp các dự án của bạn tuân thủ các tiêu chuẩn của tổ chức về bảo mật, mạng và gắn thẻ tài nguyên. Các thực hành gắn thẻ nhất quán tạo điều kiện phân bổ chi phí chính xác giữa các nhóm và dự án, đồng thời hợp lý hóa các cuộc kiểm tra bảo mật.
  • Đẩy nhanh thời gian tạo giá trị: Cung cấp môi trường được cấu hình sẵn để các nhà khoa học dữ liệu tập trung vào các vấn đề ML, không phải cơ sở hạ tầng.
  • Cải thiện cộng tác: Thiết lập cấu trúc dự án nhất quán để dễ dàng chia sẻ và tái sử dụng mã.

Sơ đồ sau đây cho thấy cách SageMaker AI Projects cung cấp các quy trình làm việc riêng biệt cho quản trị viên, kỹ sư ML và nhà khoa học dữ liệu. Trong đó, quản trị viên tạo và quản lý các template trường hợp sử dụng ML, còn kỹ sư ML và nhà khoa học dữ liệu sử dụng các template đã được phê duyệt theo cách tự phục vụ.

Sơ đồ kiến trúc SageMaker AI Projects

Có gì mới: Các template dự án dựa trên Amazon S3 của Amazon SageMaker AI

Bản cập nhật mới nhất cho SageMaker AI Projects giới thiệu khả năng cho quản trị viên lưu trữ và quản lý các template dự án ML trực tiếp trong Amazon S3. Các template dựa trên S3 là một giải pháp thay thế ít phức tạp và linh hoạt hơn so với Service Catalog được yêu cầu trước đây. Với cải tiến này, các template AWS CloudFormation có thể được phiên bản hóa, bảo mật và chia sẻ hiệu quả giữa các nhóm bằng cách sử dụng các tính năng kiểm soát truy cập phong phú, quản lý vòng đời và replication do S3 cung cấp. Giờ đây, các nhóm khoa học dữ liệu có thể khởi chạy các dự án ModelOps mới từ các template được hỗ trợ bởi S3 này trực tiếp trong Amazon SageMaker Studio. Điều này giúp các tổ chức duy trì tính nhất quán và tuân thủ ở quy mô lớn với các tiêu chuẩn nội bộ của họ.

Khi bạn lưu trữ các template trong Amazon S3, chúng sẽ có sẵn ở tất cả các AWS Region nơi SageMaker AI Projects được hỗ trợ. Để chia sẻ các template giữa các tài khoản AWS, bạn có thể sử dụng các chính sách bucket S3 và kiểm soát truy cập liên tài khoản. Khả năng bật phiên bản hóa trong S3 cung cấp lịch sử đầy đủ về các thay đổi của template, tạo điều kiện thuận lợi cho việc kiểm tra và khôi phục, đồng thời cung cấp một bản ghi bất biến về sự phát triển của template dự án theo thời gian. Nếu nhóm của bạn hiện đang sử dụng các template dựa trên Service Catalog, phương pháp dựa trên S3 cung cấp một lộ trình di chuyển đơn giản. Khi di chuyển từ Service Catalog sang S3, các cân nhắc chính bao gồm cấp phát các SageMaker role mới để thay thế các role dành riêng cho Service Catalog, cập nhật các tham chiếu template tương ứng, tải các template lên S3 với gắn thẻ phù hợp và cấu hình các thẻ cấp domain để trỏ đến vị trí bucket template. Đối với các tổ chức sử dụng kho lưu trữ template tập trung, các chính sách bucket S3 liên tài khoản phải được thiết lập để cho phép khám phá template từ các tài khoản người dùng, với domain SageMaker của mỗi tài khoản người dùng được gắn thẻ để tham chiếu đến bucket trung tâm. Cả template dựa trên S3 và Service Catalog đều được hiển thị trong các tab riêng biệt trong giao diện tạo SageMaker AI Projects, vì vậy các tổ chức có thể giới thiệu các template S3 dần dần mà không làm gián đoạn các quy trình làm việc hiện có trong quá trình di chuyển.

Các dự án ModelOps dựa trên S3 hỗ trợ các template CloudFormation tùy chỉnh mà bạn tạo cho trường hợp sử dụng ML của tổ chức mình. Các template do AWS cung cấp (chẳng hạn như các template dự án ModelOps tích hợp sẵn) tiếp tục chỉ có sẵn thông qua Service Catalog. Các template tùy chỉnh của bạn phải là các tệp CloudFormation hợp lệ ở định dạng YAML. Để bắt đầu sử dụng các template dựa trên S3 với SageMaker AI Projects, domain SageMaker của bạn (không gian làm việc cộng tác cho các nhóm ML của bạn) phải bao gồm thẻ sagemaker:projectS3TemplatesLocation với giá trị s3://<bucket-name>/<prefix>/. Mỗi tệp template được tải lên S3 phải được gắn thẻ sagemaker:studio-visibility=true để xuất hiện trong bảng điều khiển SageMaker AI Studio Projects. Bạn sẽ cần cấp quyền đọc cho các SageMaker execution role trên chính sách bucket S3 và bật cấu hình CORS trên bucket S3 để cho phép SageMaker AI Projects truy cập các template S3.

Sơ đồ sau đây minh họa cách các template dựa trên S3 tích hợp với SageMaker AI Projects để cho phép các quy trình ModelOps có thể mở rộng. Thiết lập này hoạt động trong hai quy trình riêng biệt – cấu hình một lần bởi quản trị viên và khởi chạy dự án bởi Kỹ sư ML / Nhà khoa học dữ liệu. Khi Kỹ sư ML / Nhà khoa học dữ liệu khởi chạy một dự án ModelOps mới trong SageMaker AI, SageMaker AI sẽ khởi chạy một stack AWS CloudFormation để cấp phát các tài nguyên được định nghĩa trong template và sau khi quá trình hoàn tất, bạn có thể truy cập tất cả các tài nguyên được chỉ định và các pipeline CI/CD đã cấu hình trong dự án của mình.

Sơ đồ tích hợp template dựa trên S3 với SageMaker AI Projects

Việc quản lý vòng đời của các dự án đã khởi chạy có thể được thực hiện thông qua bảng điều khiển SageMaker Studio, nơi người dùng có thể điều hướng đến S3 Templates, chọn một dự án và sử dụng menu thả xuống Actions để cập nhật hoặc xóa dự án. Cập nhật dự án có thể được sử dụng để sửa đổi các tham số template hiện có hoặc URL template, kích hoạt các bản cập nhật stack CloudFormation được xác thực trước khi thực thi, trong khi xóa dự án sẽ loại bỏ tất cả các tài nguyên và cấu hình CloudFormation liên quan. Các hoạt động vòng đời này cũng có thể được thực hiện theo chương trình bằng cách sử dụng các SageMaker API.

Để minh họa sức mạnh của các template dựa trên S3, hãy xem xét một kịch bản thực tế trong đó một nhóm quản trị cần cung cấp cho các nhà khoa học dữ liệu một quy trình ModelOps tiêu chuẩn hóa tích hợp với các kho lưu trữ GitHub hiện có của họ.

Trường hợp sử dụng: Template MLOps tích hợp GitHub cho các nhóm doanh nghiệp

Nhiều tổ chức sử dụng GitHub làm hệ thống kiểm soát mã nguồn chính và muốn sử dụng GitHub Actions cho CI/CD trong khi sử dụng SageMaker cho các khối lượng công việc ML. Tuy nhiên, việc thiết lập tích hợp này đòi hỏi cấu hình nhiều dịch vụ AWS, thiết lập kết nối an toàn và triển khai các quy trình phê duyệt phù hợp—một nhiệm vụ phức tạp có thể tốn thời gian nếu thực hiện thủ công. Template dựa trên S3 của chúng tôi giải quyết thách thức này bằng cách cấp phát một pipeline ModelOps hoàn chỉnh bao gồm điều phối CI/CD, các thành phần SageMaker Pipelines và tự động hóa theo sự kiện. Sơ đồ sau đây minh họa quy trình làm việc end-to-end được cấp phát bởi template ModelOps này.

Quy trình làm việc ModelOps tích hợp GitHub

Dự án ModelOps mẫu với các template dựa trên S3 này cho phép các quy trình ModelOps được tự động hóa và quản trị hoàn toàn. Mỗi dự án ModelOps bao gồm một kho lưu trữ GitHub được cấu hình sẵn với các quy trình làm việc Actions và AWS CodeConnections an toàn để tích hợp liền mạch. Khi mã được commit, một SageMaker pipeline được kích hoạt để điều phối một quy trình tiêu chuẩn hóa bao gồm tiền xử lý dữ liệu, huấn luyện mô hình, đánh giá và đăng ký. Để triển khai, hệ thống hỗ trợ staging tự động khi mô hình được phê duyệt, với các kiểm tra xác thực mạnh mẽ, một cổng phê duyệt thủ công để đưa mô hình vào sản xuất, và một kiến trúc hướng sự kiện an toàn sử dụng AWS LambdaAmazon EventBridge. Trong suốt quy trình làm việc, việc quản trị được hỗ trợ bởi SageMaker Model Registry để theo dõi các phiên bản và nguồn gốc mô hình, các bước phê duyệt được xác định rõ ràng, quản lý thông tin xác thực an toàn bằng AWS Secrets Manager, và các tiêu chuẩn gắn thẻ và đặt tên nhất quán cho tất cả các tài nguyên.

Khi các nhà khoa học dữ liệu chọn template này từ SageMaker Studio, họ sẽ cấp phát một môi trường ModelOps đầy đủ chức năng thông qua một quy trình hợp lý. Họ đẩy mã ML của mình lên GitHub bằng chức năng Git tích hợp trong môi trường phát triển tích hợp (IDE) của Studio, và pipeline sẽ tự động xử lý việc huấn luyện mô hình, đánh giá và triển khai dần dần từ staging đến production—tất cả trong khi vẫn duy trì các yêu cầu bảo mật và tuân thủ của doanh nghiệp. Hướng dẫn thiết lập đầy đủ cùng với mã cho template ModelOps này có sẵn trong kho lưu trữ GitHub của chúng tôi.

Sau khi bạn làm theo hướng dẫn trong kho lưu trữ, bạn có thể tìm thấy template mlops-github-actions trong phần SageMaker AI Projects trong bảng điều khiển SageMaker AI Studio bằng cách chọn Projects từ ngăn điều hướng và chọn tab Organization templates rồi chọn Next, như trong hình sau.

Tìm template mlops-github-actions trong SageMaker AI Studio

Để khởi chạy dự án ModelOps, bạn phải nhập các chi tiết cụ thể của dự án bao gồm trường Role ARN. Trường này phải chứa ARN của AmazonSageMakerProjectsLaunchRole được tạo trong quá trình thiết lập, như trong hình sau.

Là một phương pháp bảo mật tốt nhất, hãy sử dụng Amazon Resource Name (ARN) của AmazonSageMakerProjectsLaunchRole, không phải SageMaker execution role của bạn.

AmazonSageMakerProjectsLaunchRole là một provisioning role hoạt động như một trung gian trong quá trình tạo dự án ModelOps. Role này chứa tất cả các quyền cần thiết để tạo cơ sở hạ tầng cho dự án của bạn, bao gồm các role AWS Identity and Access Management (IAM), S3 buckets, AWS CodePipeline và các tài nguyên AWS khác. Bằng cách sử dụng launch role chuyên dụng này, các kỹ sư ML và nhà khoa học dữ liệu có thể tạo các dự án ModelOps mà không cần các quyền rộng hơn trong tài khoản của chính họ. SageMaker execution role cá nhân của họ vẫn có phạm vi giới hạn—họ chỉ cần quyền để đảm nhận chính launch role đó.

Sự phân tách trách nhiệm này rất quan trọng để duy trì bảo mật. Nếu không có launch role, mọi chuyên gia ML sẽ cần các quyền IAM mở rộng để tạo các code pipeline, các dự án AWS CodeBuild, S3 buckets và các tài nguyên AWS khác một cách trực tiếp. Với launch role, họ chỉ cần quyền để đảm nhận một role được cấu hình sẵn để xử lý việc cấp phát thay mặt họ, giữ cho các quyền cá nhân của họ ở mức tối thiểu và an toàn.

Cấu hình chi tiết dự án ModelOps

Nhập các chi tiết cấu hình dự án mong muốn của bạn và chọn Next. Template sau đó sẽ tạo hai quy trình ModelOps tự động—một để xây dựng mô hình và một để triển khai mô hình—hoạt động cùng nhau để cung cấp CI/CD cho các mô hình ML của bạn. Ví dụ ModelOps hoàn chỉnh có thể được tìm thấy trong kho lưu trữ mlops-github-actions.

Tổng quan về các quy trình ModelOps tự động

Dọn dẹp tài nguyên

Sau khi triển khai, bạn sẽ phải chịu chi phí cho các tài nguyên đã triển khai. Nếu bạn không có ý định tiếp tục sử dụng thiết lập này, hãy xóa các tài nguyên dự án ModelOps để tránh các khoản phí không cần thiết.

Để hủy dự án, hãy mở SageMaker Studio và chọn More trong ngăn điều hướng, sau đó chọn Projects. Chọn dự án bạn muốn xóa, chọn dấu ba chấm dọc ở góc trên bên phải của danh sách dự án và chọn Delete. Xem lại thông tin trong hộp thoại Delete project và chọn Yes, delete the project để xác nhận. Sau khi xóa, hãy xác minh rằng dự án của bạn không còn xuất hiện trong danh sách dự án.

Ngoài việc xóa một dự án, thao tác này sẽ loại bỏ và hủy cấp phát SageMaker AI Project, bạn cũng cần xóa thủ công các thành phần sau nếu chúng không còn cần thiết: Git repositories, pipelines, model groups và endpoints.

Kết luận

Việc cấp phát template dựa trên Amazon S3 cho Amazon SageMaker AI Projects đã thay đổi cách các tổ chức chuẩn hóa các hoạt động ML. Như đã trình bày trong bài viết này, một template AWS CloudFormation duy nhất có thể cấp phát một quy trình CI/CD hoàn chỉnh tích hợp kho lưu trữ Git của bạn (GitHub, Bitbucket hoặc GitLab), SageMaker Pipelines và SageMaker Model Registry—cung cấp cho các nhóm khoa học dữ liệu các quy trình làm việc tự động trong khi vẫn duy trì các kiểm soát quản trị và bảo mật của doanh nghiệp. Để biết thêm thông tin về SageMaker AI Projects và các template dựa trên S3, hãy xem Tự động hóa ModelOps với SageMaker Projects.

Bằng cách sử dụng các template dựa trên S3 trong SageMaker AI Projects, quản trị viên có thể định nghĩa và quản lý cơ sở hạ tầng ML, trong khi các kỹ sư ML và nhà khoa học dữ liệu có quyền truy cập vào các môi trường ML được cấu hình sẵn thông qua cấp phát tự phục vụ. Khám phá kho lưu trữ mẫu GitHub để tìm các template ModelOps phổ biến và bắt đầu ngay hôm nay bằng cách làm theo hướng dẫn được cung cấp. Bạn cũng có thể tạo các template tùy chỉnh phù hợp với các yêu cầu cụ thể, chính sách bảo mật và framework ML ưa thích của tổ chức mình.


Về tác giả


Christian Kamwangala là Kiến trúc sư Giải pháp Chuyên gia AI/ML và AI tạo sinh tại AWS, có trụ sở tại Paris, Pháp. Anh hợp tác với các khách hàng doanh nghiệp để kiến trúc, tối ưu hóa và triển khai các giải pháp AI cấp độ sản xuất, tận dụng bộ công cụ học máy toàn diện của AWS. Christian chuyên về các kỹ thuật tối ưu hóa suy luận nhằm cân bằng các yêu cầu về hiệu suất, chi phí và độ trễ cho các triển khai quy mô lớn. Trong thời gian rảnh rỗi, Christian thích khám phá thiên nhiên và dành thời gian cho gia đình và bạn bè.


Sandeep Raveesh là Kiến trúc sư Giải pháp Chuyên gia AI tạo sinh tại AWS. Anh làm việc với khách hàng trong hành trình AIOps của họ, bao gồm huấn luyện mô hình, các ứng dụng AI tạo sinh như agent, và mở rộng các trường hợp sử dụng AI tạo sinh. Anh cũng tập trung vào các chiến lược tiếp cận thị trường, giúp AWS xây dựng và điều chỉnh sản phẩm để giải quyết các thách thức của ngành trong không gian AI tạo sinh. Bạn có thể kết nối với Sandeep trên LinkedIn để tìm hiểu về các giải pháp AI tạo sinh.


Paolo Di Francesco là Kiến trúc sư Giải pháp Cấp cao tại Amazon Web Services (AWS). Anh có bằng Tiến sĩ Kỹ thuật Viễn thông và kinh nghiệm trong kỹ thuật phần mềm. Anh đam mê học máy và hiện đang tập trung sử dụng kinh nghiệm của mình để giúp khách hàng đạt được mục tiêu trên AWS, trong các cuộc thảo luận về MLOps. Ngoài công việc, anh thích chơi bóng đá và đọc sách.

TAGS: Amazon SageMaker, Amazon SageMaker Pipelines, Amazon SageMaker Studio