Tác giả: Donnie Prakoso
Ngày phát hành: 02/12/2025
Chuyên mục: Amazon SageMaker, Amazon SageMaker Unified Studio, Announcements, AWS re:Invent, Launch, News
Kể từ khi chúng tôi công bố Amazon SageMaker AI với MLflow vào tháng 6 năm 2024, khách hàng của chúng tôi đã sử dụng các máy chủ theo dõi MLflow để quản lý quy trình thử nghiệm học máy (machine learning – ML) và AI của họ. Dựa trên nền tảng này, chúng tôi tiếp tục phát triển trải nghiệm MLflow để việc thử nghiệm trở nên dễ tiếp cận hơn nữa.
Hôm nay, tôi rất vui mừng thông báo rằng Amazon SageMaker AI với MLflow hiện đã bao gồm khả năng không máy chủ (serverless), giúp loại bỏ việc quản lý cơ sở hạ tầng. Khả năng MLflow mới này biến việc theo dõi thử nghiệm thành một trải nghiệm tức thì, theo yêu cầu với khả năng tự động co giãn, loại bỏ nhu cầu lập kế hoạch dung lượng.
Sự chuyển đổi sang quản lý không cần cơ sở hạ tầng đã thay đổi cơ bản cách các nhóm tiếp cận thử nghiệm AI—các ý tưởng có thể được kiểm tra ngay lập tức mà không cần lập kế hoạch cơ sở hạ tầng, cho phép các quy trình phát triển lặp lại và khám phá nhiều hơn.
Bắt đầu với Amazon SageMaker AI và MLflow
Hãy để tôi hướng dẫn bạn cách tạo phiên bản MLflow không máy chủ đầu tiên của mình.
Tôi điều hướng đến bảng điều khiển Amazon SageMaker AI Studio và chọn ứng dụng MLflow. Thuật ngữ MLflow Apps thay thế cho thuật ngữ MLflow tracking servers trước đây, phản ánh cách tiếp cận đơn giản hóa, tập trung vào ứng dụng.

Tại đây, tôi có thể thấy đã có một MLflow App mặc định được tạo sẵn. Trải nghiệm MLflow được đơn giản hóa này giúp tôi bắt đầu thực hiện các thử nghiệm một cách dễ dàng hơn.
Tôi chọn Create MLflow App và nhập tên. Ở đây, cả vai trò AWS Identity and Access Management (IAM) và bucket Amazon Simple Storage Service (Amazon S3) đều đã được cấu hình sẵn. Tôi chỉ cần sửa đổi chúng trong Advanced settings nếu cần.

Đây là lúc cải tiến lớn đầu tiên trở nên rõ ràng—quá trình tạo hoàn tất trong khoảng 2 phút. Sự sẵn sàng tức thì này cho phép thử nghiệm nhanh chóng mà không bị trì hoãn do lập kế hoạch cơ sở hạ tầng, loại bỏ thời gian chờ đợi từng làm gián đoạn quy trình thử nghiệm trước đây.

Sau khi được tạo, tôi nhận được một Amazon Resource Name (ARN) của MLflow để kết nối từ các notebook. Việc quản lý được đơn giản hóa có nghĩa là không cần quyết định về kích thước máy chủ hay lập kế hoạch dung lượng. Tôi không còn cần phải lựa chọn giữa các cấu hình khác nhau hay quản lý dung lượng cơ sở hạ tầng, điều này có nghĩa là tôi có thể tập trung hoàn toàn vào việc thử nghiệm. Bạn có thể tìm hiểu cách sử dụng MLflow SDK tại Tích hợp MLflow với môi trường của bạn trong Hướng dẫn dành cho nhà phát triển Amazon SageMaker.

Với sự hỗ trợ của MLflow 3.4, giờ đây tôi có thể truy cập các khả năng mới cho việc phát triển AI tạo sinh (generative AI). MLflow Tracing ghi lại chi tiết các đường dẫn thực thi, đầu vào, đầu ra và siêu dữ liệu trong suốt vòng đời phát triển, cho phép gỡ lỗi hiệu quả trên các hệ thống AI phân tán.

Khả năng mới này cũng giới thiệu quyền truy cập liên-miền (cross-domain) và liên-tài khoản (cross-account) thông qua chia sẻ AWS Resource Access Manager (AWS RAM). Sự hợp tác nâng cao này có nghĩa là các nhóm trên các miền và tài khoản AWS khác nhau có thể chia sẻ các phiên bản MLflow một cách an toàn, phá vỡ các rào cản trong tổ chức.

Tích hợp tốt hơn: Tích hợp với Pipelines
Amazon SageMaker Pipelines được tích hợp với MLflow. SageMaker Pipelines là một dịch vụ điều phối quy trình công việc không máy chủ được xây dựng chuyên dụng cho tự động hóa vận hành học máy (MLOps) và vận hành mô hình ngôn ngữ lớn (LLMOps)—các phương pháp triển khai, giám sát và quản lý các mô hình ML và LLM trong môi trường sản xuất. Bạn có thể dễ dàng xây dựng, thực thi và giám sát các quy trình AI đầu cuối có thể lặp lại bằng giao diện người dùng kéo-thả trực quan hoặc Python SDK.

Từ một pipeline, một MLflow App mặc định sẽ được tạo nếu chưa tồn tại. Tên thử nghiệm có thể được xác định và các chỉ số, tham số và tạo tác (artifacts) được ghi lại vào MLflow App như đã định nghĩa trong mã của bạn. SageMaker AI với MLflow cũng được tích hợp với các khả năng phát triển mô hình quen thuộc của SageMaker AI như SageMaker AI JumpStart và Model Registry, cho phép tự động hóa quy trình công việc đầu cuối từ chuẩn bị dữ liệu đến tinh chỉnh mô hình.
Những điều cần biết
Dưới đây là những điểm chính cần lưu ý:
- Giá cả – Khả năng MLflow không máy chủ mới được cung cấp miễn phí. Lưu ý rằng có các giới hạn dịch vụ được áp dụng.
- Tính sẵn có – Khả năng này có sẵn tại các AWS Region sau: US East (N. Virginia, Ohio), US West (N.California, Oregon), Asia Pacific (Mumbai, Seoul, Singapore, Sydney, Tokyo), Canada (Central), Europe (Frankfurt, Ireland, London, Paris, Stockholm), South America (São Paulo).
- Nâng cấp tự động: Việc nâng cấp phiên bản MLflow tại chỗ diễn ra tự động, cung cấp quyền truy cập vào các tính năng mới nhất mà không cần công việc di chuyển thủ công hay lo ngại về tính tương thích. Dịch vụ hiện hỗ trợ MLflow 3.4, cung cấp quyền truy cập vào các khả năng mới nhất bao gồm các tính năng tracing nâng cao.
- Hỗ trợ di chuyển – Bạn có thể sử dụng công cụ mã nguồn mở MLflow export-import có tại mlflow-export-import để giúp di chuyển từ các Tracking Server hiện có, cho dù chúng từ SageMaker AI, tự lưu trữ, hay các nguồn khác sang MLflow không máy chủ (MLflow Apps).
Hãy bắt đầu với MLflow không máy chủ bằng cách truy cập Amazon SageMaker AI Studio và tạo MLflow App đầu tiên của bạn. MLflow không máy chủ cũng được hỗ trợ trong SageMaker Unified Studio để tăng thêm tính linh hoạt cho quy trình công việc.
Chúc bạn thử nghiệm vui vẻ!
— Donnie
Về tác giả

Donnie Prakoso là một kỹ sư phần mềm, một barista tự phong và là Principal Developer Advocate tại AWS. Với hơn 17 năm kinh nghiệm trong ngành công nghệ, từ viễn thông, ngân hàng đến các công ty khởi nghiệp. Hiện tại, anh đang tập trung vào việc giúp các nhà phát triển hiểu rõ các loại công nghệ khác nhau để biến ý tưởng của họ thành hiện thực. Anh yêu thích cà phê và mọi cuộc thảo luận về bất kỳ chủ đề nào từ microservices đến AI/ML.