Bắt đầu nhanh hơn với tính năng onboarding một lần nhấp, sổ ghi chép phi máy chủ và tác nhân AI trong Amazon SageMaker Unified Studio

Tác giả: Siddharth Gupta, Matt David, và Sean Ma
Ngày phát hành: 27 JAN 2026
Chuyên mục: Amazon SageMaker, Amazon SageMaker Unified Studio, Announcements, Customer Solutions

Ngày nay, các nhóm dữ liệu phải đối mặt với các công cụ phân mảnh, việc cấp phát hạ tầng phức tạp và hàng giờ viết mã boilerplate để kết nối với các nguồn dữ liệu. Điều này buộc các nhà phân tích, nhà khoa học dữ liệu và kỹ sư phải làm việc trong các môi trường riêng biệt, làm chậm quá trình cộng tác và thời gian thu thập thông tin chi tiết. Kể từ khi chúng tôi ra mắt Amazon SageMaker Unified Studio vào tháng 3 năm 2025, các công ty hàng đầu như Bayer, NatWest và Carrier đã áp dụng nó để đưa các nhóm dữ liệu của họ vào một không gian làm việc cộng tác duy nhất với các công cụ hợp nhất, cấp phát hạ tầng đơn giản và kết nối nhanh chóng với các nguồn dữ liệu.

Tiếp tục sứ mệnh cung cấp thời gian tạo giá trị nhanh hơn cho khách hàng, vào tháng 11 năm 2025, chúng tôi đã công bố sổ ghi chép Amazon SageMaker, một không gian làm việc phi máy chủ với tác nhân AI tích hợp trong Amazon SageMaker Unified Studio. Giờ đây, bạn có thể khởi chạy một sổ ghi chép trong vài giây, tạo mã từ các lời nhắc ngôn ngữ tự nhiên và tự động kết nối với dữ liệu trên Amazon Simple Storage Service (Amazon S3), Amazon Redshift, các cơ sở dữ liệu của bên thứ ba và nhiều hơn nữa từ một môi trường duy nhất mà không cần phải cấp phát trước hoặc điều chỉnh hạ tầng xử lý dữ liệu. Trong các sổ ghi chép phi máy chủ này, các nhà phân tích có thể thực hiện các truy vấn SQL, các nhà khoa học dữ liệu có thể thực thi mã Python và các kỹ sư dữ liệu có thể xử lý các công việc dữ liệu quy mô lớn trong Spark trong một không gian làm việc duy nhất. Cùng với tính năng onboarding một lần nhấp mới có sẵn cho SageMaker Unified Studio, khách hàng có thể chuyển từ dữ liệu AWS hiện có sang chạy các khối lượng công việc phân tích và học máy nhanh hơn nhiều, dành thời gian của họ cho việc phân tích thay vì thiết lập và cấu hình.

Trong bài đăng này, chúng tôi sẽ hướng dẫn bạn cách các khả năng mới này trong SageMaker Unified Studio có thể giúp bạn hợp nhất các công cụ dữ liệu phân mảnh của mình, giảm thời gian thu thập thông tin chi tiết và cộng tác giữa các nhóm dữ liệu của bạn. Dưới đây là một bản demo ngắn về các khả năng mới:

Onboarding các bộ dữ liệu AWS hiện có chỉ với một lần nhấp

Bắt đầu khám phá dữ liệu của bạn với onboarding một lần nhấp giúp cấp phát và cấu hình môi trường trong vài phút thay vì vài tuần. Trải nghiệm onboarding mới có thể sử dụng lại các vai trò AWS Identity and Access Management (IAM) hiện có để cung cấp quyền truy cập vào SageMaker Unified Studio, tự động kết nối với các nguồn dữ liệu trên S3 buckets, S3 Tables, AWS Glue Data Catalog và các chính sách AWS Lake Formation, loại bỏ nhu cầu thiết lập quyền dữ liệu bổ sung. Bên dưới, một miền và dự án dựa trên IAM mới được tạo với các tài nguyên sổ ghi chép và tính toán mặc định được cấu hình sẵn. Khi hoàn tất, bạn sẽ vào SageMaker Unified Studio với tất cả các công cụ có sẵn trong điều hướng bên trái cùng với các mẫu tích hợp sẵn để tăng tốc lần sử dụng đầu tiên, như trong ảnh chụp màn hình sau.

Các tính năng mới với Amazon Sagemaker sẽ mở ra một mô hình đổi mới mới, cho phép Codex tăng tốc đáng kể thời gian tạo giá trị cho khách hàng của chúng tôi và biến họ từ cũ kỹ sang tác nhân trong vài tuần, không phải vài tháng.

– Abhinav Sharma, Giám đốc Dữ liệu, Codex

Bạn có thể bắt đầu trực tiếp từ Amazon SageMaker, Amazon Athena, Amazon Redshift hoặc S3 Tables, mang đến cho họ một con đường nhanh chóng từ các công cụ và dữ liệu hiện có của họ đến trải nghiệm hợp nhất trong SageMaker Unified Studio. Sau khi bạn chọn Get Started và chỉ định một vai trò IAM, SageMaker sẽ tự động tạo một dự án với các quyền dữ liệu hiện có được giữ nguyên từ Data Catalog, Lake Formation và Amazon S3. Kết quả là, các nhóm có thể ngay lập tức khám phá và hành động trên dữ liệu của họ bằng cách sử dụng các quyền dữ liệu và hạ tầng hiện có.

Để biết thêm thông tin, hãy xem Onboarding một lần nhấp mới và sổ ghi chép với tác nhân AI tích hợp trong Amazon SageMaker Unified Studio

Sổ ghi chép SageMaker phi máy chủ

Các sổ ghi chép dựa trên web được quản lý hoàn toàn trong SageMaker Unified Studio hỗ trợ nhiều ngôn ngữ lập trình, cho phép bạn viết mã Python, SQL và Spark trong cùng một sổ ghi chép. Hạ tầng tự động điều chỉnh dựa trên khối lượng công việc của bạn, trong khi các thư viện tích hợp sẵn tạo biểu đồ và thông tin chi tiết trực tiếp trong quy trình làm việc của bạn. Khi phân tích của bạn mở rộng vượt ra ngoài các truy vấn tương tác đến xử lý dữ liệu quy mô lớn, công cụ Amazon Athena for Apache Spark mang lại hiệu suất tối ưu, tích hợp với trải nghiệm sổ ghi chép phi máy chủ để thực thi các khối lượng công việc phân tích một cách hiệu quả. Cách tiếp cận phi máy chủ này loại bỏ nhu cầu cấp phát cụm hoặc duy trì máy chủ, giảm thời gian từ câu hỏi đến thông tin chi tiết.

Giao diện SageMaker mới mang lại sự rõ ràng và tốc độ cho toàn bộ vòng đời ML. Thiết kế thân thiện với nhà phát triển của nó đã giúp việc thử nghiệm và phân phối của chúng tôi nhanh hơn đáng kể,

– Sachin Mittal, Giám đốc sản phẩm tại Deloitte.

Như được hiển thị trong hình ảnh trên, sổ ghi chép cung cấp cho các kỹ sư dữ liệu, nhà phân tích và nhà khoa học dữ liệu một nơi để thực hiện các truy vấn SQL, thực thi mã Python, xử lý các công việc dữ liệu quy mô lớn, chạy các khối lượng công việc học máy và tạo hình ảnh hóa mà không cần phải chuyển đổi giữa các công cụ.

Phát triển hỗ trợ AI với Data Agent

Để tăng tốc phát triển hơn nữa, SageMaker Data Agent mới giúp tạo mã SQL, Python hoặc Spark bằng cách sử dụng các lời nhắc ngôn ngữ tự nhiên. Thay vì dành hàng giờ viết mã boilerplate để kết nối với các nguồn dữ liệu của bạn và hiểu các lược đồ, bạn có thể mô tả những gì bạn muốn đạt được. Tác nhân phân tích siêu dữ liệu danh mục dữ liệu về các bộ dữ liệu, lược đồ và mối quan hệ có sẵn của bạn để cung cấp hỗ trợ nhận biết ngữ cảnh.

Trong ví dụ hình ảnh trên, nếu bạn nhắc Build and analyze a complete sales forecast based on the sample retail data, tác nhân sẽ giúp xác định các bảng liên quan và đề xuất các cách nối và phương pháp phân tích phù hợp, biến những gì có thể mất hàng giờ thành vài phút. Để tự mình thử điều này, hãy điều hướng đến tab Overview trong môi trường SageMaker Studio của bạn và tìm sổ ghi chép Retail Sales Forecasting with SageMaker XGBoost trong bộ sưu tập sổ ghi chép mẫu—các ví dụ này tự động có sẵn khi bạn thiết lập SageMaker Studio lần đầu. Tác nhân chia nhỏ các quy trình làm việc phân tích phức tạp thành các bước có thể quản lý, có thể thực thi, để bạn có thể chuyển từ câu hỏi sang thông tin chi tiết nhanh hơn.

Tìm hiểu thêm về SageMaker

Trong bài đăng này, chúng tôi đã tập trung vào ba khả năng mới của SageMaker Unified Studio được cung cấp gần đây, nhưng chúng chỉ là một phần nhỏ trong hơn 40 lần ra mắt vào năm ngoái. Dưới đây là danh sách các video về các phiên re:Invent và kết quả có thể đo lường được từ các tổ chức hàng đầu áp dụng SageMaker Unified Studio, bao gồm:

  • Tóm tắt các lần ra mắt năm 2025: Có gì mới với Amazon SageMaker trong kỷ nguyên dữ liệu và AI hợp nhất (ANT216)
  • NatWest Group có kế hoạch mở rộng quy mô lên 72.000 nhân viên có quyền truy cập dữ liệu liên kết bằng cách sử dụng SageMaker Unified Studio. Xem bài thuyết trình của họ.
  • Commonwealth Bank of Australia đã di chuyển 10 petabyte và 61.000 pipeline vào AWS và đã thiết lập SageMaker Unified Studio để cung cấp quyền truy cập hợp nhất cho 40 lĩnh vực kinh doanh khác nhau trong hành trình chuyển đổi dữ liệu đang diễn ra của họ. Xem bài thuyết trình của họ.
  • Carrier Global Corporation đã cải thiện độ chính xác của tác nhân ngôn ngữ tự nhiên sang SQL lên 38% thông qua siêu dữ liệu được quản lý và bảng thuật ngữ kinh doanh của SageMaker Catalog. Xem bài thuyết trình của họ.
  • Bayer hiện đang có vị trí để onboarding hơn 300 TB dữ liệu dấu ấn sinh học và tích hợp các kho dữ liệu omics, lâm sàng và hóa học bị cô lập vào một môi trường gắn kết được xây dựng trên Amazon SageMaker. Đọc câu chuyện của họ.

Kết luận

Sử dụng sổ ghi chép phi máy chủ của Amazon SageMaker Unified Studio, phát triển hỗ trợ AI và quản trị hợp nhất, bạn có thể tăng tốc quy trình làm việc dữ liệu và AI của mình trên các chức năng của nhóm dữ liệu trong khi vẫn duy trì bảo mật và tuân thủ. Để tìm hiểu thêm, hãy truy cập trang sản phẩm SageMaker hoặc bắt đầu trong bảng điều khiển SageMaker.


Về tác giả

Siddharth Gupta

Siddharth đang dẫn đầu Generative AI trong các trải nghiệm hợp nhất của SageMaker. Trọng tâm của anh ấy là thúc đẩy các trải nghiệm tác nhân, nơi các hệ thống AI hoạt động tự chủ thay mặt người dùng để hoàn thành các tác vụ phức tạp. Là cựu sinh viên của Đại học Illinois tại Urbana-Champaign, anh ấy mang đến kinh nghiệm sâu rộng từ các vai trò của mình tại Yahoo, Glassdoor và Twitch.

Matt David

Matt là Giám đốc Tiếp thị Sản phẩm tại AWS, chuyên giúp các nhóm dữ liệu với phân tích được hỗ trợ bởi AI. Các lĩnh vực quan tâm của anh ấy bao gồm phân tích tự phục vụ, dân chủ hóa dữ liệu và chuẩn bị các tổ chức cho kỷ nguyên của các tác nhân AI. Anh ấy mang đến kinh nghiệm sâu rộng từ các vai trò của mình tại Atlassian, Hex và DataCamp.

Sean Ma

Sean là một nhà lãnh đạo tại Amazon SageMaker và là Giám đốc Sản phẩm Chính của AWS. Anh ấy đam mê cung cấp các sản phẩm mà các chuyên gia Dữ liệu và AI yêu thích thông qua thiết kế sản phẩm tập trung vào trải nghiệm người dùng. Hồ sơ đổi mới của Sean với các sản phẩm thành công bao gồm AWS Glue, Google Cloud Data Analytics, Informatica và Alteryx (Trifacta).