Thiết kế kiến trúc môi trường sandbox AI an toàn trên AWS GovCloud (US)

Tác giả: Mohan CV và James Park
Ngày phát hành: 28 JAN 2026
Chuyên mục: Artificial Intelligence, AWS GovCloud (US), Government, Public Sector, Technical How-to

AWS branded background with text "Architecting secure AI sandboxes in AWS GovCloud (US)"

Xin lưu ý rằng bài viết sau đây chỉ dành cho mục đích thông tin. Phương pháp chi tiết dưới đây có thể không phù hợp với tất cả các tổ chức và/hoặc chương trình tuân thủ. Điều quan trọng là phải đánh giá giải pháp tiềm năng này dựa trên nhu cầu tuân thủ của tổ chức bạn và bất kỳ nghĩa vụ pháp lý hiện hành nào mà bạn có thể có.

Việc áp dụng Generative AI đang thay đổi cách các tổ chức khu vực công hoạt động. Tuy nhiên, các cơ quan chính phủ và đối tác của họ phải đối mặt với những thách thức riêng khi áp dụng các công nghệ này, bao gồm các yêu cầu nghiêm ngặt về quyền riêng tư dữ liệu, các chương trình tuân thủ quy định như Chương trình Quản lý Rủi ro và Cấp phép Liên bang (FedRAMP), và nhu cầu hoạt động trong các môi trường biệt lập đáp ứng các tiêu chuẩn bảo mật liên bang.

Bài viết trước của chúng tôi trên AWS Public Sector Blog, “Trao quyền cho khu vực công với thử nghiệm Generative AI an toàn, có quản lý,” đã giới thiệu Generative AI Sandbox trên Amazon Web Services (AWS) được hỗ trợ bởi Amazon Bedrock trong SageMaker Unified Studio và Amazon DataZone. Các tổ chức hoạt động trong AWS GovCloud (US) có thể yêu cầu các phương pháp kiến trúc thay thế, tùy thuộc vào tính khả dụng của dịch vụ trong Region mục tiêu của họ. Bài viết này trình bày một kiến trúc có thể triển khai trên AWS GovCloud (US) để thử nghiệm Generative AI an toàn bằng cách sử dụng Amazon SageMaker AI, AWS Lake Formation và Amazon Bedrock.

Các cân nhắc chính cho môi trường AWS GovCloud (US)

Các tổ chức khu vực công thường đối mặt với ba cân nhắc chính khi áp dụng Generative AI:

Quyền riêng tư và bảo mật dữ liệu – Các cơ quan chính phủ và đối tác xử lý dữ liệu công dân nhạy cảm, yêu cầu các giao thức quản trị.
Khung tuân thủ – Các quy định có thể hạn chế các trường hợp sử dụng được phép, và các giải pháp của khách hàng có thể cần đáp ứng các yêu cầu của FedRAMP, Hướng dẫn Yêu cầu Bảo mật Điện toán Đám mây của Bộ Quốc phòng (DoD CC SRG), và/hoặc Quy định về Giao thông Vũ khí Quốc tế (ITAR).
Khoảng cách về kỹ năng và năng lực – Các tổ chức thường thiếu chuyên môn nội bộ về AI và machine learning (ML) để triển khai và duy trì hiệu quả các hệ thống Generative AI.

Các Region của AWS GovCloud (US) có những khác biệt cấp cao so với các Region AWS tiêu chuẩn, và điều quan trọng là phải đánh giá những khác biệt này khi thiết kế kiến trúc của bạn. Trước khi triển khai bất kỳ giải pháp nào, hãy tham khảo Tài liệu AWS GovCloud (US) hiện hành để xác minh tính khả dụng của dịch vụ và sự tương đồng về tính năng cho các yêu cầu cụ thể của bạn.

Tổng quan giải pháp

Generative AI Sandbox trên AWS GovCloud (US) cung cấp một môi trường an toàn, có quản lý và biệt lập để các tổ chức khám phá các mô hình ngôn ngữ lớn (LLM) và các khả năng Generative AI khác. Người dùng có thể sử dụng sandbox này để tạo trợ lý AI tùy chỉnh và tăng cường tương tác LLM bằng cách tích hợp dữ liệu và tài liệu độc quyền của tổ chức họ. Được xây dựng trên các dịch vụ AWS GovCloud (US), giải pháp này giúp người dùng ở mọi cấp độ kỹ năng thực hành với Generative AI đồng thời giảm chi phí quản lý dữ liệu, quản trị mô hình và vận hành cơ sở hạ tầng.

Các khả năng cần thiết

Khi thiết kế một Generative AI sandbox cho môi trường AWS GovCloud (US), các tổ chức phải giải quyết một số khả năng chính. Danh sách sau đây phác thảo các khả năng chính và cách chúng có thể ánh xạ tới các dịch vụ và khả năng của AWS GovCloud (US):

Xác thực – Các tổ chức có thể triển khai các URL được ký trước (presigned URLs) được tạo thông qua AWS Lambda để xác thực các xác nhận SAML hoặc JSON Web Tokens (JWTs) đối với nhà cung cấp danh tính (IdP) hiện có của tổ chức, cho phép trải nghiệm giống như đăng nhập một lần (single sign-on) trong khi vẫn duy trì các yêu cầu bảo mật.
Cách ly không gian làm việc – Amazon SageMaker AI trong AWS GovCloud (US) sử dụng các domain và shared space để cung cấp ranh giới tổ chức cho các nhóm và dự án, hỗ trợ phân tách giữa các phòng ban và các lĩnh vực kinh doanh dưới các cấu hình bảo mật, mạng và chính sách riêng biệt.
Quản trị dữ liệu – AWS Lake Formation kết hợp với AWS Glue Data Catalog cung cấp kiểm soát truy cập chi tiết tập trung cho dữ liệu trong Amazon Simple Storage Service (Amazon S3), bao gồm kiểm soát truy cập cấp cơ sở dữ liệu, bảng, cột, hàng và ô.
Kiểm soát truy cập và quyền hạn – Các quyền của AWS Lake Formation hoạt động cùng với các quyền của AWS Identity and Access Management (IAM) và kiểm soát truy cập dựa trên thẻ (tag-based) hoặc dựa trên thuộc tính (ABAC) để thực thi quyền truy cập ít đặc quyền nhất vào dữ liệu được quản lý cho các nhóm ML và khoa học dữ liệu khác nhau.
Kết nối mạng an toàn – AWS PrivateLink và các điểm cuối giao diện Amazon Virtual Private Cloud (Amazon VPC) giữ cho giao tiếp giữa VPC của khách hàng và các dịch vụ được quản lý của AWS nằm trong mạng AWS và ngăn không cho nó đi qua internet công cộng.
Truy cập mô hình nền tảng – Amazon Bedrock cung cấp quyền truy cập vào các mô hình nền tảng (FMs) với các kiểm soát bảo mật cấp doanh nghiệp và cách ly dữ liệu, cho phép phát triển và thử nghiệm các ứng dụng Generative AI trong một môi trường tuân thủ.
Môi trường thử nghiệm – Các notebook của Amazon SageMaker AI Studio cung cấp một sandbox ưu tiên mã (code-first), nơi người dùng có thể chạy các notebook dựa trên Jupyter và tích hợp các lệnh gọi Generative AI (ví dụ: tới Amazon Bedrock) trực tiếp từ các notebook; các tổ chức có thể tiêu chuẩn hóa các notebook được tuyển chọn cho các trợ lý dựa trên trò chuyện, các mẫu Retrieval Augmented Generation (RAG) và các quy trình làm việc Generative AI khác.
Tuân thủ và kiểm toán – AWS CloudTrail và AWS Config ghi lại hoạt động API và các thay đổi cấu hình, hỗ trợ giám sát liên tục, báo cáo tuân thủ và điều tra.
Quyền riêng tư và bảo mật dữ liệu – Với Amazon Bedrock, dữ liệu khách hàng không được sử dụng để huấn luyện các FM cơ bản hoặc chia sẻ với các nhà cung cấp mô hình, và các tổ chức nên thực thi mã hóa khi lưu trữ và khi truyền tải cùng với các mẫu cách ly đối tượng thuê mạnh mẽ trên các lớp lưu trữ và mạng.

Với các khả năng và giải pháp mong muốn đã được xác định, giờ đây chúng ta có thể xem xét cách các thành phần này kết hợp với nhau về mặt kiến trúc trong AWS GovCloud (US). Mỗi khả năng được xác định trong danh sách trước đó được đánh số từ 1–9 trong kiến trúc sau.

Hình 1: Kiến trúc cấp cao của Generative AI Sandbox trên AWS GovCloud (US), làm nổi bật Amazon SageMaker AI Studio, AWS Lake Formation, AWS Glue, Amazon Bedrock và các dịch vụ hỗ trợ

Xác thực và truy cập

Xác thực được triển khai bằng cách sử dụng các URL được ký trước (presigned URLs) được tạo bởi một hàm AWS Lambda, hàm này xác thực danh tính của người yêu cầu—ví dụ, sử dụng liên kết SAML hoặc OpenID Connect (OIDC) vào các vai trò IAM—trước khi cấp quyền truy cập có giới hạn thời gian vào SageMaker AI Studio. Các tổ chức có thể sử dụng mẫu này để duy trì các luồng thông tin xác thực tổ chức hiện có trong khi tập trung sự tin cậy vào các vai trò và chính sách IAM.

Người dùng được ánh xạ tới các vai trò phản ánh tư cách thành viên nhóm và trách nhiệm, điều này có nghĩa là các nhóm bảo mật có thể thực thi quyền truy cập ít đặc quyền nhất thông qua kiểm soát truy cập dựa trên vai trò và—nếu phù hợp—các điều kiện dựa trên thẻ để đưa ra các quyết định chính sách chi tiết hơn.

Lớp dữ liệu và quản trị

AWS Lake Formation hoạt động như lớp quản trị trên dữ liệu được lưu trữ trong Amazon S3 và siêu dữ liệu được định nghĩa trong AWS Glue Data Catalog. Các quyền của Lake Formation, kết hợp với IAM, cung cấp các kiểm soát chi tiết tập trung xuống cấp cơ sở dữ liệu, bảng, cột, hàng và ô cho các tập dữ liệu được quản lý.

Để sử dụng Lake Formation từ SageMaker AI Studio, quản trị viên đăng ký các vai trò thực thi của SageMaker AI Studio làm các principal của Lake Formation data lake. Từ đó, người dùng có thể truy cập dữ liệu được quản lý bằng cách sử dụng:

Các công cụ truy vấn như Amazon Athena trực tiếp từ các notebook
Kết nối tích hợp với Amazon EMR bằng cách sử dụng các vai trò runtime
Các phiên tương tác của AWS Glue với các kernel notebook tích hợp

Mẫu này cho phép sandbox hiển thị các tập dữ liệu phong phú cho người dùng trong khi vẫn duy trì các kiểm soát truy cập mạnh mẽ và khả năng kiểm toán.

Tổ chức không gian làm việc: Domain và Shared Space

Amazon SageMaker AI Studio tổ chức các tài nguyên người dùng bằng cách sử dụng các domain và shared space:

Domain — Một domain của SageMaker AI Studio là cấu trúc cấp cao nhất định nghĩa môi trường Studio trong một tài khoản và Region, bao gồm một volume Amazon Elastic File System (Amazon EFS) liên quan, danh sách hồ sơ người dùng, và các cấu hình bảo mật, ứng dụng, chính sách và Amazon VPC. Trong mỗi domain, mỗi hồ sơ người dùng có một thư mục chính biệt lập trên volume EFS được chia sẻ đó, và tất cả người dùng cùng các ứng dụng Studio của họ hoạt động trong cùng một ranh giới mạng và bảo mật được định nghĩa bởi domain.
Shared space — Một shared space của SageMaker AI Studio là một khu vực cộng tác được tạo trong một domain duy nhất, cung cấp một thư mục được chia sẻ trên volume EFS của domain để nhiều hồ sơ người dùng có thể cùng chỉnh sửa notebook và chia sẻ tệp gần như theo thời gian thực. Quyền truy cập vào một shared space được kiểm soát bởi tư cách thành viên không gian và các quyền liên quan cùng vai trò thực thi của nó, với việc phân tách dữ liệu được thực thi thông qua các quyền hệ thống tệp và IAM trên volume EFS được chia sẻ thay vì các ranh giới lưu trữ hoặc mạng riêng biệt.

Sử dụng các domain và shared space để cộng tác theo cách phù hợp nhất với yêu cầu của tổ chức bạn. Các domain phù hợp với các yêu cầu bảo mật và đối tượng thuê, và các shared space phù hợp với các nhóm hoặc dự án cần cộng tác trong một domain nhất định. Một mẫu thực tế là:

Sử dụng một domain cho mỗi lĩnh vực kinh doanh hoặc ranh giới cách ly cứng khác nơi bạn cần các chế độ xác thực, VPC, kiểm soát mạng hoặc rào chắn IAM riêng biệt.
Trong mỗi domain, tạo một shared space cho mỗi dự án hoặc mỗi nhóm sản phẩm, để tất cả những người cộng tác chia sẻ notebook, mã và tạo phẩm trong không gian đó trong khi kế thừa các cài đặt mạng và bảo mật của domain.

Mô hình truy cập và quyền hạn từ đầu đến cuối

Tổng hợp các phần này lại, mối quan hệ giữa các shared space của SageMaker, các vai trò thực thi và quyền truy cập dữ liệu được quản lý bởi Lake Formation có thể được phân tích thành một mô hình quyền hạn hoàn chỉnh như sau:

Truy cập không gian – Tất cả các hồ sơ người dùng trong một domain SageMaker có thể mở và làm việc trong các shared space trong domain đó, miễn là họ có quyền IAM để liệt kê và truy cập các không gian đó.
Quyền cơ bản – Sau khi ở trong một shared space, người dùng hoạt động dưới vai trò thực thi mặc định của không gian đó để truy cập tài nguyên AWS chung.
Quyền cụ thể về dữ liệu – Khi truy cập dữ liệu được quản lý bởi Lake Formation từ các workload trong một shared space, Lake Formation đánh giá các quyền cho vai trò IAM được sử dụng bởi workload đó (thường là vai trò thực thi của không gian), được cấu hình hoặc coi là một DataLakePrincipal.
Nhật ký kiểm toán – Tất cả quyền truy cập dữ liệu được quản lý bởi Lake Formation có thể được kiểm toán trong CloudTrail, nơi các sự kiện API của Lake Formation như lakeformation:GetDataAccess ghi lại principal IAM nào đã truy cập tài nguyên được quản lý nào và khi nào.

Để minh họa rõ nhất mô hình quyền hạn này, hình ảnh sau đây trình bày một ví dụ về bố cục quyền hạn cho một cơ quan liên bang hư cấu (“Example Corp”) tổ chức các domain và shared space của SageMaker xung quanh các bộ phận kinh doanh và nhóm. Nó làm nổi bật cách mỗi shared space được liên kết với vai trò thực thi riêng của nó và các tập dữ liệu được quản lý bởi Lake Formation có phạm vi.

Hình 2: Ví dụ về bố cục tổ chức cho Example Corp sử dụng các domain và shared space của SageMaker Studio, hiển thị các domain chăm sóc sức khỏe và tài chính, mỗi domain có nhiều shared space sử dụng các vai trò thực thi riêng biệt được ánh xạ tới các tập dữ liệu được quản lý bởi Lake Formation.

Kết nối mạng an toàn

Tất cả giao tiếp giữa các workload trong VPC của khách hàng và các dịch vụ được quản lý của AWS được hỗ trợ (như SageMaker APIs, Amazon S3, AWS Glue và Amazon Bedrock) được định tuyến thông qua các VPC endpoint, thường xuyên nhất là sử dụng các interface endpoint được hỗ trợ bởi AWS PrivateLink và các gateway endpoint khi áp dụng. Phương pháp này giữ lưu lượng truy cập trong mạng AWS GovCloud (US) và hỗ trợ các yêu cầu tuân thủ nghiêm ngặt hơn đối với lưu lượng truy cập internet đi ra.

Truy cập mô hình nền tảng

Amazon Bedrock trong AWS GovCloud (US) cung cấp quyền truy cập được quản lý vào một tập hợp các FM được tuyển chọn dưới một mặt phẳng điều khiển được quản lý hoàn toàn, tập trung vào bảo mật. Từ các notebook Studio hoặc các client khác trong sandbox, các nhóm có thể gọi Amazon Bedrock APIs để thử nghiệm với kỹ thuật prompt, các mẫu RAG và các luồng giống như agent mà không cần quản lý cơ sở hạ tầng mô hình.

Các quy trình làm việc được điều phối với AWS Step Functions và SageMaker Pipelines

Ngoài việc thử nghiệm tương tác trong các notebook, các tổ chức có thể tùy chọn thêm một lớp điều phối bằng cách sử dụng AWS Step Functions và, khi thích hợp, Amazon SageMaker Pipelines. Các dịch vụ này định nghĩa các quy trình làm việc lặp lại, nhiều bước kết nối chuẩn bị dữ liệu, tạo embedding hoặc tính năng, gọi mô hình và đánh giá hạ nguồn thành một quy trình duy nhất, có thể theo dõi. Step Functions thường là lựa chọn hàng đầu cho các luồng dựa trên Amazon Bedrock vì nó nhẹ, hướng sự kiện và tích hợp dễ dàng với AWS Lambda, Amazon Bedrock APIs và các dịch vụ khác, trong khi SageMaker Pipelines phù hợp nhất khi bạn cần các cấu trúc tập trung vào ML (như các bước xử lý và huấn luyện) và quản trị theo kiểu tích hợp liên tục và phân phối liên tục (CI/CD) xung quanh các quy trình làm việc kết hợp ML và Generative AI.

Trong một Generative AI sandbox, một quy trình làm việc có thể điều phối các tác vụ gọi Amazon Bedrock cho các thử nghiệm kỹ thuật prompt, suy luận hàng loạt hoặc RAG. Ví dụ, một luồng được điều phối có thể nhập và làm sạch tài liệu nguồn, tạo embedding bằng cách sử dụng mô hình embedding của Amazon Bedrock, lưu trữ vector vào cơ sở dữ liệu hoặc chỉ mục vector, và sau đó gọi các FM của Bedrock để trả lời câu hỏi hoặc tóm tắt. Trong hầu hết các kịch bản chỉ sử dụng Bedrock, điều này có thể được triển khai dưới dạng một máy trạng thái Step Functions điều phối các hàm Lambda và các lệnh gọi Bedrock, trong khi SageMaker Pipelines được dành riêng cho các trường hợp sử dụng nặng về ML hơn, nơi bạn kết hợp các bước xử lý dữ liệu truyền thống hoặc huấn luyện mô hình với các hoạt động Generative AI bên trong một định nghĩa pipeline được quản lý duy nhất.

Đồ họa sau đây cho thấy một ví dụ về máy trạng thái AWS Step Functions cho một quy trình làm việc dựa trên Amazon Bedrock. Nó minh họa cách một yêu cầu người dùng hoặc sự kiện theo lịch trình kích hoạt một máy trạng thái điều phối một hàm Lambda để truy xuất và tiền xử lý dữ liệu và một bước gọi Amazon Bedrock để suy luận LLM trước khi lưu trữ kết quả hoặc trả về phản hồi.

Hình 3: Ví dụ về máy trạng thái AWS Step Functions cho một quy trình làm việc dựa trên Amazon Bedrock

Đồ họa sau đây cho thấy một ví dụ về Amazon SageMaker Pipeline cho một quy trình làm việc RAG, hiển thị các bước tuần tự để chuẩn bị dữ liệu, tạo embedding, lưu trữ vector, suy luận LLM với các FM, và đánh giá và ghi nhật ký, tất cả đều được định nghĩa là các bước của SageMaker Pipeline trong một định nghĩa pipeline duy nhất.

Hình 4: Ví dụ về Amazon SageMaker Pipeline

Các phương pháp hay nhất

Kiến trúc này đại diện cho một mẫu được khuyến nghị cho một Generative AI sandbox trong AWS GovCloud (US) nhưng không phải là thiết kế duy nhất có thể. Hãy xem xét các phương pháp hay nhất sau đây để tối ưu hóa trong tương lai:

Tối ưu hóa hiệu suất – Sử dụng các notebook của SageMaker AI Studio với các phiên tương tác của AWS Glue, tích hợp Amazon EMR hoặc Amazon Athena để xử lý dữ liệu có khả năng mở rộng. Điều chỉnh các loại instance và chính sách tự động mở rộng để phù hợp với hồ sơ workload.
Quản lý chi phí – Sử dụng các thẻ trên các domain SageMaker, shared space và tài nguyên Lake Formation để theo dõi chi tiêu cho mỗi dự án hoặc nhóm. Sử dụng mô hình định giá theo yêu cầu của Amazon Bedrock cùng với hạn ngạch và cảnh báo ngân sách để kiểm soát chi phí thử nghiệm.

Bắt đầu

Để bắt đầu hành trình Generative AI của bạn trong AWS GovCloud (US):

Cung cấp một tài khoản AWS GovCloud (US) biệt lập theo các phương pháp hay nhất về đa tài khoản và bảo mật của AWS.
Cấu hình xác thực và liên kết dựa trên IAM và triển khai các mẫu truy cập được kiểm soát bằng URL được ký trước hoặc tương tự vào Studio.
Thiết lập các domain của SageMaker Studio phù hợp với ranh giới tổ chức và đối tượng thuê, sau đó tạo các shared space phù hợp với các nhóm và dự án.
Đưa các tập dữ liệu được quản lý vào Lake Formation và AWS Glue Data Catalog và tích hợp Studio với quyền truy cập được quản lý.
Khám phá các workshop về Generative AI của AWS, kiến trúc tham chiếu và tài liệu cụ thể của AWS GovCloud (US) để lặp lại thiết kế sandbox theo thời gian.

Kết luận

Kiến trúc AWS GovCloud (US) này cung cấp một môi trường an toàn cho thử nghiệm Generative AI tập trung vào các trường hợp sử dụng phát triển và sandbox. Bằng cách kết hợp các cấu trúc domain và shared space của SageMaker AI Studio với kiểm soát truy cập chi tiết của Lake Formation và quyền truy cập FM được quản lý của Amazon Bedrock, các tổ chức có thể cho phép thử nghiệm có hệ thống trong khi vẫn đáp ứng các kỳ vọng bảo mật của các workload liên bang.

Các nhóm có thể nhanh chóng tạo mẫu, cộng tác và chia sẻ các mẫu thành công trong một không gian làm việc được kiểm soát, đẩy nhanh con đường từ khám phá đến các giải pháp sẵn sàng sản xuất trên AWS GovCloud (US).

Tài nguyên bổ sung

Khám phá các tài nguyên bổ sung này để tiếp tục tìm hiểu về cách AWS có thể giúp cung cấp năng lượng cho các giải pháp Generative AI của bạn:

Về tác giả

Mohan CV
Mohan là kiến trúc sư chính tại AWS, đam mê giúp đỡ các đối tác và khách hàng tận dụng các công nghệ mới nổi như AI tác nhân (agentic AI) để chuyển đổi tổ chức của họ và cung cấp các giải pháp sáng tạo giải quyết các thách thức kinh doanh phức tạp. Ông có kinh nghiệm sâu rộng trong việc dẫn dắt các chuyển đổi kỹ thuật số quy mô lớn, chuyên về dữ liệu, phân tích và AI.

James Park
James là kiến trúc sư giải pháp tại AWS, làm việc với các đối tác tích hợp hệ thống toàn cầu của chúng tôi để cung cấp các giải pháp nhiệm vụ an toàn trên AWS cho khách hàng liên bang. James chuyên về AI/ML. Trong thời gian rảnh rỗi, anh ấy bận rộn khám phá những địa điểm mới cùng chú chó của mình hoặc lên kế hoạch cho chuyến đi nước ngoài tiếp theo.

AWS Study Group

Thiết kế kiến trúc môi trường sandbox AI an toàn trên AWS GovCloud (US)