Xây dựng tác nhân AI với Amazon Bedrock AgentCore sử dụng AWS CloudFormation

Tác giả: Chintan Patel, Kosti Vasilakakis, và Shreyas Subramanian
Ngày phát hành: 23 JAN 2026
Chuyên mục: Amazon Bedrock, Amazon Bedrock AgentCore, AWS CloudFormation, Technical How-to

AI tác nhân (Agentic-AI) đã trở nên thiết yếu để triển khai các ứng dụng AI sẵn sàng cho sản xuất, nhưng nhiều nhà phát triển vẫn gặp khó khăn với sự phức tạp của việc cấu hình thủ công cơ sở hạ tầng tác nhân trên nhiều môi trường. Cơ sở hạ tầng dưới dạng mã (Infrastructure as code – IaC) tạo điều kiện cho cơ sở hạ tầng nhất quán, an toàn và có khả năng mở rộng mà các hệ thống AI tự động yêu cầu. Nó giảm thiểu lỗi cấu hình thủ công thông qua quản lý tài nguyên tự động và các mẫu khai báo, giảm thời gian triển khai từ hàng giờ xuống còn vài phút, đồng thời tạo điều kiện cho sự nhất quán của cơ sở hạ tầng trên các môi trường để giúp ngăn chặn hành vi tác nhân không thể đoán trước. IaC cung cấp khả năng kiểm soát phiên bản và khôi phục để nhanh chóng khắc phục sự cố, điều cần thiết để duy trì tính khả dụng của hệ thống tác nhân, và cho phép tự động mở rộng quy mô và tối ưu hóa tài nguyên thông qua các mẫu tham số hóa thích ứng từ phát triển nhẹ đến triển khai cấp sản xuất. Đối với các ứng dụng tác nhân hoạt động với sự can thiệp tối thiểu của con người, độ tin cậy của IaC, xác thực tự động các tiêu chuẩn bảo mật và tích hợp liền mạch vào quy trình làm việc DevOps là điều cần thiết cho các hoạt động tự động mạnh mẽ.

Để hợp lý hóa việc triển khai và quản lý tài nguyên, các dịch vụ Amazon Bedrock AgentCore hiện đang được hỗ trợ bởi nhiều framework IaC khác nhau như AWS Cloud Development Kit (AWS CDK), Terraform và AWS CloudFormation Templates. Sự tích hợp này mang sức mạnh của IaC trực tiếp đến AgentCore để các nhà phát triển có thể cấp phát, cấu hình và quản lý cơ sở hạ tầng tác nhân AI của họ. Trong bài viết này, chúng tôi sử dụng các mẫu CloudFormation để xây dựng một ứng dụng đầu cuối cho công cụ lập kế hoạch hoạt động dựa trên thời tiết. Các ví dụ về việc sử dụng CDK và Terraform có thể được tìm thấy tại Thư viện mẫu GitHub.

Xây dựng tác nhân lập kế hoạch hoạt động dựa trên thời tiết

Mẫu này tạo ra một công cụ lập kế hoạch hoạt động dựa trên thời tiết, minh họa một ứng dụng thực tế xử lý dữ liệu thời tiết theo thời gian thực để cung cấp các đề xuất hoạt động được cá nhân hóa dựa trên vị trí quan tâm. Ứng dụng bao gồm nhiều thành phần tích hợp:

Thu thập dữ liệu thời tiết theo thời gian thực – Ứng dụng truy xuất điều kiện thời tiết hiện tại từ các nguồn khí tượng có thẩm quyền như weather.gov, thu thập các điểm dữ liệu thiết yếu bao gồm nhiệt độ, dự báo xác suất mưa, đo tốc độ gió và các điều kiện khí quyển liên quan khác ảnh hưởng đến sự phù hợp của hoạt động ngoài trời.
Công cụ phân tích thời tiết – Ứng dụng xử lý dữ liệu khí tượng thô thông qua logic tùy chỉnh để đánh giá sự phù hợp của một ngày cho hoạt động ngoài trời dựa trên nhiều yếu tố thời tiết:
- Chấm điểm mức độ thoải mái về nhiệt độ – Các hoạt động nhận được điểm phù hợp giảm khi nhiệt độ xuống dưới 50°F
- Đánh giá rủi ro mưa – Xác suất mưa vượt quá 30% sẽ kích hoạt điều chỉnh các đề xuất hoạt động ngoài trời
- Đánh giá tác động của điều kiện gió – Tốc độ gió trên 15 mph ảnh hưởng đến mức độ thoải mái và an toàn tổng thể cho các hoạt động khác nhau
Hệ thống đề xuất cá nhân hóa – Ứng dụng xử lý kết quả phân tích thời tiết với sở thích người dùng và nhận thức dựa trên vị trí để tạo ra các đề xuất hoạt động phù hợp.

Sơ đồ sau đây minh họa luồng này.

Bây giờ, hãy cùng xem cách triển khai điều này bằng các dịch vụ AgentCore:

AgentCore Browser – Để tự động duyệt dữ liệu thời tiết từ các nguồn như weather.gov
AgentCore Code Interpreter – Để thực thi mã Python xử lý dữ liệu thời tiết, thực hiện các phép tính và triển khai các thuật toán chấm điểm
AgentCore Runtime – Để lưu trữ một tác nhân điều phối luồng ứng dụng, quản lý các pipeline xử lý dữ liệu và điều phối giữa các thành phần khác nhau
AgentCore Memory – Để lưu trữ tùy chọn người dùng dưới dạng bộ nhớ dài hạn

Sơ đồ sau đây minh họa kiến trúc này.

Triển khai mẫu CloudFormation

Tải xuống mẫu CloudFormation từ GitHub cho End-to-End-Weather-Agent.yaml về máy cục bộ của bạn
Mở CloudFormation từ AWS Console
Nhấp vào Create stack → With new resources (standard)
Chọn nguồn mẫu (tải lên tệp) và chọn mẫu của bạn
Nhập tên stack và thay đổi bất kỳ tham số cần thiết nào nếu cần
Xem lại cấu hình và xác nhận các khả năng IAM
Nhấp vào Submit và theo dõi tiến độ triển khai trên tab Events

Dưới đây là các bước trực quan để triển khai mẫu CloudFormation

Chạy và kiểm tra ứng dụng

Thêm khả năng quan sát và giám sát

Khả năng quan sát của AgentCore mang lại những lợi thế chính. Nó cung cấp chất lượng và sự tin cậy thông qua các hình ảnh hóa quy trình làm việc chi tiết và giám sát hiệu suất theo thời gian thực. Bạn có thể rút ngắn thời gian đưa sản phẩm ra thị trường bằng cách sử dụng các bảng điều khiển được hỗ trợ bởi Amazon CloudWatch giúp giảm tích hợp dữ liệu thủ công từ nhiều nguồn, giúp thực hiện các hành động khắc phục dựa trên thông tin chi tiết có thể hành động. Tính linh hoạt trong tích hợp với định dạng tương thích OpenTelemetry hỗ trợ các công cụ hiện có như CloudWatch, DataDog, Arize Phoenix, LangSmith, và LangFuse.

Dịch vụ này cung cấp khả năng truy xuất nguồn gốc đầu cuối trên các framework và mô hình nền tảng (foundation models – FMs), thu thập các chỉ số quan trọng như mức sử dụng token và các mẫu lựa chọn công cụ, đồng thời hỗ trợ cả công cụ tự động cho các tác nhân được lưu trữ trên AgentCore Runtime và giám sát có thể cấu hình cho các tác nhân được triển khai trên các dịch vụ khác. Phương pháp quan sát toàn diện này giúp các tổ chức đạt được chu kỳ phát triển nhanh hơn, hành vi tác nhân đáng tin cậy hơn và khả năng hiển thị hoạt động được cải thiện trong khi xây dựng các tác nhân AI đáng tin cậy ở quy mô lớn.

Ảnh chụp màn hình sau đây hiển thị các chỉ số trong giao diện người dùng AgentCore Runtime.

Tùy chỉnh cho trường hợp sử dụng của bạn

Mẫu AWS CloudFormation của công cụ lập kế hoạch hoạt động dựa trên thời tiết được thiết kế với các thành phần mô-đun có thể dễ dàng điều chỉnh cho nhiều ứng dụng khác nhau. Ví dụ, bạn có thể tùy chỉnh công cụ AgentCore Browser để thu thập thông tin từ các ứng dụng web khác nhau (như các trang web tài chính để hướng dẫn đầu tư, nguồn cấp dữ liệu mạng xã hội để giám sát cảm xúc, hoặc các trang thương mại điện tử để theo dõi giá), sửa đổi các thuật toán AgentCore Code Interpreter để xử lý logic nghiệp vụ cụ thể của bạn (như mô hình dự đoán để dự báo doanh số, đánh giá rủi ro cho bảo hiểm, hoặc kiểm soát chất lượng cho sản xuất), điều chỉnh thành phần AgentCore Memory để lưu trữ các tùy chọn người dùng hoặc ngữ cảnh nghiệp vụ liên quan (như hồ sơ khách hàng, mức tồn kho, hoặc yêu cầu dự án), và cấu hình lại các tác vụ Strands Agents để điều phối các quy trình làm việc cụ thể cho lĩnh vực của bạn (như tối ưu hóa chuỗi cung ứng, tự động hóa dịch vụ khách hàng, hoặc giám sát tuân thủ).

Các phương pháp hay nhất để triển khai

Chúng tôi khuyến nghị các phương pháp sau cho việc triển khai của bạn:

Kiến trúc thành phần mô-đun – Thiết kế các mẫu AWS CloudFormation với các phần riêng biệt cho từng dịch vụ AWS.
Thiết kế mẫu tham số hóa – Sử dụng các tham số AWS CloudFormation cho các yếu tố có thể cấu hình để tạo điều kiện cho các mẫu có thể tái sử dụng trên các môi trường. Ví dụ, điều này có thể giúp liên kết cùng một vùng chứa cơ sở với nhiều triển khai tác nhân, giúp trỏ đến hai cấu hình xây dựng khác nhau hoặc tham số hóa LLM được chọn để cung cấp năng lượng cho các tác nhân của bạn.
Bảo mật AWS Identity and Access Management (IAM) và nguyên tắc đặc quyền tối thiểu – Triển khai các vai trò IAM chi tiết cho từng thành phần AgentCore với Amazon Resource Names (ARNs) tài nguyên cụ thể. Tham khảo tài liệu của chúng tôi về các cân nhắc bảo mật của AgentCore.
Giám sát và khả năng quan sát toàn diện – Bật ghi nhật ký CloudWatch, các chỉ số tùy chỉnh, theo dõi phân tán AWS X-Ray và cảnh báo trên các thành phần.
Kiểm soát phiên bản và tích hợp liên tục/triển khai liên tục (CI/CD) – Duy trì các mẫu trong GitHub với xác thực tự động, kiểm thử toàn diện và AWS CloudFormation StackSets để triển khai đa Region nhất quán.

Bạn có thể tìm thấy bộ các phương pháp hay nhất toàn diện hơn tại các phương pháp hay nhất của CloudFormation

Dọn dẹp tài nguyên

Để tránh phát sinh chi phí trong tương lai, hãy xóa các tài nguyên được sử dụng trong giải pháp này:

Trên bảng điều khiển Amazon S3, xóa thủ công nội dung bên trong bucket bạn đã tạo để triển khai mẫu và sau đó xóa bucket.
Trên bảng điều khiển CloudFormation, chọn Stacks trong ngăn điều hướng, chọn stack chính và chọn Delete.

Kết luận

Trong bài viết này, chúng tôi đã giới thiệu một giải pháp tự động để triển khai các dịch vụ AgentCore bằng AWS CloudFormation. Các mẫu được cấu hình sẵn này cho phép triển khai nhanh chóng các hệ thống AI tác nhân mạnh mẽ mà không cần sự phức tạp của việc thiết lập thành phần thủ công. Phương pháp tự động này giúp tiết kiệm thời gian và tạo điều kiện cho việc triển khai nhất quán và có thể tái tạo, giúp bạn tập trung vào việc xây dựng các quy trình làm việc AI tác nhân thúc đẩy tăng trưởng kinh doanh.

Hãy thử thêm một số ví dụ từ các kho lưu trữ mẫu Cơ sở hạ tầng dưới dạng mã của chúng tôi:

Về tác giả

Chintan Patel là Kiến trúc sư Giải pháp Cấp cao tại AWS với kinh nghiệm sâu rộng trong thiết kế và phát triển giải pháp. Anh ấy giúp các tổ chức thuộc nhiều ngành khác nhau hiện đại hóa cơ sở hạ tầng, làm rõ các công nghệ AI tạo sinh và tối ưu hóa các khoản đầu tư vào đám mây của họ. Ngoài công việc, anh ấy thích dành thời gian cho các con, chơi pickleball và thử nghiệm với các công cụ AI.

Shreyas Subramanian là Nhà khoa học Dữ liệu Chính và giúp khách hàng giải quyết các thách thức kinh doanh bằng cách sử dụng AI tạo sinh và học sâu với các dịch vụ AWS như Amazon Bedrock và AgentCore. Tiến sĩ Subramanian đóng góp vào nghiên cứu tiên tiến về học sâu, AI tác nhân, các mô hình nền tảng và kỹ thuật tối ưu hóa với nhiều sách, bài báo và bằng sáng chế mang tên mình. Trong vai trò hiện tại tại Amazon, Tiến sĩ Subramanian làm việc với nhiều nhà lãnh đạo khoa học và nhóm nghiên cứu trong và ngoài Amazon, giúp hướng dẫn khách hàng tận dụng tốt nhất các thuật toán và kỹ thuật tiên tiến để giải quyết các vấn đề kinh doanh quan trọng. Ngoài AWS, Tiến sĩ Subramanian là một chuyên gia đánh giá các bài báo AI và tài trợ thông qua các tổ chức như Neurips, ICML, ICLR, NASA và NSF.

Kosti Vasilakakis là PM Chính tại AWS trong nhóm AI tác nhân, nơi anh đã dẫn dắt thiết kế và phát triển một số dịch vụ Bedrock AgentCore từ đầu, bao gồm Runtime. Trước đây, anh đã làm việc trên Amazon SageMaker từ những ngày đầu, ra mắt các khả năng AI/ML hiện đang được hàng nghìn công ty trên toàn thế giới sử dụng. Đầu sự nghiệp, Kosti là một nhà khoa học dữ liệu. Ngoài công việc, anh ấy xây dựng các tự động hóa năng suất cá nhân, chơi tennis và khám phá thiên nhiên hoang dã cùng gia đình.

AWS Study Group

Xây dựng tác nhân AI với Amazon Bedrock AgentCore sử dụng AWS CloudFormation