Tăng tốc phát triển ứng dụng agentic với template full-stack khởi đầu cho Amazon Bedrock AgentCore

Tác giả: David Kaleko, Anurag Bhagat, Davide Merlin, Monica Raj, Isaac Privitera, Ryan Razkenari, và Brian Zambrano
Ngày phát hành: 09 FEB 2026
Chuyên mục: Amazon API Gateway, Amazon Bedrock, Amazon Bedrock AgentCore, Amazon Cognito, Amazon DynamoDB, Artificial Intelligence, AWS Amplify, AWS CloudFormation, AWS Professional Services, Generative AI*, Intermediate (200), Kiro, Python, Serverless, Strands Agents, Technical How-to

AI tạo sinh (Generative AI) và các ứng dụng tác nhân (agentic applications) đang định hình lại cách các doanh nghiệp hoạt động—từ bot hỗ trợ khách hàng đến trợ lý nghiên cứu—và các nhóm cần nhanh chóng chuyển từ nguyên mẫu sang sản xuất. Năm ngoái, AWS đã phát hành Amazon Bedrock AgentCore—một nền tảng phát triển để xây dựng, triển khai và mở rộng các tác nhân AI trong môi trường sản xuất. AgentCore cung cấp các khối xây dựng cốt lõi như lưu trữ runtime, bộ nhớ, tích hợp công cụ và khả năng quan sát với bảo mật cấp doanh nghiệp và khả năng mở rộng động.

Fullstack AgentCore Solution Template (FAST) cho bạn thấy cách mọi thứ hoạt động cùng nhau ngay từ đầu. Đây là một dự án khởi đầu sẵn sàng triển khai, kết nối AgentCore Runtime, Gateway, Memory và Code Interpreter với giao diện người dùng React và xác thực Amazon Cognito—tất cả được định nghĩa bằng AWS Cloud Development Kit (AWS CDK). FAST cung cấp một kiến trúc tham chiếu hoàn chỉnh cho thấy cách các thành phần tích hợp, với một ứng dụng trò chuyện hoạt động mà bạn có thể học hỏi và xây dựng dựa trên đó.

Trong bài đăng này, bạn sẽ tìm hiểu cách triển khai FAST vào tài khoản Amazon Web Services (AWS) của mình, hiểu kiến trúc của nó và xem cách mở rộng nó cho các yêu cầu của bạn. Bạn sẽ học cách xây dựng tác nhân của riêng mình trong khi FAST xử lý xác thực, cơ sở hạ tầng dưới dạng mã (IaC), các pipeline triển khai và tích hợp dịch vụ.

Tổng quan giải pháp

FAST cung cấp một kiến trúc full-stack hoàn chỉnh để triển khai các tác nhân trên Amazon Bedrock AgentCore. Mẫu này xử lý xác thực, lưu trữ ứng dụng frontend, runtime tác nhân, bộ nhớ, khả năng quan sát và tích hợp công cụ Model Context Protocol (MCP) theo mặc định.

Sơ đồ kiến trúc AWS cho thấy một ứng dụng tác nhân AI sử dụng Amazon Bedrock AgentCore với điều phối đa tác nhân, bao gồm xác thực người dùng thông qua Cognito, API Gateway, lớp tính toán Lambda, AgentCore Runtime với trình thông dịch mã, bộ nhớ, gateway và các thành phần quan sát, lưu trữ DynamoDB và giám sát CloudWatch/X-Ray.

Kiến trúc tập trung vào Amazon Bedrock AgentCore Runtime, nơi lưu trữ tác nhân của bạn. Trong FAST, người dùng xác thực thông qua Amazon Cognito, bảo mật bốn điểm tích hợp:

  1. Đăng nhập người dùng vào ứng dụng web frontend trên Amazon CloudFront
  2. Xác thực dựa trên token cho frontend để truy cập AgentCore Runtime
  3. Xác thực dựa trên token cho các tác nhân để truy cập AgentCore Gateway
  4. Xác thực dựa trên token cho các yêu cầu API tới Amazon API Gateway

Frontend là một ứng dụng React sử dụng Tailwind CSS và các thành phần shadcn, được lưu trữ trên AWS Amplify Hosting. Nó giao tiếp với AgentCore Runtime bằng HTTP có thể truyền tải (streamable HTTP) để truyền tải phản hồi theo thời gian thực.

Cơ chế phản hồi được cung cấp để minh họa cách thực hiện các cuộc gọi HTTP đồng bộ và được xác thực thông qua API Gateway và lưu trữ dữ liệu ứng dụng trong Dynamo DB. AgentCore Runtime kết nối với một số khả năng của AgentCore:

  • AgentCore Memory – Lưu trữ lịch sử cuộc trò chuyện (ngắn hạn) và các thông tin chi tiết được trích xuất như tùy chọn người dùng (dài hạn), để tác nhân của bạn ghi nhớ ngữ cảnh giữa các phiên mà không cần công việc cơ sở dữ liệu tùy chỉnh. (FAST bao gồm bộ nhớ ngắn hạn theo mặc định, và bộ nhớ dài hạn có thể được thêm vào một cách liền mạch với những sửa đổi nhỏ.)
  • AgentCore Gateway – Phơi bày các API dưới dạng các công cụ tương thích với Model Context Protocol (MCP) cho các tác nhân của bạn
  • AgentCore Code Interpreter – Thực thi mã Python một cách an toàn trong các môi trường sandbox biệt lập
  • AgentCore Observability – Gửi các số liệu và nhật ký tương thích với Open Telemetry (OTEL) tới Amazon CloudWatch và các dấu vết tới AWS X-Ray

Mẫu này bao gồm các mẫu cho Strands AgentsLangGraph. FAST và AgentCore không phụ thuộc vào framework tác nhân, vì vậy bạn có thể sử dụng SDK tác nhân mà bạn chọn. Cơ sở hạ tầng được định nghĩa trong AWS CDK để triển khai lặp lại.

Kiến trúc được thiết kế theo mô-đun. Frontend tích hợp với backend được cung cấp bởi AgentCore, mà bạn có thể sử dụng làm ví dụ để tích hợp với ứng dụng frontend của riêng mình. Đó có thể là ứng dụng React của riêng bạn hoặc một frontend sử dụng một framework frontend hoàn toàn khác.

Được thiết kế để phát triển hỗ trợ AI

FAST bao gồm tài liệu mở rộng theo thiết kế. Kho lưu trữ bao gồm:

  • Tài liệu hướng dẫn – Các quy tắc và quy ước mà các trợ lý mã hóa tự động tuân theo
  • Hướng dẫn tính năng – Tài liệu chi tiết về gateway, bộ nhớ, streaming và các tích hợp khác
  • READMEs trong toàn bộ codebase – Ngữ cảnh cho từng thành phần

Khi bạn yêu cầu một trợ lý mã hóa thực hiện thay đổi, nó có thể đọc các tài liệu này và tuân theo các mẫu được ghi lại. Cách tiếp cận này hoạt động với nhiều trợ lý mã hóa AI, bao gồm Kiro, Cline, Claude Code, Cursor và các trợ lý khác. Tài liệu và tài liệu hướng dẫn không phụ thuộc vào hệ thống.

Phát triển hỗ trợ AI là tùy chọn. Cùng một tài liệu hướng dẫn các trợ lý mã hóa cũng hữu ích cho các nhà phát triển thích tự viết mã.

Điều kiện tiên quyết

Trước khi triển khai FAST, hãy đảm bảo bạn đã cài đặt những điều sau:

Người dùng AWS Identity and Access Management (IAM) mà bạn sử dụng phải có quyền thực hiện các cuộc gọi dịch vụ AWS cần thiết và quản lý các tài nguyên AWS được đề cập trong bài đăng này. Khi cung cấp quyền cho người dùng IAM, hãy tuân thủ nguyên tắc đặc quyền tối thiểu.

Hướng dẫn triển khai giải pháp

Bắt đầu bằng cách triển khai giải pháp trong môi trường cục bộ của bạn.

Bước 1: Clone kho lưu trữ

Bắt đầu bằng cách sử dụng các lệnh sau để clone kho lưu trữ.

git clone https://github.com/awslabs/fullstack-solution-template-for-agentcore.git
cd fullstack-solution-template-for-agentcore

Bước 2: Cấu hình triển khai của bạn

Chỉnh sửa infra-cdk/config.yaml để tùy chỉnh triển khai của bạn:

stack_name_base: your-project-name
admin_user_email: admin@example.com # Optional: auto-creates user and emails credentials
backend: pattern: strands-single-agent # Available: strands-single-agent, langgraph-single-agent
deployment_type: docker # Available: docker, zip

Bước 3: Triển khai backend với CDK

Sử dụng các lệnh sau để triển khai backend.

cd infra-cdk
npm install
cdk bootstrap # Only required once per account/region
cdk deploy

Thao tác này tạo Cognito User Pool, xây dựng và đẩy container tác nhân lên Amazon Elastic Container Registry (Amazon ECR), tạo AgentCore Runtime và thiết lập phân phối CloudFront. Việc triển khai mất khoảng 5–10 phút.

Bước 4: Triển khai frontend

Sử dụng các lệnh sau để triển khai frontend.

cd ..
python scripts/deploy-frontend.py

Script này tạo cấu hình xác thực từ các output của CDK stack, cài đặt các dependency, xây dựng ứng dụng React và triển khai lên AWS Amplify Hosting. Script sẽ xuất URL ứng dụng khi hoàn tất:

✓ Deployment completed successfully!
Console: https://console.aws.amazon.com/amplify/apps
App URL: https://main.d123490abcdef.amplifyapp.com

Bước 5: Tạo người dùng Amazon Cognito

Nếu bạn đã cung cấp admin_user_email trong cấu hình, bạn sẽ nhận được email với thông tin xác thực tạm thời mà bạn có thể sử dụng để đăng nhập. Chuyển sang bước tiếp theo.

Nếu bạn không cung cấp admin_user_email, hãy tạo người dùng thủ công:

  1. Mở bảng điều khiển Amazon Cognito.
  2. Tìm User Pool của bạn (được đặt tên là {stack_name_base}-user-pool).
  3. Điều hướng đến Users và chọn Create user.
  4. Nhập địa chỉ email và mật khẩu tạm thời.
  5. Chọn Mark email as verified.
  6. Chọn Create user.

Bước 6: Truy cập và kiểm tra ứng dụng

Bạn đã sẵn sàng truy cập và kiểm tra ứng dụng bằng các bước sau:

  1. Mở URL Amplify Hosting (được in trong terminal của bạn sau khi triển khai frontend) trong trình duyệt.
  2. Đăng nhập bằng thông tin xác thực người dùng Amazon Cognito của bạn.
  3. Thay đổi mật khẩu tạm thời khi được nhắc.
Gif minh họa việc đăng nhập vào ứng dụng FAST mặc định bằng tên người dùng và mật khẩu, sau đó nhập một truy vấn mẫu và xem phản hồi được truyền về màn hình.

Ứng dụng ví dụ FAST là một giao diện trò chuyện đa lượt đơn giản. Giao diện người dùng (UI) vẫn tối giản theo thiết kế; nó được xây dựng để được thay thế bằng frontend của riêng bạn hoặc tích hợp vào một ứng dụng hiện có. Tác nhân cơ bản bao gồm hai công cụ để minh họa kiến trúc:

  • Công cụ phân tích văn bản – Một công cụ dựa trên AWS Lambda đằng sau AgentCore Gateway đếm từ và phân tích tần suất chữ cái. Điều này minh họa mẫu tích hợp Gateway.
  • Code Interpreter – Tích hợp trực tiếp với AgentCore Code Interpreter để thực thi Python an toàn hơn trong các môi trường sandbox biệt lập.

Hãy thử các truy vấn mẫu này để xác minh các công cụ đang hoạt động:

  • “Analyze the text: The quick brown fox jumps over the lazy dog” – Tác nhân sẽ trả về số lượng từ và phân tích tần suất chữ cái
  • “Calculate the first 20 Fibonacci numbers” – Xem tác nhân viết và thực thi mã Python theo thời gian thực

Cùng với UI, các công cụ được cung cấp cũng có ý nghĩa để được thay thế. Chúng tồn tại để minh họa hai kiến trúc khác nhau để thêm công cụ (đằng sau AgentCore Gateway như trong công cụ phân tích văn bản, và trực tiếp vào tác nhân như trong công cụ trình thông dịch mã) và cung cấp cho bạn một điểm khởi đầu hoạt động. Ngoài ra, cơ chế thu thập phản hồi tồn tại để minh họa cách thực hiện các cuộc gọi HTTP đồng bộ và được xác thực thông qua API Gateway và có thể được loại bỏ hoặc tái sử dụng một cách liền mạch.

Tùy chỉnh ứng dụng theo nhu cầu của bạn

Điều gì sẽ xảy ra nếu bạn cần một tác nhân phân tích tài liệu thay vì một chatbot? Hoặc bạn muốn tích hợp với nhà cung cấp danh tính hiện có của công ty mình? FAST xử lý chính xác điều này; ứng dụng cơ bản là một điểm khởi đầu, không phải là một ràng buộc.

Sau đây là bản ghi một buổi livestream trên kênh YouTube của AWS Events trong đó FAST được sử dụng để xây dựng một ứng dụng trợ lý cá nhân tác nhân theo thời gian thực. https://www.youtube-nocookie.com/embed/3auTh7Y7X2k?feature=oembed

Thay đổi mẫu tác nhân

Mẫu này bao gồm hai mẫu tác nhân trong thư mục patterns/:

  • strands-single-agent – Một tác nhân hội thoại cơ bản sử dụng framework Strands với tích hợp công cụ MCP
  • langgraph-single-agent – Một tác nhân hội thoại cơ bản sử dụng LangGraph với tích hợp công cụ MCP

Để chuyển đổi mẫu, cập nhật backend.pattern trong infra-cdk/config.yaml và triển khai lại bằng cdk deploy.

Để tạo mẫu của riêng bạn, hãy thêm một thư mục mới dưới patterns/ với triển khai tác nhân của bạn, một tệp requirements.txt và một Dockerfile. Cập nhật cấu hình để trỏ đến mẫu mới của bạn.

Thêm công cụ mới bằng Gateway

AgentCore Gateway định tuyến các cuộc gọi công cụ đến một hàm AWS Lambda. Để thêm một công cụ mới:

  1. Tạo một hàm Lambda triển khai logic công cụ của bạn.
  2. Định nghĩa schema công cụ (tên, mô tả và tham số đầu vào) trong CDK stack.
  3. Thêm hàm Lambda làm đích của AgentCore Gateway.
  4. Triển khai lại bằng cdk deploy.

Tác nhân tự động khám phá các công cụ từ Gateway thông qua MCP. Xem docs/GATEWAY.md để biết chi tiết triển khai và ví dụ.

Sử dụng Code Interpreter

Code Interpreter đã được tích hợp trong tác nhân cơ bản. Nó cung cấp khả năng thực thi Python an toàn hơn trong các môi trường sandbox biệt lập với khả năng duy trì phiên. Người dùng có thể yêu cầu tác nhân chạy các phép tính, tạo dữ liệu hoặc thực thi mã Python tùy ý.

Sửa đổi frontend

Frontend là một ứng dụng React tiêu chuẩn trong thư mục frontend/. Các trợ lý mã hóa AI như Kiro rất giỏi trong việc sửa đổi các frontend React. Mô tả những thay đổi bạn muốn và để trợ lý triển khai chúng.

Sau khi thực hiện thay đổi, triển khai lại bằng python scripts/deploy-frontend.py

Vì FAST đang sử dụng AWS Amplify Hosting, bạn có tùy chọn tích hợp với một hệ thống kiểm soát phiên bản được hỗ trợ để tận dụng các khả năng tích hợp và phân phối liên tục (CI/CD) tích hợp sẵn của Amplify Hosting, có thể thay thế script deploy-frontend.py được cung cấp.

Ngoài trò chuyện: Các trường hợp sử dụng khác

Ứng dụng cơ bản tập trung vào giao diện trò chuyện, nhưng FAST hỗ trợ nhiều trường hợp sử dụng tác nhân. Ví dụ, một tác nhân phân tích tài liệu có thể thêm một thành phần tải tệp lên frontend, một công cụ Lambda trích xuất văn bản từ các tệp PDF và logic tác nhân tóm tắt các phát hiện. Hoặc một tác nhân tự động hóa quy trình làm việc có thể giám sát các kênh Slack và tự động tạo các ticket Jira từ các yêu cầu hỗ trợ. Kiến trúc tương tự được áp dụng, bạn chỉ cần hoán đổi các thành phần. Những tùy chỉnh này hoạt động trong kiến trúc mặc định của FAST. Nhưng điều gì sẽ xảy ra nếu bạn cần thay thế hoàn toàn một thành phần cốt lõi?

Linh hoạt: hoán đổi các thành phần chính

Kiến trúc được thiết kế theo mô-đun một cách có chủ ý, vì vậy bạn có thể thay thế các thành phần chính khi các yêu cầu của bạn phát triển. Dưới đây là một số ví dụ:

  • Nhà cung cấp danh tính – Thay thế Amazon Cognito bằng Okta, Microsoft Entra ID, Auth0 hoặc hệ thống danh tính tương thích OAuth 2.0 hiện có của bạn
  • Framework frontend – Hoán đổi frontend React cho Vue, Angular hoặc tích hợp backend tác nhân vào một ứng dụng hiện có
  • Lưu trữ – Chuyển từ AWS Amplify Hosting sang Vercel, Netlify, một phân phối CloudFront tự quản lý hoặc giải pháp lưu trữ ưa thích của bạn
  • Framework tác nhân – Sử dụng Strands Agents, LangGraph, CrewAI hoặc một SDK tác nhân ngay cả trong các ngôn ngữ khác như TypeScript hoặc Java

Đây là một số điểm linh hoạt mà FAST cung cấp. Cơ sở hạ tầng CDK mô-đun và kiến trúc tách rời giúp dễ dàng điều chỉnh mẫu theo nhu cầu cụ thể của bạn.

Dọn dẹp

Sử dụng các lệnh sau để xóa các tài nguyên được tạo bởi FAST:

cd infra-cdk
cdk destroy --force

Thao tác này xóa các tài nguyên AWS bao gồm các bucket Amazon Simple Storage Service (Amazon S3) và các image Amazon Elastic Container Registry (Amazon ECR). Nếu bạn để các tài nguyên chạy, bạn có thể phải chịu phí cho một số tài nguyên đang chạy. Lưu ý rằng Amazon Bedrock AgentCore được tính phí theo mức sử dụng.

Kết luận

FAST giúp giảm thời gian xây dựng và triển khai ứng dụng tác nhân xuống dưới 30 phút. Bạn có thể có xác thực an toàn hơn, một frontend hoạt động và các khả năng AgentCore tích hợp—Memory, Gateway, Code Interpreter và Observability—mà không cần viết mã cơ sở hạ tầng từ đầu. Ứng dụng trò chuyện cơ bản và các công cụ mẫu là điểm khởi đầu, không phải là ràng buộc. Hoán đổi logic tác nhân của riêng bạn, kết nối các công cụ của bạn, sửa đổi frontend hoặc thay thế các thành phần chính như nhà cung cấp danh tính hoặc giải pháp lưu trữ. Kiến trúc mô-đun thích ứng với các yêu cầu của bạn.

Để bắt đầu, hãy đánh dấu sao và clone kho lưu trữ, triển khai FAST vào tài khoản AWS của bạn và có một ứng dụng tác nhân hoạt động trong vòng chưa đầy 30 phút. Từ đó, tùy chỉnh và đưa ra một sản phẩm thực tế.

Để được hỗ trợ chuyên môn, AWS Generative AI Innovation Center, AWS Professional Servicescác đối tác AWS của chúng tôi luôn sẵn sàng trợ giúp.


Về tác giả


David Kaleko
David Kaleko là Nhà khoa học ứng dụng cấp cao tại AWS Generative AI Innovation Center, nơi anh dẫn đầu các nỗ lực nghiên cứu ứng dụng về các chiến lược triển khai AI tạo sinh tiên tiến cho khách hàng AWS. Anh có bằng Tiến sĩ vật lý hạt nhân từ Đại học Columbia.


Isaac Privitera
Isaac Privitera là Nhà khoa học dữ liệu chính tại AWS Generative AI Innovation Center, nơi anh phát triển các giải pháp AI tác nhân tùy chỉnh để giải quyết các vấn đề kinh doanh của khách hàng. Trọng tâm chính của anh là xây dựng các hệ thống AI có trách nhiệm, sử dụng các kỹ thuật như RAG, hệ thống đa tác nhân và tinh chỉnh mô hình. Khi không đắm chìm trong thế giới AI, Isaac có thể được tìm thấy trên sân golf, thưởng thức một trận bóng đá hoặc đi bộ đường dài với người bạn chó trung thành của mình, Barry.


Ryan Razkenari
Ryan Razkenari là Kiến trúc sư Deep Learning tại AWS Generative AI Innovation Center, nơi anh thiết kế và xây dựng các giải pháp AI cho khách hàng doanh nghiệp. Anh chuyên áp dụng AI tạo sinh để giải quyết các thách thức kinh doanh phức tạp, tập trung vào việc chuyển đổi nghiên cứu tiên tiến thành các hệ thống sẵn sàng sản xuất.


Monica Raj
Monica Raj là Kiến trúc sư Deep Learning tại AWS Generative AI Innovation Center, nơi cô hợp tác với các tổ chức trong nhiều ngành để kiến trúc và triển khai các giải pháp AI sẵn sàng sản xuất. Cô chuyên về các hệ thống AI tác nhân, xử lý ngôn ngữ tự nhiên, tự động hóa trung tâm liên lạc và xử lý tài liệu thông minh, tập trung vào việc xây dựng cơ sở hạ tầng cấp doanh nghiệp có khả năng mở rộng cho khách hàng.


Davide Merlin
Davide Merlin là Kỹ sư Machine Learning tại AWS Generative AI Innovation Center có trụ sở tại Jersey City. Anh chuyên phát triển backend của các ứng dụng AI cloud-native, tập trung vào kiến trúc API. Trong thời gian rảnh, anh thích chơi trò chơi điện tử, thử các nhà hàng mới và xem các chương trình mới.


Brian Zambrano
Brian Zambrano là Kiến trúc sư Deep Learning cấp cao tại AWS. Anh có hơn 25 năm kinh nghiệm xây dựng phần mềm với vai trò kỹ sư và kiến trúc sư. Hiện tại, anh làm việc tại AWS Generative AI Innovation Center, nơi anh giúp hiện thực hóa các giải pháp AI tạo sinh của khách hàng, sử dụng nền tảng của mình về kiến trúc đám mây, serverless và các hệ thống hướng sự kiện. Brian là tác giả của cuốn sách Serverless Design Patterns and Best Practices xuất bản năm 2018. Trong hơn 7 năm làm việc tại AWS, Brian đã đảm nhiệm nhiều vai trò bao gồm kỹ sư phần mềm, Kiến trúc sư Giải pháp Doanh nghiệp và Kiến trúc sư Giải pháp Chuyên gia.


Anurag Bhagat
Anurag Bhagat là Chiến lược gia cấp cao tại AWS Generative AI Innovation Center, nơi anh dẫn đầu các nỗ lực AI ứng dụng để giúp cải thiện hoạt động kinh doanh cho khách hàng doanh nghiệp của AWS. Anh có 15 năm kinh nghiệm áp dụng AI trong nhiều ngành và chức năng, và là một sinh viên tốt nghiệp ngành khoa học máy tính.