Xây dựng AI agent cho sự kiện với Amazon Bedrock AgentCore và Amazon Bedrock Knowledge Bases

Tác giả: Dani Mitchell, Akarsha Sehwag, và Sergio Garcés Vitale
Ngày phát hành: 25 FEB 2026
Chuyên mục: Amazon Bedrock, Amazon Bedrock AgentCore, Amazon Bedrock Knowledge Bases, Amazon Machine Learning, Artificial Intelligence

Các hội nghị và sự kiện lớn tạo ra lượng thông tin khổng lồ—từ hàng trăm phiên họp và workshop đến hồ sơ diễn giả, bản đồ địa điểm và lịch trình cập nhật liên tục. Mặc dù các trợ lý AI cơ bản có thể trả lời các câu hỏi đơn giản về hậu cần sự kiện, nhưng hầu hết đều không cung cấp được hướng dẫn cá nhân hóa và nhận thức ngữ cảnh mà người tham dự cần để điều hướng các hội nghị phức tạp, kéo dài nhiều ngày một cách hiệu quả. Quan trọng hơn, việc chuyển các nguyên mẫu này từ bản demo sang sản xuất—với bảo mật cấp doanh nghiệp, khả năng mở rộng cho hàng nghìn người dùng đồng thời và hiệu suất đáng tin cậy—thường đòi hỏi nhiều tháng phát triển cơ sở hạ tầng.

Bài viết này trình bày cách nhanh chóng triển khai một trợ lý sự kiện sẵn sàng sản xuất bằng cách sử dụng các thành phần của Amazon Bedrock AgentCore. Chúng tôi sẽ xây dựng một người bạn đồng hành thông minh ghi nhớ sở thích của người tham dự và xây dựng trải nghiệm cá nhân hóa theo thời gian, trong khi Amazon Bedrock AgentCore xử lý các công việc nặng nhọc của việc triển khai sản xuất: Amazon Bedrock AgentCore Memory để duy trì cả ngữ cảnh cuộc trò chuyện và sở thích dài hạn mà không cần giải pháp lưu trữ tùy chỉnh, Amazon Bedrock AgentCore Identity để xác thực đa-IDP an toàn, và Amazon Bedrock AgentCore Runtime để mở rộng quy mô phi máy chủ và cách ly phiên. Chúng tôi cũng sẽ sử dụng Amazon Bedrock Knowledge Bases cho RAG được quản lý và truy xuất dữ liệu sự kiện.

Cuối cùng, bạn sẽ học cách triển khai một trợ lý ngày càng hữu ích hơn với mỗi tương tác – một hướng dẫn chủ động đảm bảo người tham dự có thể khám phá các phiên họp giá trị nhất của họ – sẵn sàng phục vụ hàng nghìn người tham dự hội nghị đồng thời với bảo mật và độ tin cậy cấp doanh nghiệp, tất cả mà không cần quản lý cơ sở hạ tầng.

Nếu bạn là người mới làm quen với Amazon Bedrock AgentCore, hãy xem xét các bài đăng blog sau để hiểu các khái niệm cơ bản trước khi đi sâu vào triển khai này:

Kiến trúc giải pháp

Hãy cùng tìm hiểu kiến trúc và quy trình làm việc của tác nhân sự kiện thông minh của chúng ta. Bản triển khai hoàn chỉnh có sẵn trong kho lưu trữ GitHub này, cung cấp một sổ tay hướng dẫn mà bạn có thể làm theo để triển khai giải pháp này trong tài khoản AWS của riêng mình.

Cách giải pháp hoạt động

Hãy cùng khám phá các phần khác nhau:

1. Đăng nhập người dùng và truy xuất danh tính

Người dùng đăng nhập vào ứng dụng bằng Amazon Cognito (AgentCore Identity cũng hỗ trợ các nhà cung cấp danh tính khác như Okta, Auth0 và các IDP tuân thủ OIDC), tạo ra một bearer token khi xác thực thành công. Token này chứa thông tin về người dùng và sẽ được sử dụng trong suốt quy trình làm việc để xác thực và truy xuất dữ liệu cụ thể của người dùng.

2. Kích hoạt và khởi tạo tác nhân

Khi người dùng tương tác với ứng dụng và gửi một truy vấn, ứng dụng gọi Amazon Bedrock AgentCore Runtime với ba tham số chính: truy vấn của người dùng, một session ID (ví dụ: SessionA), và bearer token từ Amazon Cognito. Điều này liên kết các tương tác với cả người dùng và phiên hiện tại của họ. AgentCore Identity xác thực và ủy quyền cho người dùng trước khi cho phép truy cập vào tác nhân. Trong tương tác đầu tiên, Strands Agent khởi tạo trong Amazon Bedrock AgentCore Runtime và truy xuất bất kỳ sở thích người dùng có sẵn nào từ bộ nhớ dài hạn của Amazon Bedrock AgentCore Memory, tự chuẩn bị với ngữ cảnh cá nhân hóa. Đối với các tương tác tiếp theo trong cùng một phiên, tác nhân tiếp tục cuộc trò chuyện bằng cách sử dụng ngữ cảnh đã được thiết lập.

3. Xử lý tin nhắn

Tác nhân lưu trữ cả tin nhắn của người dùng và trợ lý trong bộ nhớ ngắn hạn của Amazon Bedrock AgentCore Memory, chứa cả actor_id và session_id. actor_id là sub (định danh chủ thể) được trích xuất từ Amazon Cognito bearer token. Ngữ cảnh cuộc trò chuyện vẫn riêng tư và chỉ có sẵn cho người dùng cụ thể trong phiên hiện tại của họ. Đằng sau hậu trường, Amazon Bedrock AgentCore Memory sử dụng một pipeline chuyển đổi tự động xử lý các sự kiện cuộc trò chuyện này thông qua các chiến lược bộ nhớ đã cấu hình. Mỗi chiến lược bộ nhớ sử dụng nhận dạng mẫu và hiểu ngôn ngữ tự nhiên để phân tích dữ liệu cuộc trò chuyện thô, xác định các loại thông tin có giá trị cụ thể—chẳng hạn như sở thích của người dùng—và trích xuất những hiểu biết có ý nghĩa cần được lưu giữ dài hạn. Hệ thống sau đó cấu trúc thông tin được trích xuất này thành các bản ghi bộ nhớ tiêu chuẩn, gắn thẻ chúng với siêu dữ liệu liên quan và lưu trữ chúng trong các namespace chuyên dụng trong bộ nhớ dài hạn, để tác nhân sử dụng nhằm xây dựng sự hiểu biết ngày càng tinh tế về người dùng qua nhiều phiên.

4. Truy xuất kiến thức và bộ nhớ

Để thực hiện yêu cầu của người dùng, tác nhân có thể kích hoạt các công cụ chuyên biệt. Nó có thể gọi một Amazon Bedrock knowledge base để tìm nạp các chi tiết sự kiện cập nhật như mô tả phiên, lịch trình hoặc tiểu sử diễn giả.

5. Tạo phản hồi

Tác nhân xử lý truy vấn được làm giàu với ba lớp ngữ cảnh: thông tin chi tiết từ bộ nhớ dài hạn (lịch sử người tham dự được cá nhân hóa), ngữ cảnh từ bộ nhớ ngắn hạn (tin nhắn gần đây trong phiên), và dữ liệu sự kiện hiện tại từ knowledge base. Sau đó, nó tạo ra một phản hồi theo ngữ cảnh và cá nhân hóa. Kiến trúc này biến một truy vấn đơn giản như “Tôi nên tham dự những phiên nào vào ngày mai?” thành một trải nghiệm cá nhân hóa—tác nhân nhớ lại các chủ đề mà người dùng thích ngày hôm qua, xem xét cuộc trò chuyện hiện tại và phản hồi bằng các đề xuất cụ thể phù hợp với sở thích và lịch sử của người dùng.

Các thành phần giải pháp

Bây giờ chúng ta hãy cùng tìm hiểu vai trò của từng thành phần trong giải pháp.

Tác nhân (AgentCore Runtime và tích hợp danh tính)

Cốt lõi của giải pháp trợ lý sự kiện của chúng tôi là Amazon Bedrock AgentCore Runtime, một thành phần cung cấp môi trường phi máy chủ, an toàn để lưu trữ tác nhân của chúng tôi. Runtime quản lý toàn bộ vòng đời tương tác của người dùng thông qua các phiên được cách ly—mỗi phiên chạy trong các microVM chuyên dụng với tài nguyên CPU, bộ nhớ và hệ thống tệp riêng biệt. Việc cách ly phiên này đảm bảo rằng hàng nghìn người tham dự hội nghị có thể tương tác đồng thời với các phiên bản tác nhân được cá nhân hóa mà không bị nhiễm dữ liệu giữa các phiên.

Bảo mật và xác thực được xử lý thông qua Amazon Bedrock AgentCore Identity, tích hợp liền mạch với Amazon Cognito (và các IDP khác). Khi một người tham dự gửi truy vấn đến trợ lý sự kiện, Amazon Bedrock AgentCore Identity xác thực bearer token từ Amazon Cognito trước khi cho phép tương tác tiếp tục. Bearer token được truyền qua các header, và tác nhân truy xuất token này để gọi Amazon Cognito discovery server, trích xuất sub của người dùng và các thông tin người dùng liên quan khác. Đối với trường hợp sử dụng này, chúng tôi sử dụng sub của người dùng làm actor_id cho thông tin phiên, cho phép tác nhân duy trì ngữ cảnh cụ thể của người dùng và cung cấp các đề xuất cá nhân hóa. Nhận thức về danh tính này giúp đảm bảo rằng sở thích, lịch sử cuộc trò chuyện và dữ liệu phiên của mỗi người tham dự có thể được giữ riêng tư và an toàn.

Bằng cách kết hợp cơ sở hạ tầng lưu trữ có thể mở rộng của Runtime với khung xác thực của Identity, trợ lý sự kiện của chúng tôi có thể phục vụ các hội nghị lớn một cách an toàn hơn trong khi cung cấp hướng dẫn cá nhân hóa nhất quán cho từng người tham dự.

Bộ nhớ tác nhân

Amazon Bedrock AgentCore Memory cung cấp nhận thức ngữ cảnh quan trọng, biến trợ lý sự kiện của chúng ta từ một công cụ hỏi đáp đơn giản thành một hướng dẫn thực sự cá nhân hóa. Dịch vụ này bao gồm bộ nhớ ngắn hạn và dài hạn, hoạt động cùng nhau để cho phép các mối quan hệ liên tục, phát triển giữa người tham dự và trợ lý sự kiện.

Bộ nhớ ngắn hạn: Ghi lại cuộc trò chuyện

Bộ nhớ ngắn hạn là nơi các tương tác bắt đầu. Khi các cuộc trò chuyện diễn ra, tác nhân đồng bộ lưu trữ mỗi lần trao đổi tin nhắn dưới dạng một sự kiện bất biến trong bộ nhớ ngắn hạn. Các sự kiện này được tổ chức theo thứ bậc bởi actor_id và session_id như được hiển thị trong sơ đồ. Hãy nhớ rằng actor_id được trích xuất từ Cognito bearer token (sub của người dùng), trong khi session_id đến từ định danh phiên của AgentCore Runtime.

Cấu trúc tổ chức này phục vụ hai mục đích quan trọng. Thứ nhất, nó duy trì trình tự thời gian của mỗi cuộc trò chuyện, bảo toàn luồng đối thoại tự nhiên. Thứ hai, nó cung cấp sự cách ly chính xác—cuộc trò chuyện của Actor A trong Session A1 vẫn tách biệt với Session B hoặc với các phiên của một actor khác. Điều này tạo điều kiện thuận lợi cho quyền riêng tư và cho phép tác nhân truy xuất chính xác ngữ cảnh cuộc trò chuyện mà không tải dữ liệu không liên quan. Tác nhân có thể nhanh chóng truy xuất các tin nhắn gần đây từ bộ nhớ ngắn hạn để duy trì tính liên tục của cuộc trò chuyện. Khi một người tham dự hỏi một câu hỏi tiếp theo như “Phiên đó lúc mấy giờ?”, tác nhân biết phiên nào vừa được thảo luận vì nó có quyền truy cập ngay lập tức vào lịch sử cuộc trò chuyện.

Bộ nhớ dài hạn: Xây dựng trí thông minh bền vững

Trong khi bộ nhớ ngắn hạn ghi lại những gì đã được nói, bộ nhớ dài hạn trích xuất những gì quan trọng. Khi các cuộc trò chuyện diễn ra, dịch vụ AgentCore Memory tự động xử lý các tương tác này để xác định và lưu trữ những thông tin chi tiết có ý nghĩa tồn tại qua các phiên. Tác nhân sự kiện của chúng tôi sử dụng chiến lược Sở thích người dùng để ghi lại các sở thích rõ ràng về định dạng phiên, chủ đề hoặc phong cách trình bày. Ví dụ: “Thích các workshop thực hành hơn các bài giảng” hoặc “Quan tâm đến các chủ đề serverless và machine learning.”

Các sở thích này được lưu trữ trong một namespace chuyên dụng trong bộ nhớ dài hạn (ví dụ: /event-agent/actor-A/preferences), để tổ chức rõ ràng và truy xuất có mục tiêu.

Điều phối tác nhân và bộ nhớ

Sự tích hợp liền mạch giữa Strands Agent và AgentCore Memory được hỗ trợ thông qua các agent hook—các điểm chạm dựa trên sự kiện tự động kích hoạt các hoạt động bộ nhớ trong suốt vòng đời của tác nhân. Như được hiển thị trong sơ đồ sau:

Hook Agent Initialized Event truy xuất sở thích người dùng từ bộ nhớ dài hạn khi một phiên bắt đầu, tải các sở thích và loại phiên ưu tiên của người tham dự để cho phép các đề xuất cá nhân hóa ngay từ truy vấn đầu tiên.
Hook Message Added Event ghi lại từng tin nhắn của người dùng và trợ lý, đồng bộ lưu trữ chúng trong bộ nhớ ngắn hạn để duy trì lịch sử cuộc trò chuyện.

Lưu ý: Mặc dù AgentCore cung cấp một trình quản lý bộ nhớ tự động tự động triển khai các công cụ bộ nhớ, giải pháp này sử dụng các hook để kiểm soát chính xác thời điểm và cách thức các hoạt động bộ nhớ được gọi—nhằm tối ưu hóa tinh chỉnh cho quy trình làm việc cụ thể của trợ lý sự kiện.

Ngoài các hoạt động tự động này, nếu không có đủ thông tin, tác nhân sau đó sử dụng công cụ Retrieve sessions data để truy vấn Amazon Bedrock knowledge base để biết chi tiết sự kiện hiện tại.

Cách tiếp cận kép này—tải trước ngữ cảnh thiết yếu khi khởi động và truy xuất chi tiết có chọn lọc theo yêu cầu—mang lại cả tốc độ và độ chính xác mà không làm phình to ngữ cảnh phiên với thông tin không cần thiết.

Amazon Bedrock Knowledge Bases

Trong khi AgentCore Memory duy trì ngữ cảnh cá nhân hóa và lịch sử cuộc trò chuyện, các hội nghị lớn tạo ra lượng lớn thông tin có cấu trúc—hàng trăm chi tiết phiên, hồ sơ diễn giả, bản đồ địa điểm và cập nhật lịch trình—đòi hỏi tổ chức và truy xuất hiệu quả.

Amazon Bedrock Knowledge Bases là một dịch vụ được quản lý hoàn toàn hỗ trợ Retrieval-Augmented Generation (RAG) bằng cách kết nối các foundation model với các nguồn dữ liệu của bạn. Nó tự động xử lý việc nhập, xử lý và lập chỉ mục tài liệu, chuyển đổi chúng thành các vector embedding được lưu trữ trong một vector database. Điều này cho phép các tác nhân thực hiện tìm kiếm ngữ nghĩa—truy xuất thông tin dựa trên ý nghĩa và ngữ cảnh thay vì khớp từ khóa chính xác.

Kiến trúc triển khai knowledge base như một công cụ chuyên biệt trong framework Strands. Khi người tham dự hỏi các câu hỏi cụ thể về các phiên, diễn giả hoặc hậu cần địa điểm, tác nhân sẽ gọi công cụ này để truy xuất thông tin chính xác, cập nhật. Sự tích hợp giữa bộ nhớ và knowledge base tạo ra một sự kết hợp mạnh mẽ. Khi một người tham dự hỏi, “Tôi nên tham dự những phiên AI nào?”, tác nhân truy xuất chi tiết phiên từ knowledge base trong khi sử dụng bộ nhớ để lọc và ưu tiên các đề xuất dựa trên sở thích đã được người tham dự bày tỏ trước đó. Điều này tạo điều kiện cho các phản hồi vừa đầy đủ về mặt thực tế vừa phù hợp với cá nhân, giúp biến sự phức tạp choáng ngợp của các hội nghị lớn thành hướng dẫn có thể quản lý, phù hợp.

Kết luận

Trong bài viết này, chúng ta đã khám phá cách bạn có thể sử dụng các thành phần của Amazon Bedrock AgentCore để nhanh chóng đưa một trợ lý sự kiện vào sản xuất—chuyển từ nguyên mẫu sang triển khai sẵn sàng cho doanh nghiệp ở quy mô lớn. Mặc dù việc xây dựng các tác nhân đàm thoại thông minh có thể đạt được với nhiều công cụ khác nhau, thách thức thực sự nằm ở việc triển khai sản xuất. Giá trị của Amazon Bedrock Knowledge Bases và Amazon Bedrock AgentCore nằm ở việc cung cấp các dịch vụ được quản lý xử lý xác thực, mở rộng quy mô, quản lý bộ nhớ và khả năng RAG ngay lập tức—giúp loại bỏ hàng tháng công việc cơ sở hạ tầng.

Kết quả là một trợ lý sự kiện ghi nhớ sở thích của người tham dự về các công nghệ serverless từ các cuộc trò chuyện ngày hôm qua, hiểu rằng họ thích các workshop thực hành, và sử dụng ngữ cảnh này để đưa ra các đề xuất phù hợp từ lịch trình ngày mai—tất cả trong khi duy trì luồng cuộc trò chuyện của một phiên lập kế hoạch đang diễn ra.

Đây là sự khác biệt giữa một nguyên mẫu thể hiện hành vi thông minh và một hệ thống sẵn sàng sản xuất có thể cung cấp trải nghiệm cá nhân hóa cho hàng nghìn người tham dự hội nghị đồng thời với bảo mật và độ tin cậy cấp doanh nghiệp. Cho dù bạn đang lên kế hoạch cho một cuộc họp công ty nhỏ hay một hội nghị lớn kéo dài nhiều ngày, Amazon Bedrock AgentCore cung cấp cơ sở hạ tầng được quản lý để triển khai hỗ trợ thông minh trong vài ngày thay vì vài tháng.

Các bước tiếp theo

Sẵn sàng nâng cao trợ lý sự kiện của bạn hơn nữa? Dưới đây là một số cách để mở rộng giải pháp này:

Mở rộng khả năng với AgentCore Gateway: Amazon Bedrock AgentCore Gateway giúp kết nối trợ lý sự kiện của bạn với các công cụ và dịch vụ bổ sung ở quy mô lớn. Chuyển đổi các API hiện có, các hàm Lambda hoặc các dịch vụ của bên thứ ba thành các công cụ mà tác nhân của bạn có thể sử dụng—cho dù đó là tích hợp với hệ thống đăng ký sự kiện, kết nối với Slack để thông báo cho người tham dự, hay liên kết với Salesforce để theo dõi khách hàng tiềm năng.
Khám phá Kho lưu trữ GitHub: Truy cập bản triển khai hoàn chỉnh của chúng tôi với hướng dẫn từng bước, mã ví dụ và hướng dẫn triển khai để xây dựng giải pháp này trong tài khoản AWS của riêng bạn.

Về tác giả

Dani Mitchell là Kiến trúc sư Giải pháp Chuyên gia AI Tạo sinh Cấp cao tại Amazon Web Services (AWS). Anh ấy tập trung vào việc giúp các doanh nghiệp trên toàn thế giới tăng tốc hành trình AI tạo sinh của họ với Bedrock AgentCore và Amazon Bedrock.

Sergio Garcés Vitale là Kiến trúc sư Giải pháp Cấp cao tại AWS, đam mê AI tạo sinh. Với hơn 10 năm kinh nghiệm trong ngành viễn thông, nơi anh đã giúp xây dựng các hệ thống dữ liệu và khả năng quan sát. Trong 5 năm qua, Sergio đã tập trung vào việc hướng dẫn khách hàng trong việc áp dụng đám mây, cũng như triển khai các trường hợp sử dụng trí tuệ nhân tạo.

Akarsha Sehwag là Nhà khoa học Dữ liệu AI Tạo sinh cho nhóm GTM của Amazon Bedrock AgentCore. Với hơn sáu năm kinh nghiệm chuyên môn về AI/ML, cô đã xây dựng các giải pháp doanh nghiệp sẵn sàng sản xuất trên nhiều phân khúc khách hàng đa dạng trong các lĩnh vực AI Tạo sinh, Học sâu và Thị giác máy tính. Ngoài công việc, cô thích đi bộ đường dài, đạp xe hoặc chơi cầu lông.