Triển khai một trợ lý quản lý tài chính (FinOps) tự động bằng cách sử dụng Amazon Bedrock với khả năng đa tác tử

by Salman Ahmed, Ankush Goyal, Sergio Barraza, and Ravi Kumar on 18 APR 2025 

Người dịch: Đoàn Nguyễn Mộng Kiều

Ngày dịch: 7/07/2025

Các trợ lý AI đang mở ra hướng tiếp cận hoàn toàn mới trong việc tự động hóa và nâng cao hiệu quả vận hành doanh nghiệp. Bằng cách cho phép tương tác bằng ngôn ngữ tự nhiên, các trợ lý này còn cung cấp cho khách hàng trải nghiệm được cá nhân hóa và hợp lý hóa. 

Amazon Bedrock Agents sử dụng các khả năng của các mô hình nền tảng (Foundation Models), kết hợp với API và dữ liệu thực tế để xử lý yêu cầu của người dùng, thu thập thông tin và thực hiện các nhiệm vụ cụ thể một cách hiệu quả, chính xác. 

Việc ra mắt khả năng hợp tác giữa nhiều tác tử (multi-agent collaboration) cho phép các tổ chức điều phối nhiều trợ lí AI chuyên biệt làm việc cùng nhau để giải quyết các bài toán phức tạp, nhiều bước và đòi hỏi  kiến thức chuyên môn đa dạng.

Amazon Bedrock cung cấp nhiều lựa chọn mô hình nền tảng (Foundation Models – FMs), cho phép bạn dễ dàng chọn mô hình phù hợp nhất với nhu cầu sử dụng của cá nhân.
Trong số đó, Amazon Nova nổi bật là mô hình thế hệ mới của AWS, mang đến trí tuệ vượt trội cùng hiệu suất hàng đầu trong ngành với chi phí tối ưu.

Dòng mô hình Amazon Nova bao gồm 3 nhóm chính:

  • Mô hình hiểu ngữ cảnh (Understanding models) – có các phiên bản: Micro, Lite và Pro
  • Mô hình tạo nội dung (Content generation models) – gồm: Canvas và Reel
  • Mô hình chuyển đổi giọng nói (Speech-to-Speech) – Nova Sonic

Các mô hình này được tối ưu hóa đặc biệt cho ứng dụng doanh nghiệp, nổi bật trong các khả năng sau:

  • Tạo văn bản (Text generation)
  • Tóm tắt nội dung (Summarization)
  • Xử lý các tác vụ suy luận phức tạp (Complex reasoning)
  • Sáng tạo nội dung (Content creation)

Sở hữu khả năng xử lý mạnh mẽ, Amazon Nova đặc biệt phù hợp với các bài toán phức tạp như giải pháp quản lý chi phí AWS (FinOps).

Một trong những điểm nổi bật của dòng mô hình này chính là hiệu năng vượt trội so với chi phí (price-performance ratio) vượt trội trong ngành. So với các mô hình AI cấp doanh nghiệp khác, Amazon Nova mang đến khả năng tương đương – thậm chí tốt hơn – nhưng với chi phí hợp lý hơn.
Chính sự kết hợp giữa tính linh hoạt, hiệu suất cao và tối ưu chi phí đã giúp Amazon Nova trở thành lựa chọn hấp dẫn cho các doanh nghiệp muốn triển khai các giải pháp AI tiên tiến

Trong bài viết này, chúng tôi sẽ tận dụng tính năng multi-agent của Amazon Bedrock để xây dựng một hệ thống quản lý chi phí AWS tự động, mang lại cách tiếp cận hiện đại và sáng tạo hơn cho bài toán FinOps.
Với năng lực tiên tiến của Amazon Nova, chúng tôi phát triển một mô hình sử dụng các AI agent chuyên biệt, phối hợp với nhau để phân tích, tối ưu và kiểm soát chi phí AWS một cách thông minh và hiệu quả hơn bao giờ hết.

  • Tổng quan về giải pháp

Trong bài viết này, chúng tôi giới thiệu một giải pháp quản lý chi phí AWS thông minh, ứng dụng AI đa tác tử (multi-agent AI) để mang lại trải nghiệm phân tích chi phí toàn diện và tối ưu một cách tự động, hiệu quả và dễ tiếp cận hơn cho người dùng.

Giải pháp được xây dựng dựa trên ba thành phần chính:

  • Trợ lý giám sát FinOps – đóng vai trò như “trung tâm điều phối”, tiếp nhận truy vấn từ người dùng và phân công công việc cho các tác tử phụ trách.
  • Trợ lý phân tích chi phí – sử dụng AWS Cost Explorer để truy xuất và phân tích chi phí theo khung thời gian được yêu cầu.
  • Trợ lý đề xuất tối ưu hóa chi phí – khai thác AWS Trusted Advisor (nhánh Cost Optimization) để đưa ra các gợi ý cắt giảm chi phí cụ thể và khả thi.

Nhờ tích hợp tính năng multi-agent collaboration của Amazon Bedrock và nền tảng AI mạnh mẽ Amazon Nova, đã xây dựng được một trợ lý AI thông minh, tương tác linh hoạt, chuyên biệt cho bài toán quản lý chi phí AWS. Nhờ đó, các tác tử có thể giao tiếp mượt mà với nhau, mỗi tác tử đảm nhận một khía cạnh riêng biệt trong quy trình FinOps.

Các tính năng chính:

  • Xác thực người dùng bằng Amazon Cognito, có kiểm soát truy cập theo vai trò
  • Giao diện frontend hiện đại triển khai trên AWS Amplify
  • Phân tích chi phí theo thời gian thực và dữ liệu lịch sử
  • Đưa ra đề xuất tối ưu hóa chi phí có thể thực thi được ngay
  • Xử lý song song nhiều tác vụ nhờ kiến trúc agent độc lập

Thông qua việc kết hợp AI điều phối thông minh và các công cụ quản lý chi phí sẵn có của AWS, giải pháp này giúp các nhóm tài chính, DevOps và quản trị cloud dễ dàng nắm bắt xu hướng chi tiêu của AWS, đồng thời nhanh chóng phát hiện và tận dụng các cơ hội tiết kiệm chi phí.

Ở phần tiếp theo, chúng tôi sẽ giới thiệu sơ đồ kiến trúc tổng thể sử dụng các dịch vụ AWS như Lambda, API Gateway, Bedrock, và S3, để tạo ra một hệ thống có khả năng mở rộng, an toàn và hiệu quả. Phương pháp này chứng minh tiềm năng của các hệ thống đa tác nhân do AI điều khiển để hỗ trợ quản lý tài chính đám mây và giải quyết nhiều thách thức quản lý đám mây.

Trong các phần tiếp theo, chúng ta sẽ đi sâu hơn vào kiến trúc tổng thể của hệ thống, khám phá chi tiết năng lực của từng trợ lý AI và phân tích tác động tiềm năng của phương pháp này đối với chiến lược quản lý chi phí AWS trong doanh nghiệp.

  • Yêu cầu trước khi triển khai

Để có thể triển khai giải pháp này từ đầu đến cuối, bạn cần chuẩn bị:

  • ✅ Một tài khoản AWS đang hoạt động
  • ✅ Quyền truy cập vào Amazon Bedrock Foundation Models, cụ thể là mô hình Amazon Nova Pro và Amazon Nova Micro, cùng nằm trong một AWS Region
  • ✅ Template CloudFormation đi kèm, có thể tải từ GitHub của aws-samples

Triển khai giải pháp bằng AWS CloudFormation

Template CloudFormation này được thiết kế để chạy tại Region us-east-1. Nếu bạn muốn triển khai ở Region khác, bạn cần:

  • Tạo Cross-Region Inference Profiles để sử dụng Bedrock đúng cách
  • Cập nhật lại CloudFormation template cho phù hợp

Khi triển khai, bạn cần nhập 3 tham số chính:

  1. Tên Stack (Stack name)
  2. Chọn mô hình FM (FM selection)
  3. Địa chỉ email người dùng hợp lệ (để khởi tạo tài khoản trong Cognito)

Lưu ý: Việc sử dụng các tài nguyên AWS trong quá trình này có thể phát sinh chi phí.

Tài nguyên được tạo ra sau khi triển khai CloudFormation

Amazon Cognito:

  • User pool: CognitoUserPoolforFinOpsApp
  • App client: FinOpsApp
  • Identity pool: cognito-identity-pool-finops
  • Nhóm người dùng: Finance
  • Người dùng mẫu: Finance User

IAM Roles và Policies:

  • Roles:
    • FinanceUserRestrictedRole
    • DefaultCognitoAuthenticatedRole
  • Policies:
    • Finance-BedrockAccess
    • Default-CognitoAccess

AWS Lambda functions:

  • TrustedAdvisorListRecommendationResources
  • TrustedAdvisorListRecommendations
  • CostAnalysis
  • ClockandCalendar
  • CostForecast

Amazon Bedrock Agents:

  • FinOpsSupervisorAgent
  • CostAnalysisAgent với các Action Group:
    • CostAnalysisActionGroup
    • ClockandCalendarActionGroup
    • CostForecastActionGroup
  • CostOptimizationAgent với các Action Group:
    • TrustedAdvisorListRecommendationResources
    • TrustedAdvisorListRecommendations
  • Thông tin cần ghi lại sau khi triển khai

Sau khi template được triển khai thành công, hãy truy cập tab “Outputs” trong AWS CloudFormation Console và sao chép các thông tin sau để cấu hình ứng dụng frontend trên AWS Amplify:

  • AWSRegion
  • BedrockAgentAliasId
  • BedrockAgentId
  • BedrockAgentName
  • IdentityPoolId
  • UserPoolClientId
  • UserPoolId

Dưới đây là hình minh họa cho giao diện tab Outputs trong CloudFormation Console.

Triển khai ứng dụng frontend bằng AWS Amplify

Sau khi hoàn tất triển khai backend bằng CloudFormation, bạn cần triển khai thủ công phần giao diện người dùng (frontend) bằng AWS Amplify. Hãy thực hiện các bước sau:

  1. Tải mã nguồn giao diện từ GitHub dưới dạng tệp .zip: AWS-Amplify-Frontend.zip
  2. Truy cập AWS Amplify Console, tạo ứng dụng mới bằng cách upload tệp .zip
  3. Sau khi triển khai thành công, Amplify sẽ tự động cấp phát một domain tạm thời, bạn có thể sử dụng để truy cập ứng dụng.

Xác thực người dùng với Amazon Cognito

Ứng dụng FinOps này sử dụng Amazon Cognito để:

  • Quản lý đăng nhập, xác thực người dùng
  • Phân quyền theo nhóm tài chính (finance group)

Cụ thể:

  • User Pool xử lý việc xác thực và quản lý nhóm người dùng
  • Identity Pool cấp thông tin xác thực tạm thời (temporary AWS credentials), ánh xạ đến các IAM Role tương ứng

Việc tích hợp Cognito đảm bảo chỉ những người dùng đã được xác thực trong nhóm tài chính mới có thể truy cập hệ thống và tương tác với Amazon Bedrock, giúp đảm bảo tính bảo mật cao nhưng vẫn giữ trải nghiệm người dùng liền mạch.

Hệ thống AI đa tác tử với Amazon Bedrock

Giải pháp này tận dụng kiến trúc multi-agent của Amazon Bedrock, trong đó FinOpsSupervisorAgent đóng vai trò điều phối trung tâm, phối hợp cùng hai trợ lý chuyên biệt:

  • CostAnalysisAgent: chuyên xử lý các truy vấn phân tích chi phí
  • CostOptimizationAgent: cung cấp đề xuất tối ưu chi phí cụ thể

Các trợ lý (agents) này tự động phối hợp nhưng vẫn giữ được ngữ cảnh chung, đảm bảo câu trả lời toàn diện, nhất quán và dễ hiểu cho người dùng. Cách tiếp cận phân tán này cho phép hệ thống xử lý các truy vấn phức tạp song song và hiệu quả hơn so với chỉ một trợ lý đơn lẻ đồng thời duy trì tính nhất quán và độ chính xác trong suốt quá trình tương tác FinOps.

Lambda functions hỗ trợ cho các Action Group

Trong giải pháp này, nhiều AWS Lambda functions được triển khai để hỗ trợ các action group tương ứng với từng agent:

🔹 CostAnalysisAgent sử dụng 3 action group chính:

Action GroupMô tả
CostAnalysisActionGroupKết nối với AWS Cost Explorer để phân tích chi phí chi tiết theo thời gian
ClockandCalendarActionGroupCung cấp thông tin ngày/giờ hiện tại giúp phân tích theo thời gian chính xác
CostForecastActionGroupSử dụng chức năng dự đoán của Cost Explorer để dự báo chi phí tương lai

Tổ hợp ba nhóm này cho phép agent phân tích chi phí lịch sử, dự báo chi phí tương lai, và đảm bảo các kết quả luôn đúng theo ngữ cảnh thời gian.

🔹 CostOptimizationAgent sử dụng 2 action group liên kết với AWS Trusted Advisor:

Action GroupMô tả
TrustedAdvisorListRecommendationResourcesTruy xuất danh sách tài nguyên có thể tối ưu chi phí
TrustedAdvisorListRecommendationsLấy các khuyến nghị cụ thể về tiết kiệm chi phí và cải thiện hiệu suất

Sự kết hợp này cho phép CostOptimizationAgent đưa ra các đề xuất tối ưu hóa rõ ràng, có thể hành động ngay, dựa trên dữ liệu và best practices của Trusted Advisor.

Giao diện frontend với AWS Amplify

Amplify cung cấp giải pháp hợp lý để triển khai và lưu trữ các ứng dụng web với các tính năng bảo mật và khả năng mở rộng tích hợp. Dịch vụ này làm giảm sự phức tạp của việc quản lý cơ sở hạ tầng, cho phép các nhà phát triển tập trung vào phát triển ứng dụng. Trong giải pháp của mình, chúng tôi sử dụng khả năng triển khai thủ công của Amplify để lưu trữ mã ứng dụng giao diện người dùng của mình.

Kiểm thử hệ thống: trải nghiệm multi-agent trong thực tế

Trước khi tương tác với frontend trên Amplify, bạn có thể kiểm thử trực tiếp trên AWS Console bằng cách gửi truy vấn đến FinOpsSupervisorAgent.

Ví dụ: “Chi phí AWS của tôi trong tháng 2/2025 là bao nhiêu? Hiện tại có cơ hội tiết kiệm chi phí nào không?”

Khi nhận được truy vấn, FinOpsSupervisorAgent sẽ:

  • Gửi phần đầu tiên đến CostAnalysisAgent để lấy dữ liệu chi phí tháng 2/2025
  • Gửi phần thứ hai đến CostOptimizationAgent để truy xuất các cơ hội tiết kiệm chi phí hiện tại

Sau đó, SupervisorAgent sẽ tổng hợp cả hai phản hồi thành một câu trả lời hoàn chỉnh, minh họa cách các tác tử AI phối hợp nhịp nhàng trong việc xử lý truy vấn FinOps phức tạp.

Truy cập ứng dụng sau khi triển khai với Amplify

Sau khi triển khai thành công ứng dụng frontend bằng AWS Amplify, bạn hãy truy cập vào URL mà Amplify đã cấp phát tự động.

Tại lần truy cập đầu tiên, giao diện ứng dụng sẽ yêu cầu bạn nhập một số thông tin cấu hình liên quan đến Amazon Cognito và Amazon Bedrock Agents. Các thông tin này là cần thiết để:

  • Xác thực người dùng một cách an toàn thông qua Amazon Cognito
  • Cho phép giao diện frontend tương tác với các agent AI trong Amazon Bedrock
  • Duy trì phiên làm việc người dùng và gửi các lệnh gọi API đến dịch vụ AWS với quyền hạn phù hợp

Nhập thông tin cấu hình từ CloudFormation

Tất cả các giá trị cần thiết đều đã được tạo sẵn sau khi bạn triển khai CloudFormation stack. Hãy quay lại tab “Outputs” của CloudFormation Console, sao chép và dán các thông tin vào biểu mẫu khởi tạo ứng dụng.

Các trường thông tin cần nhập:

  • User Pool ID
  • User Pool Client ID
  • Identity Pool ID
  • Region (nơi bạn triển khai Bedrock và Cognito)
  • Agent Name
  • Agent ID
  • Agent Alias ID
  • Region (ghi lần nữa nếu form yêu cầu tách biệt Cognito và Bedrock region)

Để sử dụng ứng dụng, bạn cần đăng nhập bằng tên người dùng (username) và mật khẩu đã được cấp.

Một mật khẩu tạm thời đã được tự động tạo trong quá trình triển khai CloudFormation và gửi đến địa chỉ email bạn đã cung cấp khi khởi tạo stack. Ở lần đăng nhập đầu tiên, hệ thống sẽ yêu cầu bạn đổi mật khẩu mới

Bây giờ, bạn đã có thể bắt đầu gửi truy vấn trực tiếp trong giao diện ứng dụng.

Ví dụ, bạn có thể hỏi:
“Chi phí AWS của tôi trong tháng 2 năm 2025 là bao nhiêu, và hiện tại có những cơ hội tiết kiệm nào?”

Chỉ sau vài giây, ứng dụng sẽ phản hồi với kết quả chi tiết, bao gồm:

  • Chi phí cụ thể theo từng dịch vụ trong tháng 2/2025
  • Các cơ hội tiết kiệm chi phí thực tế, được đề xuất dựa trên dữ liệu từ AWS Trusted Advisor

Trải nghiệm này minh họa rõ ràng cách các tác tử AI trong hệ thống phối hợp xử lý yêu cầu, cung cấp thông tin tài chính có chiều sâu, nhanh chóng và dễ hiểu — giúp bạn ra quyết định hiệu quả hơn trong chiến lược FinOps.

Bạn cũng có thể tiếp tục truy vấn để tìm hiểu chi tiết hơn từ kết quả đã nhận được trước đó.

Ví dụ, bạn có thể đặt câu hỏi tiếp theo như:
“Cung cấp chi tiết về các phiên bản EC2 đang sử dụng không hiệu quả không?”

Ứng dụng sẽ phản hồi với danh sách chi tiết các phiên bản Amazon EC2 mà hệ thống xác định là đang hoạt động dưới mức tối ưu, bao gồm các thông tin như:

  • Tên instance
  • Loại máy (instance type)
  • Mức sử dụng tài nguyên
  • Gợi ý hành động tối ưu (tắt, giảm kích thước, chuyển loại…)

Tính năng này cho phép bạn đi sâu vào từng dịch vụ cụ thể, giúp đưa ra quyết định chính xác và tối ưu chi phí một cách chủ động — đúng với tinh thần của một hệ thống FinOps hiện đại, chủ động và có sự hỗ trợ của AI.

Dưới đây là một vài ví dụ truy vấn bạn có thể thử để khám phá thêm sức mạnh và tính linh hoạt của công cụ:

  • “Dịch vụ nào có chi phí cao nhất trong tháng 6 năm 2024?”
  • “Trong 6 tháng qua, tôi đã chi bao nhiêu cho dịch vụ VPC?”
  • “Hiện tại tôi có những cơ hội tiết kiệm chi phí nào?”
  • Dọn dẹp tài nguyên

Nếu bạn không còn tiếp tục sử dụng ứng dụng FinOps, bạn có thể xoá toàn bộ tài nguyên đã triển khai bằng các bước sau:

🔻 Xoá stack CloudFormation:

  1. Truy cập AWS Management Console → chọn CloudFormation
  2. Trong thanh điều hướng, chọn Stacks
  3. Tìm stack bạn đã tạo trước đó (tên bạn tự đặt khi triển khai)
  4. Chọn stack đó và nhấn Delete

Xoá ứng dụng AWS Amplify:

  • Truy cập giao diện Amplify Console
  • Chọn ứng dụng đã triển khai
  • Thực hiện xoá toàn bộ tài nguyên theo hướng dẫn tại mục Clean Up Resources của AWS

Một số lưu ý khi triển khai thực tế

  • Triển khai ở tài khoản quản lý chi phí (payer account): Để có thể xem toàn bộ chi phí từ các tài khoản con (linked accounts) trong Cost Explorer, bạn nên triển khai giải pháp này ở tài khoản thanh toán chính của tổ chức.
  • Giới hạn của Trusted Advisor: Theo mặc định, Trusted Advisor chỉ hiển thị dữ liệu tối ưu hóa cho tài khoản đang triển khai. Để mở rộng phạm vi này trên toàn tổ chức, bạn cần kích hoạt Trusted Advisor ở cấp độ AWS Organization và điều chỉnh lại giải pháp tương ứng.
  • Tăng cường bảo mật trước khi triển khai sản phẩm (production):
    Trước khi sử dụng trong môi trường chính thức, bạn nên thiết lập các rào chắn bảo mật (guardrails) cho tác tử AI trong Amazon Bedrock, như kiểm soát truy cập, giới hạn nội dung, logging…

Kết luận

Việc tích hợp kiến trúc AI đa tác tử (multi-agent) của Amazon Bedrock với mô hình nền tảng Amazon Nova đã cho thấy tiềm năng vượt trội của trí tuệ nhân tạo trong lĩnh vực quản lý chi phí AWS (FinOps).

Giải pháp FinOps agent mà chúng tôi xây dựng chứng minh rằng các tác tử AI chuyên biệt có thể phối hợp hiệu quả để:

  • Phân tích chi phí chi tiết
  • Dự báo chi tiêu tương lai
  • Đề xuất chiến lược tối ưu hoá chi phí

Tất cả đều diễn ra trong một môi trường bảo mật, dễ sử dụng và có khả năng mở rộng cao.

Không chỉ giải quyết các thách thức tài chính hiện tại, cách tiếp cận này còn đặt nền móng cho một tương lai quản trị tài chính đám mây chủ động, thông minh và linh hoạt hơn, sẵn sàng thích nghi với sự thay đổi của doanh nghiệp.

Tài liệu tham khảo

Để hiểu rõ hơn về Amazon Bedrock bạn có thể tham khảo các tài liệu chính thức sau: