Thông báo cập nhật AWS Well-Architected FSI Lens cho Generative AI và Agentic AI

Tác giả: Sanjay Ohri
Ngày phát hành: 27 JAN 2026
Chuyên mục: AWS Well-Architected Tool, Financial Services, Industries

Hôm nay, chúng tôi vui mừng thông báo về bản cập nhật cho AWS Well-Architected Financial Services Industry Lens với hướng dẫn toàn diện cho các workload generative AI và agentic AI. Phiên bản này hiện có sẵn trong Lens Catalog của AWS Well-Architected Tool.

Có gì mới

Bản cập nhật Financial Services Industry (FSI) Lens giới thiệu các phương pháp hay nhất mới được thiết kế đặc biệt cho các hệ thống generative AI và agentic AI, bao gồm tất cả sáu trụ cột của AWS Well-Architected Framework. Những bổ sung này cung cấp cho các tổ chức dịch vụ tài chính hướng dẫn thực tế để thiết kế, triển khai và vận hành các workload AI một cách tự tin.

Lens này nhấn mạnh việc coi generative AI và agentic AI là các thành phần workload hạng nhất, đòi hỏi sự chặt chẽ tương tự trong quản trị, bảo mật, tối ưu hóa hiệu suất và quản lý chi phí như cơ sở hạ tầng đám mây truyền thống, khi AI ngày càng trở nên trung tâm đối với khách hàng dịch vụ tài chính.

Giới thiệu

AWS Well-Architected (WA) Framework đã giúp khách hàng và đối tác AWS cải thiện kiến trúc đám mây của họ từ năm 2015. AWS WA Framework bao gồm các lens chuyên biệt theo từng lĩnh vực, phòng lab thực hành và AWS Well-Architected Tool có sẵn miễn phí trong AWS Management Console và cung cấp hướng dẫn trên sáu trụ cột:

Security

Security vẫn là yếu tố tối quan trọng trong dịch vụ tài chính, và hướng dẫn mới của chúng tôi giải quyết những thách thức độc đáo của các hệ thống AI:

Bảo mật các mô hình AI/ML và bảo vệ dữ liệu huấn luyện bằng các kiểm soát toàn diện bao gồm quyền truy cập ít đặc quyền nhất, bộ lọc làm sạch dữ liệu để đảm bảo tính toàn vẹn của dữ liệu huấn luyện và danh mục prompt được kiểm soát phiên bản để triển khai mô hình an toàn.
Giám sát đầu ra của hệ thống AI để phát hiện các vấn đề bảo mật thông qua xác thực phản hồi tự động với các rào chắn bảo vệ (guardrails), phát hiện prompt injection và các quy trình ứng phó sự cố dành riêng cho AI.
Triển khai quản trị mô hình AI và kiểm soát truy cập với các framework quản trị toàn diện, quy trình phê duyệt mô hình và phân tách nhiệm vụ giữa kỹ thuật prompt và quản trị bảo mật.
Tận dụng AI để phát hiện mối đe dọa và tự động hóa bảo mật nhằm tăng cường phát hiện bất thường, tự động hóa phân tích phần mềm độc hại và cho phép khắc phục sự cố dựa trên AI.
Triển khai các mô hình quyền hạn chi tiết cho các hành động của agent với nguyên tắc ít đặc quyền nhất.
Xác định ranh giới bảo mật rõ ràng cho các hoạt động của agent và thiết lập quản trị cho quyền truy cập công cụ.
Triển khai các biện pháp bảo vệ chống lại prompt injection và thao túng agent.

Operational Excellence

Các tổ chức tài chính cần các framework vận hành mạnh mẽ cho các hệ thống AI. Lens cập nhật bao gồm:

Xác định các framework quản lý rủi ro mô hình generative AI với danh mục mô hình toàn diện, phân tầng rủi ro, quản trị dữ liệu cho các tập dữ liệu huấn luyện, theo dõi tuân thủ và các rào chắn bảo vệ cho hành vi hệ thống.
Triển khai xác thực human-in-the-loop cho các quy trình AI quan trọng với quy trình xem xét bắt buộc và nhật ký kiểm toán toàn diện.
Thiết lập chiến lược lập phiên bản và rollback mô hình AI bằng cách sử dụng các registry mô hình bất biến để quản lý triển khai đáng tin cậy.
Thêm kiểm thử hệ thống AI chuyên biệt bao gồm kiểm thử prompt/response và kiểm thử đối kháng để tìm lỗ hổng.
Thiết lập cấu trúc quản trị chuyên dụng cho các agent tự động với ranh giới, quyền hạn và đường dẫn leo thang rõ ràng.
Triển khai giám sát chuyên biệt cho các hoạt động và quyết định của agent với ngưỡng giám sát của con người.
Xác định các quy trình triển khai, lập phiên bản và ngừng hoạt động của agent.

Reliability

Lens cung cấp hướng dẫn toàn diện để đảm bảo độ tin cậy của hệ thống AI:

Thiết kế kiến trúc AI có khả năng phục hồi với Recovery Time Objectives (RTO) và Recovery Point Objectives (RPO) phù hợp cho các workload AI.
Triển khai chiến lược lập phiên bản và rollback mô hình AI bằng cách sử dụng các registry mô hình bất biến.
Thêm kiểm thử và xác thực hệ thống AI chuyên biệt bao gồm kiểm thử prompt/response và kiểm thử đối kháng để tìm lỗ hổng.
Thiết kế kiến trúc agent có khả năng phục hồi với cơ chế giảm cấp linh hoạt (graceful degradation) và chuyển đổi dự phòng (failover).
Triển khai cơ chế xác thực để đảm bảo hành vi agent nhất quán.
Xác định các quy trình phục hồi từ lỗi agent hoặc quyết định sai lầm, và tạo các framework kiểm thử toàn diện cho hành vi agent trong các điều kiện khác nhau.

Performance Efficiency

Lens cung cấp hướng dẫn chi tiết về việc lựa chọn và tối ưu hóa cơ sở hạ tầng AI:

Chọn GPU và điện toán tăng tốc phù hợp với các khuyến nghị về instance cho huấn luyện mô hình, suy luận thời gian thực và suy luận transformer hiệu quả về chi phí.
Chọn và tối ưu hóa các thành phần generative AI bao gồm tập dữ liệu ground truth cho các trường hợp sử dụng tài chính, tùy chỉnh mô hình thông qua fine-tuning và tối ưu hóa vector store để truy xuất dữ liệu tài chính.
Xác định tập dữ liệu ground truth với các kịch bản cụ thể của dịch vụ tài chính để đánh giá mô hình chính xác.
Tối ưu hóa hiệu suất suy luận mô hình AI thông qua các kỹ thuật tăng tốc suy luận bao gồm pruning và quantization, real-time optimization cho phát hiện gian lận và giao dịch, và giám sát hiệu suất toàn diện.
Giám sát và điều chỉnh hiệu suất hệ thống AI với các chỉ số độ chính xác, theo dõi tác động kinh doanh và khả năng điều chỉnh tự động.
Thiết kế quy trình làm việc hiệu quả cho các hệ thống đa agent.
Triển khai quản lý ngữ cảnh hiệu quả cho các agent chạy dài và tối ưu hóa cách agent chọn và sử dụng công cụ.
Thiết kế các mẫu cho các hoạt động agent song song khi thích hợp, và cân bằng sự kỹ lưỡng với thời gian phản hồi trong các hoạt động của agent.

Cost Optimization

Hiểu và kiểm soát chi phí AI là rất quan trọng để áp dụng bền vững. Các phương pháp hay nhất mới bao gồm:

Sử dụng các khoản tín dụng và chương trình đầu tư cho các proof-of-concept AI/ML để giảm chi phí thử nghiệm ban đầu.
Áp dụng Savings Plans cho các endpoint suy luận generative AI và phục vụ mô hình để quản lý chi phí có thể dự đoán.
Cân nhắc các đánh đổi về giá cụ thể của AI với việc lựa chọn mô hình dựa trên tỷ lệ giá-hiệu suất, quy tắc định tuyến mô hình và các trình điều phối RAG serverless.
Theo dõi các KPI của generative AI bao gồm chi phí trên mỗi token, tỷ lệ cache hit và tỷ lệ kết hợp các tầng mô hình.
Đo lường tác động kinh doanh của AI thông qua các chỉ số chi phí-giá trị như chi phí trên mỗi hợp đồng được đối chiếu hoặc chi phí trên mỗi truy vấn được giải quyết.
Triển khai các chiến lược để giảm thiểu mức tiêu thụ token trong các hoạt động của agent.
Giám sát và tối ưu hóa chi phí liên quan đến các công cụ mà agent gọi.
Thiết kế các quy trình làm việc của agent có ý thức về chi phí nhằm giảm thiểu các bước không cần thiết.
Triển khai bộ nhớ đệm thích hợp cho các tác vụ agent lặp lại, và xác định tiêu chí lựa chọn các tầng độ phức tạp của agent phù hợp dựa trên yêu cầu tác vụ.

Sustainability

Bản cập nhật giải quyết tác động môi trường của các workload AI:

Chọn các Region có lượng carbon thấp hơn cho các workload huấn luyện AI để giảm thiểu tác động môi trường.
Giám sát mức sử dụng token và giảm quy mô các endpoint suy luận trong thời gian nhàn rỗi để tăng hiệu quả tài nguyên.
Sử dụng managed spot training và các kỹ thuật fine-tuning hiệu quả tham số (PEFT) để giảm yêu cầu tính toán.
Đánh giá các instance tiết kiệm năng lượng cho các hoạt động AI bền vững.
Phát triển các container AI đa kiến trúc cho các loại instance khác nhau để tối ưu hóa việc sử dụng tài nguyên.
Giám sát và tối ưu hóa tài nguyên tính toán được sử dụng bởi các agent tự động.
Triển khai lập lịch tác vụ có ý thức về tính bền vững cho các hoạt động agent không quan trọng về thời gian.
Xác định các KPI bền vững cụ thể cho các hoạt động của agent.
Phát triển các mẫu giảm thiểu tác động môi trường của các hoạt động agent, và chọn cơ sở hạ tầng tiết kiệm năng lượng cho các workload agent khi có thể.

Kết luận

Bản cập nhật AWS Well-Architected Financial Services Industry Lens hiện đã có sẵn và chúng tôi khuyến khích tất cả các tổ chức dịch vụ tài chính đang khám phá hoặc triển khai các giải pháp generative AI và agentic AI nên xem xét hướng dẫn này.

Để có hướng dẫn chi tiết và các ví dụ triển khai, hãy truy cập tài liệu FSI Lens đầy đủ thông qua AWS Well-Architected Tool hoặc AWS Well-Architected Framework.

Liên hệ với nhóm tài khoản AWS của bạn để làm việc với chuyên gia Financial Services Industry nếu bạn cần thêm hướng dẫn chuyên sâu.

Tìm hiểu thêm về AWS cho Financial Services, các nghiên cứu điển hình của khách hàng và các tài nguyên bổ sung trên trang web Financial Services của chúng tôi.

Tài nguyên bổ sung:

Video giới thiệu AWS Well-Architected
AWS Well-Architected Tool
AWS Well-Architected Framework
AWS Well-Architected Labs

Về tác giả

Sanjay Ohri
Sanjay Ohri là một chuyên gia từng đoạt giải thưởng với hơn 15 năm kinh nghiệm thành công trong việc cung cấp và quản lý chương trình toàn cầu các dịch vụ đám mây và on-premise hiệu quả về chi phí cho các công ty như JPMorganChase và Bank of America. Ông hiện là Principal Manager trong AWS Worldwide Financial Services, giúp đẩy nhanh việc áp dụng các dịch vụ đám mây cho khách hàng.

AWS Study Group

Thông báo cập nhật AWS Well-Architected FSI Lens cho Generative AI và Agentic AI

Có gì mới

Giới thiệu

Kết luận

Tài nguyên bổ sung:

Về tác giả

Leave a comment Cancel reply

Thông báo cập nhật AWS Well-Architected FSI Lens cho Generative AI và Agentic AI

Có gì mới

Giới thiệu

Kết luận

Tài nguyên bổ sung:

Về tác giả

Share this:

Leave a comment Cancel reply