Tác giả: Benjamin Kleppe, Jagdeep Singh Soni, và Guy Kfir
Ngày phát hành: 21 JAN 2026
Chuyên mục: Amazon Bedrock, Amazon Machine Learning, Customer Solutions, Generative AI
Bài viết này được đồng tác giả bởi Benjamin Kleppe, Trưởng nhóm Kỹ thuật Machine Learning tại bunq.
Sự tích hợp của AI tác nhân (agentic AI) đang thay đổi ngành ngân hàng, đánh dấu một sự chuyển dịch đáng kể từ các hệ thống dịch vụ khách hàng truyền thống. AI tác nhân thể hiện khả năng ra quyết định tự chủ trong các môi trường tài chính phức tạp, cho phép các ngân hàng cung cấp hỗ trợ đa ngôn ngữ 24/7, xử lý giao dịch và cung cấp thông tin chi tiết tài chính cá nhân hóa ở quy mô lớn.
bunq là ngân hàng số (neobank) lớn thứ hai châu Âu, được xây dựng để giúp cuộc sống dễ dàng hơn cho những người và doanh nghiệp có lối sống quốc tế. Được thành lập vào năm 2012 bởi doanh nhân nối tiếp Ali Niknam, bunq luôn đặt người dùng làm trọng tâm trong mọi hoạt động của mình. Công ty giúp 20 triệu người dùng trên khắp châu Âu chi tiêu, tiết kiệm, lập ngân sách và đầu tư một cách tự tin, tất cả trong một ứng dụng duy nhất, thân thiện với người dùng được xây dựng dựa trên phản hồi của người dùng.
Trong bài viết này, chúng tôi sẽ trình bày cách bunq nâng cấp Finn, trợ lý AI tạo sinh nội bộ của họ, sử dụng Amazon Bedrock để chuyển đổi hoạt động hỗ trợ người dùng và ngân hàng trở nên liền mạch, đa ngôn ngữ và đa múi giờ.
Thách thức kinh doanh
Các ngân hàng đối mặt với một thách thức lớn trong việc cung cấp dịch vụ hỗ trợ khách hàng nhất quán, chất lượng cao trên nhiều kênh, ngôn ngữ và múi giờ. Các hệ thống hỗ trợ truyền thống gặp khó khăn với sự phức tạp của các sản phẩm tài chính, yêu cầu quy định và kỳ vọng ngày càng tăng về phản hồi tức thì, chính xác. Khách hàng mong muốn truy cập tức thì vào các chức năng ngân hàng thiết yếu như tranh chấp giao dịch, quản lý tài khoản và tư vấn tài chính, và các ngân hàng cần duy trì các giao thức bảo mật và tiêu chuẩn tuân thủ nghiêm ngặt. Là một ngân hàng lấy người dùng làm trung tâm, người dùng của bunq mong đợi hỗ trợ 24/7 cho các nhu cầu ngân hàng của họ, chẳng hạn như yêu cầu hoàn tiền hoặc tìm kiếm hướng dẫn về các tính năng. Các mô hình hỗ trợ truyền thống không thể đáp ứng nhu cầu này, tạo ra các nút thắt gây khó chịu và gây căng thẳng cho các nguồn lực nội bộ. Ngoài hỗ trợ trực tiếp, đội ngũ của bunq cũng cần những cách hiệu quả để phân tích các yêu cầu tính năng và báo cáo lỗi đến để liên tục cải thiện hệ thống của họ. Rõ ràng là bunq cần một giải pháp thông minh hơn có thể cung cấp hỗ trợ tức thì, chính xác suốt ngày đêm và giúp đội ngũ biến phản hồi có giá trị của người dùng thành hành động.
Tổng quan giải pháp
Ra mắt vào năm 2023, trợ lý AI tạo sinh của bunq, Finn, được xây dựng hoàn toàn nội bộ như một phần của ngăn xếp AI độc quyền của bunq. Finn sử dụng các mô hình nền tảng (FM) và công cụ AI hàng đầu, bao gồm các mô hình Claude của Anthropic thông qua Amazon Bedrock. Không giống như các chatbot thông thường, Finn xử lý ngôn ngữ tự nhiên và cung cấp các câu trả lời thông minh, theo thời gian thực. Finn có thể dịch ứng dụng bunq sang 38 ngôn ngữ và dịch các cuộc gọi thoại sang thoại cho đội ngũ hỗ trợ theo thời gian thực. Nó cũng có thể tóm tắt thông tin ngân hàng phức tạp, cung cấp thông tin chi tiết tài chính và lời khuyên về ngân sách, và thậm chí nhận dạng hình ảnh, tự động hóa các tác vụ tẻ nhạt như xử lý hóa đơn. Cách tiếp cận của bunq sử dụng các dịch vụ AWS để tạo ra một cơ sở hạ tầng tác nhân AI có khả năng mở rộng, có thể xử lý các yêu cầu của ngân hàng hiện đại trong khi vẫn duy trì bảo mật và tuân thủ. Giải pháp sử dụng các dịch vụ AWS sau:
- Amazon Bedrock – Một dịch vụ được quản lý hoàn toàn, cung cấp các FM hiệu suất cao từ các công ty AI hàng đầu và Amazon thông qua một API thống nhất. bunq sử dụng Amazon Bedrock để truy cập các mô hình Claude của Anthropic với các tính năng bảo mật nâng cao, khả năng mở rộng và tuân thủ – những yêu cầu quan trọng đối với các ứng dụng ngân hàng.
- Amazon Elastic Container Service (Amazon ECS) – Một dịch vụ điều phối container được quản lý hoàn toàn, giúp triển khai, quản lý và mở rộng các ứng dụng được đóng gói một cách dễ dàng. Amazon ECS giúp bunq không cần cài đặt và vận hành phần mềm điều phối container hoặc quản lý các cụm máy ảo, giúp bunq tập trung vào việc xây dựng kiến trúc đa tác nhân của Finn.
- Amazon DynamoDB – Một dịch vụ cơ sở dữ liệu NoSQL không máy chủ, được quản lý hoàn toàn, được thiết kế để chạy các ứng dụng hiệu suất cao ở quy mô lớn. DynamoDB mang lại hiệu suất mili giây một chữ số và lưu trữ bộ nhớ tác nhân, lịch sử cuộc trò chuyện và dữ liệu phiên, cho phép Finn duy trì ngữ cảnh trong các tương tác với khách hàng.
- Amazon OpenSearch Serverless – Một cấu hình tự động mở rộng theo yêu cầu cho Amazon OpenSearch Service. OpenSearch Serverless tự động mở rộng tài nguyên tính toán dựa trên nhu cầu ứng dụng và cung cấp khả năng tìm kiếm vector cho việc triển khai Retrieval Augmented Generation (RAG) của Finn, cho phép tìm kiếm ngữ nghĩa trên cơ sở tri thức của bunq.
Xây dựng triển khai đa tác nhân với Amazon Bedrock
Người dùng có thể tương tác với Finn thông qua ứng dụng và giao diện web của bunq, sử dụng ngôn ngữ tự nhiên cho các yêu cầu của họ, chẳng hạn như thông tin tài khoản, lịch sử giao dịch, tư vấn tài chính và các vấn đề hỗ trợ. Hệ thống xử lý các yêu cầu theo thời gian thực, chỉ truy cập dữ liệu liên quan đến yêu cầu, đồng thời duy trì các kiểm soát bảo mật và quyền riêng tư nghiêm ngặt. Các kịch bản hỗ trợ người dùng đòi hỏi nhiều hơn những gì một tác nhân AI duy nhất có thể cung cấp. Một kiến trúc đa tác nhân cho phép các tác nhân chuyên biệt xử lý các tác vụ riêng biệt – một tác nhân có thể xuất sắc trong việc hiểu người dùng, một tác nhân khác tập trung vào việc trích xuất tài liệu liên quan, và một tác nhân thứ ba xử lý phân tích giao dịch hoặc hoạt động tài khoản. Đối với Finn, điều này có nghĩa là một người dùng hỏi về một khoản thanh toán không thành công có thể kích hoạt một phản hồi phối hợp: một tác nhân diễn giải câu hỏi, một tác nhân khác kiểm tra nhật ký giao dịch, và một tác nhân thứ ba đề xuất các giải pháp dựa trên các trường hợp tương tự. Tất cả chúng hoạt động cùng nhau một cách liền mạch để đưa ra một câu trả lời toàn diện trong vài giây, thay vì chuyển người dùng giữa các phòng ban. Hệ thống hỗ trợ đa tác nhân ban đầu cho các dịch vụ ngân hàng tuân theo một mô hình có vẻ đơn giản: một tác nhân định tuyến trung tâm hướng các truy vấn của người dùng đến các tác nhân phụ chuyên biệt. Mỗi tác nhân xử lý các lĩnh vực cụ thể – hỗ trợ kỹ thuật, các yêu cầu chung, trạng thái giao dịch, quản lý tài khoản, v.v. Tuy nhiên, khi hệ thống phát triển, quy mô và độ phức tạp của các yêu cầu cũng tăng lên. Khi bunq thêm nhiều tác nhân chuyên biệt để xử lý hệ sinh thái mới, ba vấn đề trở nên rõ ràng:
- Độ phức tạp định tuyến – Với nhiều tác nhân chuyên biệt, bộ định tuyến cần logic ngày càng tinh vi để xác định đích đến chính xác.
- Khả năng chồng chéo – Nhiều tác nhân yêu cầu quyền truy cập vào cùng một nguồn dữ liệu và khả năng, buộc bộ định tuyến phải dự đoán không chỉ ý định chính mà còn cả những tác nhân phụ nào có thể cần thiết ở hạ nguồn – một nhiệm vụ bất khả thi ở quy mô lớn.
- Nút thắt cổ chai về khả năng mở rộng – Mỗi tác nhân hoặc khả năng mới đều có nghĩa là cập nhật logic của bộ định tuyến. Việc thêm một tác nhân chuyên biệt mới đòi hỏi kiểm tra toàn diện tất cả các kịch bản định tuyến. Bộ định tuyến trở thành một điểm lỗi duy nhất và một nút thắt cổ chai tiềm năng trong phát triển.
Tái cấu trúc kiến trúc
bunq đã thiết kế lại hệ thống của mình xung quanh một tác nhân điều phối (orchestrator agent) hoạt động khác biệt cơ bản so với bộ định tuyến cũ. Thay vì cố gắng định tuyến đến tất cả các tác nhân có thể, tác nhân điều phối thực hiện các hành động sau:
- Chỉ định tuyến các truy vấn đến ba đến năm tác nhân chính
- Trao quyền cho các tác nhân chính này để gọi các tác nhân khác làm công cụ khi cần
- Ủy quyền việc ra quyết định cho chính các tác nhân
Với mô hình tác nhân-như-công-cụ (agent-as-tool) này, các tác nhân chính phát hiện khi họ cần sự trợ giúp chuyên biệt. Các tác nhân công cụ được các tác nhân chính gọi động. Các tác nhân có thể gọi các tác nhân khác thông qua một giao diện được xác định rõ ràng – chúng trở thành công cụ trong bộ công cụ của nhau.
Sơ đồ sau minh họa quy trình làm việc này.

Dịch vụ Finn của bunq sử dụng cơ sở hạ tầng AWS toàn diện được thiết kế để bảo mật, khả năng mở rộng và điều phối thông minh. Sơ đồ kiến trúc sau đây cho thấy cách nhiều dịch vụ AWS hoạt động cùng nhau để cung cấp một hệ thống AI đa tác nhân.

Kiến trúc điều phối và tác nhân
Tại trung tâm của hệ thống là tác nhân điều phối, chạy trên Amazon Elastic Container Service (Amazon ECS). Tác nhân điều phối này triển khai mô hình tác nhân-như-công-cụ, định tuyến các truy vấn của người dùng đến một tập hợp giới hạn các tác nhân chính thay vì cố gắng dự đoán mọi kịch bản có thể. Tác nhân điều phối duy trì ba đến năm tác nhân chính (Tác nhân chính 1 đến 5), mỗi tác nhân được triển khai dưới dạng dịch vụ container hóa trên Amazon ECS. Thiết kế này cung cấp khả năng mở rộng theo chiều ngang – khi nhu cầu tăng lên, các phiên bản tác nhân bổ sung có thể được khởi tạo tự động. Mỗi tác nhân chính được trao quyền để gọi các tác nhân chuyên biệt khi cần. Các tác nhân chuyên biệt này (Tác nhân chuyên biệt 1, 2, 3, v.v.) hoạt động như các công cụ mà các tác nhân chính có thể gọi để thực hiện các khả năng cụ thể, chẳng hạn như phân tích dữ liệu giao dịch, truy xuất tài liệu hoặc xử lý các truy vấn phức tạp. Cấu trúc phân cấp này tránh được nút thắt cổ chai về độ phức tạp định tuyến trong khi vẫn duy trì tính linh hoạt.
Chi tiết hạ tầng
Kiến trúc được xây dựng trên nền tảng vững chắc của các dịch vụ AWS cho phép Finn hoạt động hiệu quả. Người dùng truy cập dịch vụ thông qua ứng dụng của bunq, với lưu lượng truy cập được bảo mật bởi AWS WAF và Amazon CloudFront, trong khi xác thực diễn ra thông qua hệ thống nhận dạng độc quyền của bunq. Amazon Bedrock cung cấp quyền truy cập vào các mô hình Claude của Anthropic để hiểu ngôn ngữ tự nhiên, được bổ sung bởi các mô hình được tinh chỉnh được lưu trữ trên Amazon SageMaker cho các kịch bản ngân hàng chuyên biệt. Bộ nhớ tác nhân và lịch sử cuộc trò chuyện được lưu trữ trong DynamoDB, và OpenSearch Service đóng vai trò là kho vector cho các khả năng RAG, cho phép tìm kiếm ngữ nghĩa trên cơ sở tri thức của bunq. Amazon Simple Storage Service (Amazon S3) xử lý việc lưu trữ tài liệu, và Amazon MemoryDB quản lý các phiên người dùng cho các tương tác thời gian thực. Khả năng quan sát toàn diện thông qua AWS CloudTrail, Amazon GuardDuty và Amazon CloudWatch giúp đội ngũ giám sát hiệu suất, phát hiện các mối đe dọa và duy trì tuân thủ – tất cả trong một đám mây riêng ảo (VPC) an toàn.
Tác động thực tế
Sự chuyển đổi từ kiến trúc dựa trên bộ định tuyến ban đầu của bunq sang mô hình điều phối với Amazon Bedrock đã mang lại những cải thiện đáng kể trong hoạt động hỗ trợ người dùng. Việc triển khai đa tác nhân đã đạt được những lợi ích đáng kể về hiệu quả hoạt động:
- Finn hiện xử lý 97% hoạt động hỗ trợ người dùng của bunq, với hơn 82% được tự động hóa hoàn toàn. Thời gian phản hồi trung bình giảm xuống chỉ còn 47 giây, giúp bunq cung cấp các giải pháp thời gian thực mà người dùng mong đợi.
- Thời gian triển khai nhanh chóng làm nổi bật sự tập trung của bunq vào đổi mới. Đội ngũ đã chuyển từ ý tưởng sang sản xuất trong 3 tháng, bắt đầu vào tháng 1 năm 2025. bunq đã tập hợp một đội ngũ gồm 80 người – từ kỹ sư AI đến nhân viên hỗ trợ – những người đã làm việc cùng nhau để kiểm tra, học hỏi và triển khai các bản cập nhật ba lần một ngày.
- Trước khi triển khai kiến trúc điều phối, các yêu cầu leo thang chủ yếu là các quy trình thủ công. Hệ thống đa tác nhân mới đã tăng cường tự động hóa, thay đổi các chỉ số hỗ trợ từ đầu đến cuối. Ngoài ra, Finn đã mở rộng phạm vi tiếp cận của bunq bằng cách dịch ứng dụng sang 38 ngôn ngữ, giúp hàng triệu người dùng trên khắp châu Âu dễ dàng tiếp cận dịch vụ ngân hàng hơn.
- Giải pháp này đã giúp bunq trở thành ngân hàng hỗ trợ AI đầu tiên ở châu Âu, cung cấp các khả năng mà không hệ thống hỗ trợ truyền thống nào có thể mang lại: dịch thoại sang thoại theo thời gian thực (lần đầu tiên trong ngành ngân hàng toàn cầu), nhận dạng hình ảnh để xử lý biên lai và xác minh tài liệu, và thông tin chi tiết tài chính thông minh – tất cả trong khi vẫn duy trì tính khả dụng 24/7 mà người dùng yêu cầu.
“Chúng tôi đã đi từ ý tưởng đến sản xuất trong 3 tháng. Trước kiến trúc điều phối, các yêu cầu leo thang chủ yếu là thủ công. Giờ đây, Finn xử lý 97% yêu cầu hỗ trợ với 70% được tự động hóa hoàn toàn và thời gian phản hồi trung bình là 47 giây.”
– Benjamin Kleppe, Trưởng nhóm Kỹ thuật Machine Learning tại bunq.
Kết luận
Hành trình của bunq từ các yêu cầu hỗ trợ thủ công đến một hệ thống đa tác nhân thông minh cho thấy kiến trúc AI hiện đại có thể thay đổi hoạt động ngân hàng như thế nào. Bằng cách chuyển từ cách tiếp cận dựa trên bộ định tuyến cứng nhắc sang mô hình điều phối linh hoạt với Amazon Bedrock, bunq đã tránh được các nút thắt cổ chai về khả năng mở rộng trong khi vẫn duy trì sự linh hoạt cần thiết để phục vụ 20 triệu người dùng trên khắp châu Âu. Mô hình điều phối với khả năng tác nhân-như-công-cụ đã chứng tỏ là yếu tố thiết yếu cho sự thành công của bunq. Thay vì dự đoán mọi kịch bản người dùng có thể xảy ra ngay từ đầu, hệ thống trao quyền cho các tác nhân chính để gọi động các tác nhân chuyên biệt khi cần. Sự thay đổi kiến trúc này đã giảm độ phức tạp, tăng tốc chu kỳ phát triển và giúp bunq triển khai các bản cập nhật ba lần mỗi ngày trong quá trình triển khai ban đầu. Kết quả: 97% tương tác hỗ trợ được Finn xử lý, 70% được tự động hóa hoàn toàn và thời gian phản hồi trung bình chỉ 47 giây. Ngoài những lợi ích về hiệu quả, giải pháp này đã mở rộng phạm vi tiếp cận của bunq sang 38 ngôn ngữ và định vị công ty là ngân hàng hỗ trợ AI đầu tiên ở châu Âu. Bằng cách giải phóng các nguồn lực nội bộ khỏi các quy trình thủ công, bunq giờ đây có thể tập trung vào những gì họ làm tốt nhất: xây dựng một ngân hàng giúp cuộc sống của người dùng trở nên dễ dàng.
Để tìm hiểu thêm về việc xây dựng các ứng dụng hỗ trợ AI với FM, hãy tham khảo Amazon Bedrock. Khám phá cách Anthropic’s Claude trên Amazon Bedrock có thể thay đổi trải nghiệm khách hàng của bạn với các tính năng bảo mật nâng cao và khả năng mở rộng. Bắt đầu với tài liệu Amazon Bedrock để xây dựng các giải pháp đa tác nhân của riêng bạn.
Về tác giả

Benjamin Kleppe là Trưởng nhóm Kỹ thuật Machine Learning tại bunq, nơi anh dẫn dắt việc phát triển và mở rộng các giải pháp hỗ trợ AI giúp hoạt động ngân hàng thông minh hơn và cá nhân hóa hơn cho 20 triệu người dùng trên khắp châu Âu. Anh tập trung vào việc xây dựng các hệ thống thông minh nhằm nâng cao trải nghiệm người dùng, cải thiện khám phá sản phẩm và tự động hóa các quy trình ngân hàng phức tạp. Benjamin đam mê đẩy lùi ranh giới đổi mới AI trong ngành ngân hàng, đã dẫn dắt bunq trở thành ngân hàng hỗ trợ AI đầu tiên ở châu Âu với việc ra mắt Finn, nền tảng AI tạo sinh độc quyền của họ.

Jagdeep Singh Soni là Kiến trúc sư Giải pháp AI/ML cấp cao tại AWS có trụ sở tại Hà Lan, chuyên về AI tạo sinh và Amazon Bedrock. Anh giúp khách hàng và đối tác thiết kế và triển khai các giải pháp tác nhân thông minh sử dụng Amazon Bedrock và các dịch vụ AWS AI/ML khác. Với 16 năm kinh nghiệm trong đổi mới và kiến trúc đám mây, Jagdeep tập trung vào việc giúp các tổ chức xây dựng các ứng dụng AI tạo sinh sẵn sàng sản xuất, sử dụng các mô hình nền tảng và khung tác nhân để đạt được kết quả kinh doanh thực tế.

Guy Kfir là Trưởng nhóm AI tạo sinh tại AWS với hơn 15 năm kinh nghiệm trong lĩnh vực bán hàng công nghệ đám mây, phát triển kinh doanh và truyền bá AI/ML. Anh làm việc với các khách hàng doanh nghiệp, công ty khởi nghiệp và đối tác trên khắp EMEA để đẩy nhanh việc áp dụng các giải pháp AI tạo sinh và thực hiện các chiến lược tiếp cận thị trường.