Xây dựng ứng dụng ChatGPT với MCP Servers và Cơ sở hạ tầng AWS

Tác giả: Ethan Fahy, Janya Ram, Jay Ramachandran, and Sriharsha M S
Ngày phát hành: 25 MAR 2026
Chuyên mục: Amazon API Gateway, Amazon Bedrock, Amazon Cognito, Amazon DynamoDB, AWS Lambda, Industries, Retail

Giới thiệu

Điều gì sẽ xảy ra nếu khách hàng của bạn có thể mua sắm toàn bộ danh mục sản phẩm, nhận các đề xuất được cá nhân hóa và hoàn tất giao dịch mua – tất cả mà không cần rời khỏi cuộc trò chuyện?

Đó chính xác là điều mà Ứng dụng ChatGPT có thể thực hiện, và các nhà bán lẻ có tư duy tiến bộ đang chạy đua để triển khai chúng. Trong bài đăng này, chúng ta sẽ tìm hiểu Ứng dụng ChatGPT là gì, tại sao chúng trở thành ưu tiên chiến lược cho các nhà bán lẻ và cách chúng phù hợp với tầm nhìn thương mại dựa trên tác nhân (agentic commerce) rộng lớn hơn. Chúng tôi cũng sẽ chỉ cho bạn lý do tại sao AWS là cơ sở hạ tầng backend lý tưởng. Chúng tôi sẽ đưa bạn qua một ví dụ thực tế: một Ứng dụng ChatGPT cho một cửa hàng cà phê hạt thương mại điện tử giả định, hoàn chỉnh với kiến trúc tham chiếu AWS có thể triển khai mà bạn có thể sử dụng làm điểm khởi đầu của riêng mình.

Ứng dụng ChatGPT ra mắt

Vào tháng 10 năm 2025, OpenAI đã công bố Ứng dụng ChatGPT. Ứng dụng ChatGPT cho phép người dùng ChatGPT tương tác với các ứng dụng của bên thứ ba trực tiếp trong giao diện người dùng ChatGPT. Ứng dụng ChatGPT có thể bao gồm các thành phần giao diện người dùng đồ họa phong phú, tương tác, bổ sung cho trải nghiệm người dùng ChatGPT dựa trên văn bản thông thường.

Các nhà bán lẻ có thể xây dựng Ứng dụng ChatGPT của riêng mình để mang lại trải nghiệm độc đáo cho những khách hàng đã quen thuộc với giao diện người dùng ChatGPT. Theo Thương mại AI dựa trên tác nhân: Cuộc cách mạng bán lẻ tiếp theo đã đến, các nhà bán lẻ nên cân nhắc xây dựng Ứng dụng ChatGPT vì ngày càng nhiều khách hàng bắt đầu hành trình khám phá sản phẩm và quyết định mua hàng trên các Trợ lý AI như ChatGPT.

Một Ứng dụng ChatGPT phải được lưu trữ thông qua Máy chủ Giao thức Ngữ cảnh Mô hình (MCP). Các Máy chủ MCP này cần được lưu trữ bên ngoài ChatGPT. AWS cung cấp cơ sở hạ tầng đám mây an toàn và có khả năng mở rộng, lý tưởng để lưu trữ Máy chủ MCP.

Trong các phần sau, chúng tôi sẽ chỉ cho bạn một ví dụ về Ứng dụng ChatGPT để bạn có ý tưởng về những gì có thể xây dựng cho ứng dụng bán lẻ của riêng mình. Chúng tôi cũng sẽ chỉ cho bạn cách giải pháp ví dụ được triển khai trên AWS và cách các dịch vụ AWS như Amazon OpenSearch nâng cao trải nghiệm tìm kiếm và khám phá sản phẩm của ứng dụng ChatGPT bằng cách cung cấp khả năng tìm kiếm kết hợp (hybrid search).

Cách thức hoạt động

Chúng tôi sẽ đưa bạn qua 5 bước dễ dàng để minh họa cách Ứng dụng ChatGPT hoạt động. Sau các bước này, bạn sẽ thấy một giỏ hàng sẵn sàng để đặt hàng. Hãy bắt đầu!

Bước 1: Thêm ứng dụng ChatGPT vào cuộc trò chuyện
Từ giao diện người dùng ChatGPT, chúng ta bắt đầu bằng cách thêm Ứng dụng ChatGPT “coffee” của mình vào cuộc trò chuyện hiện tại bằng cách sử dụng biểu tượng “dấu cộng” ở phía dưới bên trái. Sau đó, chúng ta có thể đặt các câu hỏi tự nhiên, mang tính hội thoại như “Tôi thường thích cà phê rang nhẹ với hương trái cây, có gợi ý nào không?”.


Hình 1: Thêm Ứng dụng ChatGPT “coffee” vào cuộc trò chuyện và bắt đầu cuộc trò chuyện.

ChatGPT diễn giải câu hỏi và tự động gọi “search_products_tool” từ máy chủ MCP để tìm kiếm các sản phẩm liên quan dựa trên truy vấn của chúng ta. Nó hiển thị một giao diện người dùng đồ họa phong phú được trả về như một phần của phản hồi máy chủ MCP. Giao diện người dùng này hiển thị nhiều loại cà phê rang nhẹ có hương trái cây phù hợp, như minh họa dưới đây.


Hình 2: Ứng dụng ChatGPT sử dụng backend của Máy chủ MCP để tìm kiếm các sản phẩm liên quan và hiển thị chúng trong giao diện người dùng đồ họa.

Bước 2: Xem thêm chi tiết sản phẩm
Tại đây, chúng ta có thể nhấp vào một sản phẩm và nhận một cửa sổ bật lên hiển thị chi tiết sản phẩm và thông tin bổ sung.


Hình 3: Giao diện người dùng đồ họa bao gồm khả năng nhấp vào các sản phẩm cụ thể để hiển thị chi tiết sản phẩm.

Bước 3: Nhận góc nhìn phong phú hơn từ ChatGPT
Ngoài việc hiển thị giao diện người dùng đồ họa, ChatGPT cũng tiếp tục cuộc trò chuyện, biên tập kết quả tìm kiếm và đưa ra một số lý do “tại sao” đằng sau các gợi ý. Nó cũng cố gắng thúc đẩy cuộc trò chuyện và thu hẹp tìm kiếm sản phẩm của chúng ta bằng cách đặt một câu hỏi làm rõ về thiết bị pha chế mà chúng ta sử dụng ở nhà.


Hình 4: ChatGPT cũng tiếp tục cuộc trò chuyện dựa trên văn bản cùng với các thành phần giao diện người dùng đồ họa mà nó hiển thị, tự động đặt các câu hỏi tiếp theo để giúp nhắc nhở người dùng thu hẹp tìm kiếm sản phẩm.

Bước 4: Thu hẹp lựa chọn của chúng ta
Sau khi chúng ta chỉ định rằng chúng ta sử dụng Kalita Wave 185 pour-over, ChatGPT sử dụng ngữ cảnh này để thu hẹp thêm các đề xuất của nó xuống một lựa chọn “tốt nhất tổng thể” duy nhất.


Hình 5: Sau khi thu thập thêm ngữ cảnh về thiết bị của khách hàng, ChatGPT theo dõi và thu hẹp các sản phẩm mà nó đã đề xuất.

Bước 5: Thêm lựa chọn cuối cùng vào giỏ hàng của chúng ta
Vì ChatGPT đã hướng dẫn chúng ta đến một đề xuất sản phẩm cụ thể và có lý do, chúng ta đã sẵn sàng “thử Ethiopian Yirgacheffe”. ChatGPT diễn giải chính xác ý định của yêu cầu của chúng ta và sử dụng endpoint MCP thích hợp để thêm hạt cà phê vào giỏ hàng của chúng ta. ChatGPT rất muốn tiếp tục cuộc trò chuyện về các kỹ thuật pha chế để đảm bảo chúng ta tận dụng tối đa cà phê của mình và cảm thấy hào hứng để hoàn tất giao dịch mua.


Hình 6: ChatGPT diễn giải yêu cầu ngôn ngữ tự nhiên của khách hàng và sử dụng máy chủ MCP để thêm mặt hàng được yêu cầu vào giỏ hàng.

Cách chúng tôi xây dựng giải pháp

Ứng dụng ChatGPT yêu cầu chủ sở hữu ứng dụng cung cấp cơ sở hạ tầng backend để lộ một máy chủ MCP. Đối với ví dụ này, cơ sở hạ tầng backend được lưu trữ trên các dịch vụ AWS, như minh họa trong Hình 7. Ứng dụng hoạt động như sau:

  1. Người dùng ChatGPT thêm Ứng dụng ChatGPT vào cuộc trò chuyện ChatGPT hiện tại của họ. Họ đặt các câu hỏi ngôn ngữ tự nhiên trong ChatGPT. ChatGPT diễn giải câu hỏi của người dùng, đọc mô tả endpoint MCP và gọi các công cụ thích hợp được lộ ra bởi máy chủ MCP.
  2. URL máy chủ MCP được định tuyến đến Amazon API Gateway, sau đó gọi máy chủ MCP được lưu trữ trong một hàm AWS Lambda.
  3. Hàm AWS Lambda xác thực người dùng cuối bằng Amazon Cognito và OAuth tùy thuộc vào việc hành động có yêu cầu xác thực hay không. Ví dụ, tìm kiếm sản phẩm không nhất thiết yêu cầu xác thực, nhưng thêm sản phẩm vào giỏ hàng thường có.
  4. Đối với các truy vấn tìm kiếm danh mục sản phẩm, AWS Lambda tạo một vector embedding của truy vấn người dùng bằng cách sử dụng mô hình Amazon Titan Text Embeddings trong Amazon Bedrock, sau đó gọi Amazon OpenSearch Serverless, thực hiện tìm kiếm kết hợp (hybrid search) kết hợp tìm kiếm từ khóa và tìm kiếm ngữ nghĩa để tăng độ chính xác. Ví dụ, khi chúng ta yêu cầu “cà phê rang nhẹ với hương trái cây”, tìm kiếm từ khóa sẽ không tìm thấy “Ethiopian Yirgacheffe” ngay cả với các thẻ metadata như “sáng, hương cam quýt và tinh tế” vì không có từ khóa khớp trực tiếp. Nhưng tìm kiếm kết hợp bổ sung khả năng tìm kiếm ngữ nghĩa, có thể tìm thấy mối liên hệ giữa “fruity” và “citrusy”, và “light” và “delicate”. Tìm kiếm kết hợp là một thành phần quan trọng của hệ thống hội thoại này vì nó cho phép người dùng nói bằng ngôn ngữ tự nhiên mà không phải lo lắng về việc “nói bằng từ khóa”.
  5. Đối với các truy vấn liên quan đến giỏ hàng, AWS Lambda gọi Amazon DynamoDB, nơi lưu trữ trạng thái giỏ hàng cho ứng dụng.
  6. Đối với các truy vấn tìm kiếm danh mục sản phẩm, nội dung phản hồi MCP có URL hình ảnh. ChatGPT lấy các hình ảnh này từ một bucket Amazon S3 thông qua một phân phối Amazon CloudFront.
  7. Các hình ảnh danh mục sản phẩm được tạo bằng mô hình Amazon Nova Canvas được truy cập thông qua Amazon Bedrock.


Hình 7: Kiến trúc giải pháp AWS

Kết luận

Trong bài đăng này, chúng tôi đã trình bày loại trải nghiệm người dùng mà các nhà bán lẻ có thể tạo ra với Ứng dụng ChatGPT. Chúng tôi đã thấy cách các dịch vụ AWS có thể hỗ trợ các yêu cầu chính để triển khai Ứng dụng ChatGPT, bao gồm lưu trữ Máy chủ MCP có khả năng mở rộng, xác thực và ủy quyền người dùng, quản lý trạng thái và khả năng tìm kiếm kết hợp cho danh mục sản phẩm.

Mặc dù nhiều nhà bán lẻ sẽ chọn bắt đầu xây dựng tích hợp ứng dụng với Ứng dụng ChatGPT, điều quan trọng cần lưu ý là hầu hết công việc được thực hiện để tạo máy chủ MCP hỗ trợ Ứng dụng ChatGPT của bạn sẽ có thể tái sử dụng, điều này làm tăng giá trị của nỗ lực ban đầu. Ví dụ, cùng một máy chủ MCP (hoặc rất tương tự) có thể được sử dụng làm nền tảng để xây dựng một Trợ lý mua sắm AI tại chỗ (hãy nghĩ đến: Amazon Rufus).

Khi không gian thương mại dựa trên tác nhân tiếp tục phát triển, các khoản đầu tư vào khả năng máy chủ MCP nền tảng hiện nay sẽ tạo ra nền tảng để xây dựng trải nghiệm khách hàng phong phú, được cá nhân hóa trên các kênh mới khi chúng xuất hiện. ChatGPT là Trợ lý AI hàng đầu theo thị phần, vì vậy các nhà bán lẻ nên cân nhắc bắt đầu với Ứng dụng ChatGPT. AWS cung cấp cơ sở hạ tầng và dịch vụ an toàn và có khả năng mở rộng để lưu trữ các máy chủ MCP mà Ứng dụng ChatGPT yêu cầu, vì vậy các nhà bán lẻ nên cân nhắc xây dựng cơ sở hạ tầng cần thiết này trên AWS.

Các bước tiếp theo

Để xem mã nguồn và hướng dẫn triển khai cho giải pháp ví dụ này, hãy truy cập kho lưu trữ GitHub trong aws-samples.

Đọc thêm về chiến lược Agentic Commerce cho các nhà bán lẻ và cách đầu tư vào nền tảng máy chủ MCP có thể mở rộng trên các trường hợp sử dụng trong blog này: Giải mã tương lai của ngành bán lẻ: Nắm bắt các tác nhân mua sắm AI.

Về tác giả


Ethan Fahy
Ethan Fahy là Kiến trúc sư Giải pháp Chính khu vực cho Thương mại điện tử tại AWS, giúp các khách hàng Bán lẻ & Thương mại điện tử của AWS điều hướng bối cảnh Thương mại điện tử đang phát triển nhanh chóng và xây dựng trải nghiệm khách hàng thế hệ tiếp theo bằng các công nghệ AWS và giải pháp đối tác.


Janya Ram
Janya Ram là Chuyên viên Tư vấn Triển khai Liên kết cho Amazon Web Services có trụ sở tại Thành phố New York, nơi cô cộng tác với khách hàng để thiết kế và triển khai các ứng dụng gốc đám mây. Chuyên môn của cô giúp khách hàng tận dụng các dịch vụ đám mây tiên tiến để tạo ra các giải pháp dữ liệu có khả năng mở rộng, hiệu quả. Ngoài công việc, cô thích đi du lịch và dành thời gian cho bạn bè và gia đình.


Jay Ramachandran
Jay Ramachandran là Kiến trúc sư Giải pháp cấp cao trong lĩnh vực bán lẻ và thương mại điện tử với chuyên môn sâu về phát triển phần mềm, Cơ sở hạ tầng dưới dạng mã (Infrastructure as Code) và bảo mật. Anh ấy giúp các tổ chức thiết kế và xây dựng các hệ thống an toàn, có khả năng mở rộng trên AWS. Anh ấy đam mê áp dụng AI tạo sinh để giải quyết các vấn đề kinh doanh thực tế.


Sriharsha M S
Sriharsha M S là kiến trúc sư giải pháp chuyên gia AI tạo sinh chính trong nhóm Chuyên gia Chiến lược tại Amazon Web Services. Anh ấy làm việc với các khách hàng chiến lược của AWS đang tận dụng AI/ML để giải quyết các vấn đề kinh doanh phức tạp. Anh ấy cung cấp hướng dẫn kỹ thuật và lời khuyên thiết kế cho khoa học mô hình nền tảng và các ứng dụng AI dựa trên tác nhân ở quy mô lớn. Chuyên môn của anh ấy bao gồm các bộ tăng tốc phần cứng ứng dụng, kiến trúc, dữ liệu lớn, phân tích và học máy.

Leave a comment