Tác giả: Jean Velez Torres
Ngày phát hành: 28 JAN 2026
Chuyên mục: Amazon CloudWatch, Best Practices, Monitoring and observability
Khi một dịch vụ quan trọng gặp sự cố, bạn cần biết mình đang mất bao nhiêu doanh thu, chứ không chỉ là độ trễ đã tăng lên. Bài viết này sẽ chỉ cho bạn cách tích hợp các chỉ số kinh doanh với CloudWatch Application Signals để xem cả hiệu suất kỹ thuật và tác động kinh doanh trong một giao diện thống nhất.
Với CloudWatch Application Signals, bạn có thể xem các chỉ số, dấu vết (traces) và nhật ký (logs) trong một giao diện thống nhất, giúp bạn nhanh chóng xác định các vấn đề trên các hệ thống phân tán phức tạp. Trong bài viết này, chúng tôi sẽ chỉ ra cách thêm các chỉ số kinh doanh tùy chỉnh vào Application Signals giúp xác định tác động doanh thu trong quá trình gián đoạn dịch vụ – điều mà việc giám sát hạ tầng đơn thuần không thể tiết lộ.
Các chỉ số kinh doanh quan trọng
Trong khi Application Signals tự động thu thập các chỉ số RED – Tốc độ yêu cầu (số lần gọi mỗi phút), Lỗi (tỷ lệ lỗi), và Thời lượng (độ trễ phản hồi); logic kinh doanh tạo ra dữ liệu có giá trị mà các chỉ số quan sát tiêu chuẩn này thường không nắm bắt được. Chúng tôi đã phát hiện ra rằng các chỉ số tùy chỉnh kết nối dữ liệu hiệu suất kỹ thuật với những thông tin chi tiết kinh doanh quan trọng đối với các bên liên quan. Ví dụ, việc theo dõi giá trị đơn hàng cung cấp cái nhìn tức thì về tác động doanh thu khi CloudWatch Application Signals phát hiện các vấn đề về dịch vụ.
Việc kết nối các chỉ số kinh doanh này với Application Signals mang lại cho bạn một bức tranh rõ ràng hơn về cách các vấn đề kỹ thuật ảnh hưởng đến lợi nhuận cuối cùng.
Lợi ích chính của các chỉ số tùy chỉnh trong Application Signals
Bằng cách tích hợp các chỉ số kinh doanh với dữ liệu kỹ thuật, các chỉ số tùy chỉnh mang lại cho bạn một bức tranh rõ ràng hơn về cách hiệu suất hệ thống ảnh hưởng đến lợi nhuận cuối cùng. Thay vì đoán xem vấn đề hệ thống nào quan trọng nhất, bạn sẽ thấy chính xác cách các sự cố dịch vụ ảnh hưởng đến lợi nhuận cuối cùng của mình.
Khi bạn tích hợp ngữ cảnh kinh doanh trực tiếp vào các bảng điều khiển giám sát của mình, các nhóm của bạn sẽ không còn lãng phí thời gian chuyển đổi giữa các công cụ để hiểu tác động thực tế của các vấn đề kỹ thuật. Các chỉ số tùy chỉnh cung cấp ngữ cảnh kinh doanh tức thì cùng với dữ liệu hiệu suất kỹ thuật, vì vậy khi Application Signals phát hiện sự suy giảm hiệu suất, bạn sẽ thấy khách hàng nào bị ảnh hưởng và bao nhiêu doanh thu đang gặp rủi ro.
Application Signals tạo ra một cái nhìn thống nhất bằng cách kết nối các chỉ số kinh doanh với dữ liệu hiệu suất kỹ thuật. Nhóm vận hành của bạn có thể làm việc hiệu quả hơn bằng cách xem tất cả dữ liệu liên quan ở một nơi. Thay vì chẩn đoán vấn đề một cách riêng lẻ, nhóm của bạn dành nhiều thời gian hơn để khắc phục các vấn đề ảnh hưởng trực tiếp đến doanh nghiệp của bạn.
Các chỉ số tùy chỉnh cho bạn thấy những hậu quả kinh doanh thực sự của các vấn đề kỹ thuật khi chúng xảy ra, giúp khắc phục sự cố hiệu quả hơn. Khả năng hiển thị này giúp bạn ưu tiên các bản sửa lỗi dựa trên mức độ quan trọng thực tế của doanh nghiệp chứ không chỉ dựa vào mức độ nghiêm trọng kỹ thuật. Một sự chậm trễ nhỏ trong truy vấn cơ sở dữ liệu trở nên khẩn cấp khi bạn thấy nó đang chặn các giao dịch của khách hàng có giá trị cao.
Bạn có thể theo dõi những gì ảnh hưởng trực tiếp đến doanh nghiệp của mình – doanh thu hàng giờ, điểm số hài lòng của khách hàng hoặc tỷ lệ thành công giao dịch – cùng với các chỉ số hiệu suất hệ thống. Nếu doanh số bán hàng đột ngột giảm, nó sẽ cho biết dịch vụ nào đang gây ra vấn đề và phản ứng phù hợp.
Các cân nhắc về chi phí
Khi triển khai các chỉ số tùy chỉnh trong Application Signals, chi phí của bạn phụ thuộc vào số lượng và tần suất các chỉ số bạn xuất bản, cộng với khối lượng dữ liệu dấu vết và nhật ký được tạo ra.
Hãy bắt đầu với các chỉ số kinh doanh thiết yếu và mở rộng dần. Sử dụng lấy mẫu cho các dịch vụ có khối lượng lớn để cân bằng chi phí với khả năng hiển thị – bạn không cần mọi giao dịch để phát hiện xu hướng và vấn đề.
Xem xét các chỉ số của bạn hàng quý để loại bỏ những chỉ số không sử dụng và đặt thời gian lưu giữ dữ liệu phù hợp. Hầu hết các nhu cầu khắc phục sự cố đều cần dữ liệu gần đây, vì vậy thời gian lưu giữ ngắn hơn phù hợp với các chỉ số có khối lượng lớn trong khi vẫn giữ thời gian dài hơn cho các chỉ số kinh doanh quan trọng.
Tích hợp chỉ số tùy chỉnh với Application Signals
Việc tích hợp các chỉ số kinh doanh tùy chỉnh với Application Signals rất đơn giản. Sau khi được xuất bản lên CloudWatch, chúng sẽ tự động xuất hiện cùng với dữ liệu hiệu suất kỹ thuật của bạn, tạo ra một cái nhìn duy nhất về cả tình trạng hệ thống và tác động kinh doanh.
Các hình ảnh sau đây về bản đồ dấu vết và ứng dụng cho thấy một kiến trúc phân tán gợi ý các nút thắt cổ chai tiềm năng trong tương tác dịch vụ.

Hình 1: Dữ liệu dấu vết trong CloudWatch Trace Map.
Application Map có thể hiển thị môi trường và các dịch vụ liên quan trong cùng một chế độ xem.

Hình 2: CloudWatch Application Map – Chế độ xem môi trường.

Hình 3: CloudWatch Application Map – SLI bị vi phạm – Thông tin chi tiết
Cách các chỉ số tùy chỉnh xuất hiện trong Application Signals
Trong bảng điều khiển CloudWatch, Application Signals hiển thị các chỉ số tùy chỉnh cùng với dữ liệu hiệu suất tiêu chuẩn. Khi bạn điều hướng đến một dịch vụ trong bảng điều khiển Application Signals, phần Related Metrics (Các chỉ số liên quan) hiển thị cả các chỉ số hạ tầng (CPU, bộ nhớ) và các chỉ số kinh doanh (giá trị đơn hàng, thời gian xử lý) trong một chế độ xem thống nhất.

Hình 4: Chế độ xem tất cả các dịch vụ trong Application Signals

Hình 5: Tab Related Metrics của dịch vụ đã chọn trong Application Signals
Các chỉ số tùy chỉnh xuất hiện trong bộ lọc loại chỉ số, cho phép bạn tập trung vào dữ liệu liên quan đến kinh doanh cung cấp ngữ cảnh cho các vấn đề hiệu suất kỹ thuật.

Hình 6: Bộ lọc chỉ số tùy chỉnh trong tab Related Metrics

Hình 7: Kết quả chỉ số tùy chỉnh trong tab Related Metrics

Hình 8: Biểu đồ Related Metrics với chỉ số tùy chỉnh được chọn
Hiểu kiến trúc demo: Nền tảng thương mại điện tử đa dịch vụ
Bản demo của chúng tôi sử dụng một nền tảng thương mại điện tử trải rộng trên nhiều dịch vụ tính toán của AWS, mỗi dịch vụ xuất bản các chỉ số kinh doanh tùy chỉnh lên Application Signals:
Người dùng → Amazon API Gateway → AWS Lambda (Đơn hàng) → Amazon RDS ← Amazon ECS (Kho hàng) → Amazon EKS (Thanh toán) → Amazon EC2 (Thông báo)

Hình 9: Kiến trúc nền tảng thương mại điện tử
Mỗi dịch vụ xuất bản các chỉ số tùy chỉnh cung cấp ngữ cảnh kinh doanh cùng với tính năng giám sát dịch vụ tự động của Application Signals.
Kịch bản 1: Xử lý đơn hàng Lambda – Khả năng hiển thị tác động kinh doanh
Độ trễ xử lý đơn hàng đã tăng lên 35 giây trên nền tảng thương mại điện tử của doanh nghiệp chúng tôi. Các đơn hàng trị giá 15.000-20.000 USD bị hết thời gian chờ, và các khách hàng doanh nghiệp mong đợi phản hồi dưới một giây đã gọi hỗ trợ. Các bảng điều khiển ECS của chúng tôi cho thấy các dịch vụ hoạt động bình thường, nhưng đơn hàng không được hoàn tất.
Chúng tôi đã trang bị đường ống xử lý đơn hàng để theo dõi thời gian hoàn thành đơn hàng, giá trị giao dịch, độ sâu hàng đợi và tỷ lệ thành công xử lý. Sử dụng AWS SDK, chúng tôi đã xuất bản các chỉ số này lên CloudWatch với các kích thước (dimensions) phù hợp với cấu trúc liên kết dịch vụ Application Signals của chúng tôi.

Hình 10.1: Tín hiệu ứng dụng CloudWatch – Các điểm dữ liệu chỉ số tùy chỉnh Lambda

Hình 10.2: Tín hiệu ứng dụng CloudWatch – Các chỉ số tùy chỉnh Lambda được chọn
Application Signals cho thấy dịch vụ xác thực thanh toán bị quá tải trong các giai đoạn khối lượng lớn, đặc biệt đối với các giao dịch trên 10.000 USD yêu cầu phát hiện gian lận nâng cao. Sự chậm trễ tương quan với các đơn hàng giá trị cao trong giờ cao điểm. Chúng tôi đã báo cáo cho lãnh đạo kỹ thuật và tối ưu hóa đường ống phát hiện gian lận, triển khai các hàng đợi xử lý riêng biệt cho các đơn hàng doanh nghiệp.
Kịch bản 2: Quản lý kho hàng ECS – Các chỉ số xuất sắc trong vận hành
Dịch vụ kho hàng ECS của chúng tôi xử lý khoảng 2.000 mặt hàng với thời gian xử lý trung bình 2,5 giây. Các kiểm tra sức khỏe đều đạt, nhưng chúng tôi đang mất doanh số. Giám sát container tiêu chuẩn cho thấy mọi thứ đều hoạt động bình thường.
Sau khi thêm các chỉ số kho hàng tùy chỉnh vào CloudWatch, chúng tôi phát hiện có khoảng 92.000 mặt hàng tồn kho tổng cộng nhưng chỉ có 53.000 mặt hàng có sẵn – khoảng 15% khả dụng. Gần 500 lượt đặt trước đang hoạt động đã tạo ra sự phức tạp trong việc theo dõi mà dịch vụ ECS của chúng tôi không thể xử lý hiệu quả.

Hình 11: Tín hiệu ứng dụng CloudWatch – Các chỉ số tùy chỉnh ECS
Dịch vụ kho hàng đã thực hiện 41 kiểm tra trong khi xử lý 2.000 mặt hàng. Đây không phải là vấn đề về hiệu suất – chúng tôi đơn giản là chưa cung cấp đủ dung lượng cho khối lượng kinh doanh. Khoảng 39.000 đơn vị không có sẵn có nghĩa là mất doanh số, và tồn đọng đặt trước đã ngăn cản việc ước tính giao hàng chính xác.
Sử dụng chế độ xem tích hợp này về các chỉ số kinh doanh và kỹ thuật, chúng tôi đã mở rộng dịch vụ kho hàng ECS và tái cấu trúc hệ thống quản lý đặt trước. Trong vòng một tuần, khả năng sẵn có của kho hàng đã tăng lên hơn 70% và thời gian xử lý giảm xuống dưới 1 giây mỗi mặt hàng.
Kịch bản 3: Xử lý thanh toán EKS – Giám sát giao dịch tài chính
Khách hàng đã bỏ dở các giao dịch mua 500 USD giữa chừng, phàn nàn về lỗi thanh toán và hết thời gian chờ. Số lượng yêu cầu hỗ trợ tăng vọt, nhưng giám sát EKS của chúng tôi cho thấy các pod vẫn hoạt động bình thường.
Sau khi thêm các chỉ số thành công thanh toán, chúng tôi phát hiện gần 20% giao dịch bị lỗi. Xử lý thanh toán mất trung bình 11 giây, và tỷ lệ thành công đã giảm xuống 82%. Với 500 USD mỗi giao dịch, tỷ lệ lỗi 18% đại diện cho doanh thu bị mất đáng kể.

Hình 12: Tín hiệu ứng dụng CloudWatch – Các chỉ số tùy chỉnh EKS
Thành phần phát hiện gian lận mất gần 1 giây cho mỗi lần kiểm tra, lan truyền qua nhiều bước xác thực để tạo ra tổng độ trễ 11 giây. Điểm gian lận tăng cao đã kích hoạt các kiểm tra bảo mật bổ sung, nhưng cơ sở hạ tầng thanh toán của chúng tôi không thể xử lý tải xử lý – điểm sức khỏe dịch vụ đã giảm xuống 25%.
Chúng tôi đã xác định được những khách hàng đang gặp phải sự chậm trễ thanh toán hai chữ số và tỷ lệ giao dịch thất bại 18%. Kỹ thuật đã ưu tiên tối ưu hóa đường ống phát hiện gian lận và mở rộng cơ sở hạ tầng xử lý thanh toán.
Kịch bản 4: Dịch vụ thông báo EC2 – Các chỉ số giao tiếp khách hàng
Bộ phận hỗ trợ khách hàng nhận được cuộc gọi về việc thiếu xác nhận đơn hàng. Mẫu hình này cho thấy một vấn đề giao tiếp rộng hơn so với những gì giám sát EC2 của chúng tôi tiết lộ.
Chúng tôi đã thêm các chỉ số phân phối thông báo vào CloudWatch. Application Signals cho thấy chỉ có 171 thông báo đang được xử lý mặc dù có hàng nghìn hành động của khách hàng lẽ ra phải kích hoạt email.

Hình 13: Tín hiệu ứng dụng CloudWatch – Các chỉ số tùy chỉnh EC2
Các chỉ số hàng đợi cho thấy hơn 6.000 tin nhắn bị tồn đọng. Thời gian xử lý đã đạt 185 giây mỗi thông báo – hơn 3 phút mỗi email. Các chỉ số sử dụng đĩa cho thấy các nút thắt cổ chai lưu trữ đang làm nghẽn đường ống giao tiếp.
Tỷ lệ email bị trả lại đã tăng 635%. Xác nhận đơn hàng, biên lai thanh toán và cập nhật tài khoản không đến được với khách hàng. Chúng tôi đã mở rộng dịch vụ thông báo EC2 và tối ưu hóa I/O đĩa để xóa tồn đọng.
Application Signals đã kết nối những triệu chứng rời rạc này thành một cuộc khủng hoảng rõ ràng: khách hàng không nhận được các thông tin liên lạc thiết yếu, số lượng yêu cầu hỗ trợ tăng vọt, và dịch vụ thông báo của chúng tôi đang trên bờ vực sụp đổ hoàn toàn.
Triển khai các chỉ số tùy chỉnh trong ứng dụng của bạn
Chọn các chỉ số kinh doanh phù hợp
Các chỉ số tùy chỉnh hiệu quả nhất kết nối hiệu suất kỹ thuật với kết quả kinh doanh. Các chỉ số có tác động cao bao gồm:
- Các chỉ số doanh thu: Giá trị giao dịch, tỷ lệ hoàn thành đơn hàng, tỷ lệ phần trăm thành công thanh toán
- Trải nghiệm khách hàng: Độ trễ cảm nhận của người dùng, tỷ lệ bỏ dở, thành công phân phối thông tin liên lạc
- Hiệu quả vận hành: Độ sâu hàng đợi, tỷ lệ luân chuyển hàng tồn kho, thời gian phát hiện gian lận
- Dung lượng dịch vụ: Số mặt hàng được xử lý mỗi phút, quản lý đặt trước, thông lượng thông báo
Cách các chỉ số tùy chỉnh tích hợp với Application Signals
Các chỉ số tùy chỉnh sử dụng cơ sở hạ tầng hiện có của CloudWatch để đưa vào Application Signals. Các ứng dụng của bạn xuất bản dữ liệu kinh doanh bằng cách sử dụng cùng các lệnh gọi AWS SDK xử lý các chỉ số kỹ thuật, với các không gian tên và kích thước liên quan đến kinh doanh. Application Signals tương quan chúng với cấu trúc liên kết dịch vụ để tạo ra các bảng điều khiển thống nhất hiển thị cả trạng thái kỹ thuật và tác động kinh doanh.
Gắn nhãn các chỉ số của bạn cẩn thận để đảm bảo chúng xuất hiện trong ngữ cảnh dịch vụ phù hợp. Sử dụng tên kích thước phù hợp với các quy ước khám phá dịch vụ của Application Signals. Thêm các nhãn cụ thể theo kinh doanh như premium_customer hoặc high_value_transaction để lọc theo tiêu chí kinh doanh. Bao gồm các kích thước kỹ thuật như processing_queue hoặc order_size_range để xác định vị trí vấn đề.
Để tích hợp các chỉ số tùy chỉnh với Application Signals, hãy cấu hình các thuộc tính tài nguyên OpenTelemetry cụ thể cho phép Application Signals nhận dạng và tương quan các chỉ số kinh doanh của bạn với cấu trúc liên kết dịch vụ. Các thuộc tính chính bao gồm service.name, deployment.environment, và aws.application_signals.metric_resource_keys.
Để biết chi tiết triển khai đầy đủ, các ví dụ cấu hình cụ thể theo nền tảng (EKS, ECS, Lambda, EC2) và các mẫu mã, hãy xem Custom metrics with Application Signals trong tài liệu AWS.
Theo dõi tác động kinh doanh trên các dịch vụ
Application Signals tương quan các chỉ số tùy chỉnh của bạn với các dấu vết phân tán, cho thấy tác động kinh doanh chảy qua kiến trúc dịch vụ của bạn như thế nào. Ví dụ, một sự tăng đột biến trong các lỗi đơn hàng giá trị cao có thể được theo dõi qua quá trình xử lý thanh toán, kiểm tra kho hàng và phân phối thông báo để xác định nút thắt cổ chai.
Kết luận
Khi các giá trị đơn hàng và tỷ lệ thành công giao dịch được thêm vào bảng điều khiển Application Signals, cuối cùng nó đã giải thích được sự chậm lại về mặt doanh thu bị mất. Cách tiếp cận này đã giúp nhóm ưu tiên các bản sửa lỗi dựa trên tác động kinh doanh thực tế chứ không chỉ dựa vào mức độ nghiêm trọng kỹ thuật. Ví dụ, xem sự cố dịch vụ nào đang ảnh hưởng đến các giao dịch có giá trị cao nhất, cho phép phản ứng trước tiên với các vấn đề ảnh hưởng trực tiếp đến lợi nhuận cuối cùng.
Nó đã thể hiện giá trị thực sự khi Application Signals hợp nhất tỷ lệ thành công thanh toán của chúng tôi với các chỉ số độ trễ. Đột nhiên, nó cho thấy lý do tại sao khách hàng lại bỏ dở giao dịch mua trong quá trình thanh toán. Cách tiếp cận này đã giúp chúng tôi chuyển từ việc chỉ khắc phục sự cố sang cải thiện kết quả kinh doanh.
Hãy bắt đầu bằng cách thêm các chỉ số ảnh hưởng trực tiếp đến doanh thu, chẳng hạn như giá trị đơn hàng hoặc tỷ lệ hoàn thành thanh toán, vào bảng điều khiển Application Signals của bạn.
Bắt đầu ngay hôm nay
- Bật Application Signals trong AWS Console của bạn
- Application Signals trên Lambda
- Application Signals trên EKS
- Application Signals trên ECS
- Application Signals trên EC2
- Các chỉ số tùy chỉnh với Application Signals
- Thử workshop Application Signals
Tìm hiểu thêm
Về tác giả

Jean Velez Torres
Jean Velez Torres là Kiến trúc sư Giải pháp AWS cho nhóm AGS. Anh ấy làm việc tại Puerto Rico. Anh ấy có kinh nghiệm sâu rộng trong Phát triển phần mềm, các phương pháp hay nhất về DevOps và các hệ thống ERP. Anh ấy kết hợp nền tảng kỹ thuật trong kỹ thuật phần mềm với chuyên môn kiến trúc đám mây để giúp các tổ chức xây dựng và cải thiện các giải pháp kỹ thuật số của họ.