Tác giả: Mike Lally, Ari Entin, Dashiell Flynn, và Keely O’Neill
Ngày phát hành: 22 JAN 2026
Chuyên mục: Amazon DocumentDB, Amazon Elastic Kubernetes Service, Amazon Managed Service for Apache Flink, Amazon Simple Storage Service (S3), Analytics, AWS Cloud WAN, AWS Direct Connect, Broadcast, Compute, Data Science & Analytics for Media, Database, Industries, Media & Entertainment, Networking & Content Delivery, Sports, Storage
Các số liệu thống kê bóng rổ truyền thống ghi lại những gì đã xảy ra—điểm số, số lần bật lại, số lần kiến tạo—nhưng lại bỏ qua ngữ cảnh quyết định kết quả trận đấu. Một cú ném trượt thu hút ba hậu vệ và tạo ra một cú ném ba điểm trống trải ở góc sân không tạo ra điểm nào cho người chuyền bóng trong bảng thống kê, nhưng lại thay đổi cơ bản xác suất thắng. Một pha bật lại vẫn là một pha bật lại trong bảng thống kê, cho dù đó là một pha bắt bóng thông thường trong thời gian rác hay một pha bật lại phòng thủ quyết định trận đấu khi chỉ còn vài giây.
“Các số liệu thống kê truyền thống ghi lại kết quả,” Noah Thro, Kỹ sư phần mềm của NBA Stats Technology, giải thích. “Điều làm cho Leverage Score trở nên độc đáo là nó ghi lại lý do tại sao những kết quả đó xảy ra và ai đã tạo ra chúng.”
NBA và Amazon Web Services (AWS) đã phát triển Leverage Score—chỉ số mới nhất từ Inside the Game được hỗ trợ bởi AWS—để đo lường những cầu thủ và pha sở hữu bóng nào thúc đẩy kết quả trận đấu bóng rổ. Hệ thống được hỗ trợ bởi AI này sử dụng mô hình phản thực tế (counterfactual modeling) để phân tích các kịch bản thay thế cho mỗi pha sở hữu bóng, phân bổ công lao cho tất cả mười cầu thủ trên sân trong vòng vài giây sau khi mỗi pha sở hữu bóng kết thúc.

Hình 1: Người hâm mộ NBA theo dõi cú ném quyết định.
Tại sao Leverage Score quan trọng đối với người hâm mộ
Nguyên tắc chính của Leverage Score là không phải tất cả các pha bóng đều có giá trị như nhau. “Bạn có thể có một cầu thủ mà bạn biết là một người bật lại tuyệt vời nhưng lại không xuất hiện trong bảng thống kê,” Thro lưu ý. “Bạn có thể sắp xếp theo leverage bật lại và tìm thấy cầu thủ đang giành được những pha bật lại quan trọng và kết thúc trận đấu cho đội của mình.” Hệ thống hoạt động trên thang điểm từ -10 đến +10, với các giá trị tích lũy trong suốt trận đấu để xác định những cầu thủ nào đã tạo ra những khoảnh khắc có leverage cao nhất.
“Khả năng nói vào giờ nghỉ giữa hiệp, ‘Thunder đang dẫn trước 10 điểm, và cầu thủ này đang tạo ra động lực vì anh ấy đã thực hiện một vài cú ném quyết định’—chúng tôi chưa bao giờ có thể định lượng điều đó,” Thro giải thích. Bởi vì mỗi giá trị gắn liền với một sự kiện play-by-play cụ thể, hệ thống có thể làm nổi bật những khoảnh khắc có leverage cao nhất như những điểm nhấn tự nhiên. “Tất cả chúng ta đều đã thấy những cú ném thắng trận,” Ian McKiernan, Giám đốc sản phẩm cấp cao của NBA Stats Platform & Operations, nói. “Nhưng việc giành được pha bật lại phòng thủ khi một pha bật lại tấn công mang lại cho đội đối phương cơ hội ghi điểm—leverage được tạo ra trong pha boxout đó.”
Tổng quan kiến trúc
Việc đo lường leverage và thêm phân bổ công lao đòi hỏi nhiều hơn một mô hình—nó đòi hỏi một hệ sinh thái các hệ thống AI được phối hợp theo thời gian thực. Hệ thống chạy trên Amazon Elastic Kubernetes Service (Amazon EKS) với Amazon Managed Service for Apache Flink xử lý khoảng 2.500 sự kiện mỗi giây trong thời gian tải cao nhất trên hơn 10 trận đấu đồng thời.
Kiến trúc sử dụng:
- EKS clusters với tính năng tự động điều chỉnh quy mô (hơn 3–15 bản sao tùy theo tải trận đấu)
- Apache Flink để xử lý luồng với độ song song 8 và khoảng thời gian checkpoint 30 giây
- Amazon Simple Storage Service (Amazon S3) để lưu trữ các tạo phẩm mô hình và dữ liệu lịch sử
- Amazon DocumentDB (with MongoDB compatibility) để lưu trữ siêu dữ liệu và kết quả cấp độ sở hữu bóng
- AWS Direct Connect và AWS Cloud WAN để kết nối độ trễ thấp đến các sân vận động NBA
- Virtual private cloud (VPC) endpoints để giao tiếp dịch vụ-tới-dịch vụ an toàn
Hệ thống đạt được thông lượng dữ liệu tổng hợp 15 MB mỗi giây với độ trễ hiện tại là 10–12 giây cho các tính toán Shot Difficulty, với việc tối ưu hóa liên tục nhằm mục tiêu thời gian phản hồi dưới một giây.
Sơ đồ sau minh họa kiến trúc giải pháp.

Hình 2: Sơ đồ kiến trúc thống kê NBA.
Quy trình xử lý thời gian thực
Amazon EKS điều phối quy trình xử lý cốt lõi, chạy các microservice được container hóa để thu thập, chuyển đổi và phân tích dữ liệu theo dõi NBA theo thời gian thực. Mỗi pha sở hữu bóng tạo ra nhiều luồng sự kiện, chẳng hạn như vị trí cầu thủ, vị trí bóng, các cú ném và các chỉ số áp lực phòng thủ, phải được kết hợp và xử lý trong vòng vài giây.
Apache Flink xử lý luồng sự kiện theo thời gian, kết hợp các tính toán Shot Difficulty với các chỉ số áp lực phòng thủ và ngữ cảnh chuyền bóng. Ứng dụng Flink sử dụng ngữ nghĩa thời gian sự kiện để cung cấp thứ tự chính xác ngay cả khi các sự kiện đến không theo thứ tự do độ trễ mạng từ các hệ thống sân vận động.
Quy trình xử lý ba luồng dữ liệu chính:
- Dữ liệu theo dõi – Vị trí cầu thủ và bóng ở tốc độ 25 khung hình mỗi giây
- Dữ liệu sự kiện – Các cú ném, mất bóng, bật lại và các hành động riêng lẻ khác
- Các chỉ số theo ngữ cảnh – Shot Difficulty (xFG%), áp lực phòng thủ và chuỗi chuyền bóng
Khả năng xử lý song song của Flink cho phép hệ thống chạy suy luận phản thực tế cho 3–5 kịch bản thay thế mỗi pha sở hữu bóng trong khi vẫn duy trì hiệu suất thời gian thực. Ứng dụng sử dụng các phiên bản Amazon Elastic Compute Cloud (Amazon EC2) tự động điều chỉnh quy mô dựa trên số lượng trận đấu đang hoạt động.
Mô hình xác suất thắng và các kịch bản phản thực tế
Leverage Score khác biệt so với các chỉ số xác suất thắng truyền thống bằng các kịch bản phản thực tế. Khi một cầu thủ thực hiện một cú ném làm tăng xác suất thắng của đội từ 50% lên 60%, hầu hết các hệ thống sẽ ghi nhận 10 điểm phần trăm công lao. Leverage Score chạy một phép tính khác. “Chúng tôi không nhìn từ đầu đến cuối pha sở hữu bóng,” McKiernan giải thích. “Chúng tôi nhìn từ hành động đã xảy ra đến tình huống phản thực tế của hành động đó. Vì vậy, nếu một cú ném được thực hiện và xác suất chuyển sang 60%, nhưng nếu cú ném đó trượt thì xác suất sẽ là 48% vì đội đối phương hiện đang có bóng—chúng tôi đang đo lường khoảng cách đó.”
Thách thức kỹ thuật là tạo ra các tình huống phản thực tế này đủ nhanh để sử dụng gần thời gian thực. Đối với mỗi sự kiện có ý nghĩa, hệ thống phải chấm điểm nhiều phiên bản của trạng thái trận đấu, đánh giá các lựa chọn thay thế thực tế tôn trọng logic bóng rổ và so sánh các quỹ đạo—tất cả trong khi trận đấu vẫn tiếp diễn. “Chúng tôi phải chạy suy luận nhiều lần cho bất kỳ pha bóng nào và đưa ra câu trả lời,” Thro lưu ý. “Tốc độ suy luận, độ tin cậy và tốc độ mạng giữa các hệ thống đó giao tiếp với nhau trong Amazon EKS là cực kỳ quan trọng.”
Cốt lõi của Leverage Score là một mô hình Light Gradient Boosting Machine (LightGBM) được huấn luyện trên dữ liệu NBA của ba mùa giải—khoảng 3.700 trận đấu và 500.000 pha sở hữu bóng. Mô hình dự đoán xác suất thắng dựa trên bảy tính năng kỹ thuật chính bao gồm chênh lệch điểm, thời gian còn lại, số lần sở hữu bóng và khả năng sử dụng timeout. Đối với mỗi pha sở hữu bóng, hệ thống chạy suy luận hàng loạt song song trong Flink để tạo ra các kịch bản phản thực tế: Điều gì sẽ xảy ra nếu cú ném trượt? Điều gì sẽ xảy ra nếu pha bật lại tấn công không xảy ra? Điều gì sẽ xảy ra nếu pha mất bóng được tránh? Mỗi kịch bản tạo ra một delta xác suất thắng định lượng tác động của pha sở hữu bóng.
Kiến trúc mô hình tách biệt dự đoán xác suất thắng khỏi phân bổ công lao, cho phép hệ thống đánh giá các kết quả thay thế mà không cần huấn luyện lại.
Ví dụ, khi một cầu thủ thực hiện một cú ném ba điểm bị tranh chấp, hệ thống tính toán:
- Kết quả thực tế – Xác suất thắng tăng 4.2%
- Tình huống phản thực tế (trượt) – Xác suất thắng sẽ giảm 1.8%
- Leverage ròng – Hơn 6.0 điểm được phân bổ giữa tất cả 10 cầu thủ, với phần lớn cho người ném và người tạo cơ hội ném
Cách tiếp cận này nắm bắt tác động vượt ra ngoài các số liệu thống kê truyền thống. Một pha phòng thủ thành công ngăn chặn một cú ném có xác suất cao tạo ra leverage tích cực mặc dù nó không tạo ra bất kỳ số liệu thống kê nào. Một pha bật lại tấn công kéo dài thời gian sở hữu bóng nhận được công lao tương ứng với giá trị kỳ vọng của pha sở hữu bóng bổ sung.
Phân bổ công lao với tích hợp Shot Difficulty
“Điều đã mở khóa Leverage Score cho chúng tôi là các chỉ số Inside the Game khác,” Thro giải thích. “Tỷ lệ ném thành công kỳ vọng nằm ở cốt lõi vì nó cho phép chúng tôi định lượng giá trị của cú ném và phân bổ nó cho người tạo cơ hội so với người ném.” Tỷ lệ ném thành công kỳ vọng (xFG%), một chỉ số khác từ Inside the Game, đo lường độ khó của cú ném bằng cách phân tích khoảng cách hậu vệ, vị trí ném và kỹ năng của người ném.
Và quan trọng là, tất cả năm cầu thủ của mỗi đội đều nhận được một phần công lao. Việc phân bổ công lao cho mười cầu thủ đòi hỏi phải tích hợp nhiều tín hiệu ngữ cảnh. Leverage Score sử dụng xFG% để phân bổ công lao một cách thông minh giữa người tạo cơ hội ném và người kết thúc pha bóng. Khi một cầu thủ thực hiện một cú ném khó (xFG% thấp), người ném nhận được phân bổ công lao cao hơn. Khi một cầu thủ thực hiện một cú ném trống trải (xFG% cao), hệ thống truy ngược lại chuỗi chuyền bóng để ghi nhận công lao cho cầu thủ đã tạo ra cơ hội.
Thuật toán phân bổ tính đến:
- Leverage tạo cơ hội – Tạo ra các cơ hội ném bóng chất lượng cao thông qua chuyền bóng, yểm trợ hoặc thu hút sự chú ý của hàng phòng ngự
- Leverage phòng thủ trực tiếp – Cản phá cú ném, buộc đối thủ mất bóng hoặc ngăn chặn các cú ném có tỷ lệ thành công cao
- Leverage bật lại – Giành được các pha bật lại tấn công để kéo dài thời gian sở hữu bóng hoặc các pha bật lại phòng thủ để kết thúc lượt tấn công của đối thủ
- Leverage mất bóng – Bảo vệ bóng khi tấn công hoặc buộc đối thủ mất bóng khi phòng thủ
Hệ thống xử lý các tính toán này trong quy trình Flink, kết hợp kết quả Shot Difficulty với dữ liệu kết quả sở hữu bóng để tạo ra Leverage Score cuối cùng. Việc tích hợp này đòi hỏi việc phân chia cửa sổ thời gian sự kiện cẩn thận để đảm bảo các tính toán Shot Difficulty được hoàn thành trước khi phân bổ công lao bắt đầu. Từ góc độ kỹ thuật, phần khó nhất không phải là bất kỳ mô hình đơn lẻ nào—mà là làm cho nhiều hệ thống phức tạp giao tiếp với nhau dưới những ràng buộc độ trễ nghiêm ngặt.
Triển khai và mở rộng quy mô sản xuất
Hệ thống sản xuất sử dụng các mẫu triển khai blue-green được quản lý thông qua theo dõi thử nghiệm MLflow trên Databricks trên AWS. Các phiên bản mô hình mới trải qua thử nghiệm chế độ bóng (shadow mode), nơi chúng chạy song song với các mô hình sản xuất, tạo ra các dự đoán được ghi lại nhưng không được công bố. Cách tiếp cận này cho phép xác thực dựa trên dữ liệu trận đấu trực tiếp trước khi chuyển đổi.
Amazon EKS tự động điều chỉnh quy mô phản ứng với lịch thi đấu, mở rộng các cluster 30 phút trước khi trận đấu bắt đầu và thu nhỏ trong giờ thấp điểm. Hệ thống duy trì dung lượng tối thiểu cho môi trường phát triển và thử nghiệm trong khi hỗ trợ dung lượng tăng đột biến cho các đêm thi đấu có khối lượng lớn (hơn 10 trận đấu đồng thời).
Tối ưu hóa độ trễ tập trung vào ba lĩnh vực:
- Suy luận song song – Chạy các kịch bản phản thực tế đồng thời thay vì tuần tự
- Tối ưu hóa mô hình – Giảm độ sâu cây LightGBM trong khi vẫn duy trì độ chính xác
- Điều chỉnh xử lý luồng – Điều chỉnh khoảng thời gian checkpoint và độ song song của Flink để cân bằng thông lượng và độ trễ
Công việc đang tiếp diễn bao gồm lượng tử hóa mô hình, tối ưu hóa suy luận trên các phiên bản hỗ trợ GPU và các thay đổi kiến trúc để cho phép thực thi suy đoán trước khi kết quả Shot Difficulty đến. Để đẩy nhanh công việc đó, nhóm sử dụng Amazon Bedrock để hỗ trợ AI tạo sinh đề xuất mã cho các đường ống dữ liệu, tạo boilerplate cho các thử nghiệm hoặc soạn thảo tài liệu mà con người sau đó xem xét và tinh chỉnh.
Mẫu có thể tái sử dụng để phân tích tác động
Bề ngoài, Leverage Score là một con số gắn liền với các pha sở hữu bóng và được tổng hợp cho các cầu thủ. Trên thực tế, nó đại diện cho một khuôn mẫu cho một thế hệ phân tích thể thao mới. Kiến trúc Leverage Score đại diện cho một khuôn mẫu có thể tái sử dụng để phân tích tác động thời gian thực ngoài thể thao. Mẫu cốt lõi—thu thập dữ liệu luồng, suy luận phản thực tế song song và phân bổ công lao đa thực thể—áp dụng cho bất kỳ lĩnh vực nào yêu cầu phân tích kịch bản nhanh chóng để xác định những hành động cụ thể nào thúc đẩy kết quả. Ví dụ, kiểm soát chất lượng sản xuất có thể sử dụng kiến trúc tương tự để phân bổ các lỗi trên các giai đoạn của dây chuyền sản xuất. Tối ưu hóa chuỗi cung ứng có thể phân bổ công lao cho việc giao hàng đúng hạn giữa các đối tác logistics. Các hoạt động dịch vụ khách hàng có thể đo lường những can thiệp nào giải quyết vấn đề hiệu quả nhất.
Hợp tác với AWS, NBA có thể tập trung vào chuyên môn bóng rổ—xác định ý nghĩa của leverage, quyết định các quy tắc phân bổ công lao, quyết định đầu ra mô hình nào quan trọng—trong khi dựa vào cơ sở hạ tầng đám mây đã được chứng minh về quy mô, độ tin cậy và sự phối hợp trong tích tắc giúp suy luận phản thực tế thời gian thực trở nên khả thi. Đối với NBA, Leverage Score đại diện cho biểu hiện đầu tiên của cách tiếp cận này. Nó kết hợp nhiều năm kiến thức bóng rổ với các hệ thống AI để mang lại một loại chỉ số tác động mới và một câu trả lời rõ ràng hơn, dựa trên dữ liệu cho một câu hỏi vượt thời gian. Như Thro đã nói: “Ai thực sự đã thay đổi trận đấu?”
Liên hệ với Đại diện AWS để tìm hiểu cách chúng tôi có thể giúp tăng tốc doanh nghiệp của bạn.
Đọc thêm
- NBA và AWS hợp tác để mang đến số liệu thống kê được hỗ trợ bởi AI cho người hâm mộ bóng rổ
- NBA trên AWS
- Hawk-Eye Innovations cung cấp dữ liệu thể thao thời gian thực với Flink và Amazon MSK
Về tác giả

Mike Lally
Mike là Kiến trúc sư Giải pháp Cấp cao, Thể thao tại AWS, tập trung giúp khách hàng của mình đạt được những kết quả tuyệt vời.

Ari Entin
Ari Entin là Trưởng phòng Marketing Thể thao & Giải trí tại AWS, có trụ sở tại Thung lũng Silicon. Ông gia nhập Amazon vào năm 2021 từ Facebook, nơi ông lãnh đạo truyền thông và marketing AI. Ông đã thúc đẩy các chiến dịch truyền thông tích hợp cho các công ty điện tử tiêu dùng, thể thao và giải trí, và công nghệ hàng đầu trong nhiều thập kỷ.

Dashiell Flynn
Dashiell Flynn là Chiến lược gia Học máy với hơn 20 năm kinh nghiệm trong lĩnh vực trí tuệ nhân tạo (AI), học máy (ML) và phân tích định lượng. Ông làm việc với khách hàng để chuyển đổi mục tiêu kinh doanh của họ thành các trường hợp sử dụng ML có thể hành động; sau đó hợp tác với các Nhóm Khoa học Dữ liệu để phát triển các mô hình liên quan và hiện thực hóa kết quả kinh doanh. Dashiell có bằng Cử nhân Kinh tế từ Vassar College và bằng Thạc sĩ Quản lý Công về Phát triển Quốc tế từ Harvard Kennedy School.

Keely O’Neill
Keely O’Neill là Giám đốc Marketing Tích hợp Cấp cao cho Marketing Thể thao tại Amazon Web Services (AWS), nơi cô dẫn dắt marketing tích hợp cho các mối quan hệ đối tác với Formula 1, Ferrari và Bundesliga. Với hơn mười hai năm kinh nghiệm trong marketing trải nghiệm, gắn kết cộng đồng và marketing kỹ thuật số, Keely mang đến chuyên môn độc đáo trong việc tạo ra trải nghiệm khách hàng có tác động thông qua các chiến dịch chiến lược được thúc đẩy bởi sự tò mò và hiểu biết dữ liệu.