Tác giả: Christopher Horvat, MD, MHA, Jason Hammett, và Qing Liu
Ngày: 24/04/2025
Danh mục: Amazon API Gateway, Amazon Athena, Amazon CloudWatch, Amazon SageMaker AI, Amazon Simple Storage Service (S3), AWS Batch, AWS Glue, AWS HealthLake, AWS Key Management Service, AWS Lake Formation, AWS Lambda, Healthcare, Industries
Giới thiệu
Mỗi năm, hàng trăm nghìn trẻ em trên khắp nước Mỹ được chăm sóc đặc biệt (critical care). Với những bệnh nhi này, tổn thương não là một rủi ro nghiêm trọng, có thể dẫn đến các biến chứng sức khỏe lâu dài. Giờ đây, Bệnh viện Nhi Pittsburgh thuộc Trung tâm Y tế Đại học Pittsburgh (UPMC Children’s Hospital of Pittsburgh – CHP) đã hợp tác với Amazon Web Services (AWS) để phát triển một giải pháp sáng tạo, có thể thay đổi cách bảo vệ các bệnh nhi dễ bị tổn thương này. Công cụ đột phá này phát hiện tổn thương não ở trẻ em trong tình trạng nguy kịch trước khi bất kỳ triệu chứng thực thể nào xuất hiện. Với vai trò là một bản bằng chứng khái niệm (Proof of Concept – PoC), giải pháp này cho thấy việc tích hợp dữ liệu hồ sơ sức khỏe điện tử (electronic health record – EHR) với công nghệ máy học (machine learning) tiên tiến có khả năng thay đổi việc chăm sóc bệnh nhân thông qua phát hiện và can thiệp sớm.
Thách thức y tế
Trẻ em trong tình trạng nguy kịch phải đối mặt với nguy cơ tổn thương não đáng kể do các yếu tố như độc tố, giảm nồng độ oxy, tăng áp lực nội sọ và các nguyên nhân khác ít được hiểu rõ. Hãy tưởng tượng khả năng phát hiện tổn thương não trước khi bất kỳ triệu chứng nào xuất hiện. Theo truyền thống, các bác sĩ lâm sàng phải dựa vào các dấu hiệu thực thể, chẳng hạn như bệnh nhân không tỉnh lại hoặc có thay đổi trong phản ứng của đồng tử. Đến khi các dấu hiệu này xuất hiện thì tổn thương có thể đã tiến triển đáng kể. Chúng tôi đang sử dụng công nghệ để giải quyết thách thức này. Thông qua việc áp dụng phân tích nâng cao và máy học, CHP và AWS đã phát triển một giải pháp có tên BRAIN AI. Giải pháp này sử dụng thuật toán trí tuệ tăng cường (augmented intelligence) được thiết kế để kết hợp dữ liệu EHR có cấu trúc với các chỉ dấu sinh học (biomarkers) mới về tổn thương não, mở đường cho các can thiệp chủ động.
Giải pháp
CHP đã hợp tác với AWS để xây dựng một pipeline dữ liệu thu nhận (ingest) dữ liệu EHR dạng bảng, sau đó sử dụng dữ liệu này để huấn luyện các mô hình AI. Đội ngũ tại CHP đã triển khai mô hình AI được huấn luyện để phân tích khám phá. Giải pháp bao gồm hai luồng công việc chính. Luồng công việc đầu tiên bao gồm việc thu thập dữ liệu, chuyển đổi dữ liệu và huấn luyện mô hình máy học.
Hình 1 – Chuyển đổi Dữ liệu và Máy học
Dưới đây là giải thích về các bước được mô tả trong Hình 1:
1. Dữ liệu hồ sơ y tế điện tử (EHR) ở định dạng Comma Separated Values (CSV) được gửi từ kho dữ liệu tại chỗ (on-premises) đến một bucket của Amazon Simple Storage Service (S3). Dữ liệu này bao gồm nhiều thông tin lâm sàng của bệnh nhân, chẳng hạn như thuốc và dấu hiệu sinh tồn. Các loại tài nguyên Fast Healthcare Interoperability Resources (FHIR) được sử dụng trong nghiên cứu này bao gồm: Patient (bệnh nhân), Observation (quan sát), Encounter (lượt khám), và Medication Administration (quản lý thuốc).
2. AWS Batch, một dịch vụ điều phối công việc, được kích hoạt khi các tệp được tải lên S3 bucket. Công việc batch bao gồm hai bước. Bước đầu tiên là thực thi mã Java do CHP cung cấp để chuyển đổi dữ liệu y tế CSV sang định dạng FHIR R4 ndjson, sau đó được lưu trữ trong một S3 bucket khác. Bước thứ hai của AWS Batch khởi động quá trình nhập dữ liệu bằng cách gọi API của AWS HealthLake.
3. Dữ liệu đã nhập có thể được truy cập thông qua các API FHIR từ AWS HealthLake, và cũng có thể được truy vấn bằng Amazon Athena với sự hỗ trợ của AWS Lake Formation và AWS Glue.
4. Với khả năng sử dụng SQL để truy vấn dữ liệu HealthLake thông qua Amazon Athena, đội ngũ khoa học dữ liệu thực hiện khám phá dữ liệu, chuẩn bị dữ liệu huấn luyện và huấn luyện các mô hình AI bằng Amazon SageMaker. Amazon SageMaker AutoML được sử dụng để tự động tìm ra mô hình và siêu tham số tối ưu nhất cho loại dự đoán này. Mô hình được chọn sau đó có thể được triển khai dưới dạng một điểm cuối (endpoint) của SageMaker để thực hiện suy luận.
Luồng công việc thứ hai là quá trình suy luận. Trong ví dụ này, suy luận có thể được thực hiện theo lô (batch) hoặc theo thời gian thực. Mục tiêu cuối cùng của giải pháp này là tích hợp trực tiếp vào hệ thống EHR để thực hiện suy luận theo thời gian thực.
Hình 2 – Luồng Công việc Suy luận, Batch và Tùy chọn Theo Thời gian Thực
Luồng xử lý – suy luận theo lô (batch inference)
1. Dữ liệu EHR được lưu trữ trên Amazon S3 để thực hiện suy luận theo lô (batch inference)..
2. Amazon SageMaker Notebooks được sử dụng để xử lý dữ liệu trên S3 cho mục đích suy luận.
3. Amazon SageMaker Notebooks chuyển dữ liệu để suy luận đến Amazon SageMaker Inference Endpoint.
4. Amazon SageMaker Inference Endpoint truy vấn AWS HealthLake để lấy thêm các đặc trưng cần thiết cho suy luận.
Luồng xử lý – Suy luận theo thời gian thực (Real Time Inference)
A. Để hỗ trợ suy luận theo thời gian thực, Amazon API Gateway và AWS Lambda được thiết lập để xử lý các yêu cầu suy luận. Các sự kiện đến, có thể là các yêu cầu FHIR, được xử lý bởi hàm Lambda, sau đó chuyển dữ liệu EHR của bệnh nhân và quan sát đến Amazon SageMaker Endpoint. Kết quả trả về được định dạng dưới dạng phản hồi FHIR gửi lại cho bên gọi.
B. Amazon SageMaker Endpoint sử dụng dữ liệu từ sự kiện đến và truy vấn dữ liệu từ AWS HealthLake để tổng hợp các đặc trưng cần thiết cho suy luận.
C. AWS HealthLake chứa dữ liệu bệnh nhân và quan sát được sử dụng cho suy luận.
Bảo mật
Tất cả các dịch vụ được sử dụng trong giải pháp này đều đủ điều kiện HIPAA (HIPAA eligible). Giải pháp này hoàn toàn có khả năng quản lý thông tin y tế được bảo vệ khi triển khai trong môi trường sản xuất. Dữ liệu được truyền an toàn từ các hệ thống tại chỗ sang AWS qua một đường hầm VPN, với mã hóa Transport Layer Security được áp dụng khi dữ liệu được ghi vào S3. Ngoài ra, AWS Key Management Service mã hóa dữ liệu tĩnh (data at rest). AWS CloudTrail và Amazon CloudWatch cung cấp khả năng giám sát toàn diện cho tất cả các lệnh gọi API và nhật ký.
Bước tiếp theo
CHP dự kiến đưa giải pháp này vào môi trường sản xuất để tinh chỉnh các mô hình AI/ML với dữ liệu thực tế. Trong ngắn hạn, giải pháp sẽ hoạt động ở chế độ theo lô dựa trên nguồn dữ liệu hàng ngày. Về lâu dài, giải pháp sẽ được tích hợp vào các hệ thống chăm sóc bệnh nhân theo thời gian thực. Điều này sẽ giúp đảm bảo tổn thương não được phát hiện nhanh hơn, cho phép các chuyên gia y tế điều trị trẻ em với độ chính xác cao hơn.
Việc triển khai thành công bản bằng chứng khái niệm (PoC) này thể hiện cách các tổ chức y tế có thể tận dụng các dịch vụ AWS để cải thiện chăm sóc bệnh nhân thông qua phân tích nâng cao và máy học. Khi CHP tiến tới triển khai sản xuất, giải pháp này có tiềm năng tạo ra tác động đáng kể đến kết quả chăm sóc đặc biệt cho trẻ em.
Hãy đọc thêm để khám phá các câu chuyện y tế khác. Để tìm hiểu thêm về AWS cho Y tế & Khoa học Đời sống — các dịch vụ AWS được tuyển chọn và các giải pháp từ Mạng lưới Đối tác AWS được sử dụng bởi hàng nghìn khách hàng y tế và khoa học đời sống trên toàn cầu — hãy truy cập các trang web AWS for Healthcare & Life Sciences và AWS Healthcare Solutions.
Về tác giả
Christopher Horvat, MD, MHA

Tiến sĩ Chris Horvat là một chuyên gia chăm sóc đặc biệt nhi khoa, nhà tin học lâm sàng (clinical informatician) và nhà đổi mới hệ thống y tế. Ông là nhà nghiên cứu hệ thống y tế học tập được tài trợ bởi NIH, với thành tích phát triển các nền tảng cải tiến chất lượng thế hệ mới, kết hợp dữ liệu thực tế, mô hình dự đoán và hiểu biết lâm sàng để mang lại những cải thiện rõ rệt trong chăm sóc bệnh nhân. Chris đang tận dụng AWS để phát triển các giải pháp gốc-FHIR (FHIR-native), có khả năng triển khai an toàn và mở rộng, tích hợp mượt mà với các quy trình làm việc lâm sàng.
Jason Hammett

Jason Hammett là một Senior Solutions Architect tại AWS, làm việc với các khách hàng thuộc khu vực công. Với hơn 25 năm kinh nghiệm trong ngành công nghệ thông tin, anh hỗ trợ khách hàng đạt được các mục tiêu công nghệ của họ. Jason đặc biệt yêu thích tự động hóa và chuyên tận dụng các khả năng của AWS Cloud để tạo ra các giải pháp hiệu quả, có khả năng mở rộng. Ngoài công việc, Jason trân trọng thời gian đi du lịch và tạo ra những kỷ niệm đáng nhớ cùng gia đình.
Qing Liu

Qing Liu là một Senior Solution Architect tại AWS. Với hơn 10 năm kinh nghiệm trong ngành công nghệ thông tin y tế, Qing đam mê sử dụng dữ liệu y tế để tạo ra những hiểu biết sâu sắc hơn và cải thiện kết quả cho bệnh nhân. Ngoài giờ làm việc, anh thích chơi tennis cùng vợ và bạn bè.