Tác giả: [Kim Nguyen, Shyam Banuprakash], [John O’Donnell], và [Praveen Haranahalli]
Ngày phát hành: 15 THÁNG 4 NĂM 2025
Chuyên mục: Amazon Bedrock, Amazon OpenSearch Service, Amazon Simple Storage Service (S3), AWS Direct Connect, Best Practices, Customer Solutions
Bài viết này được đồng tác giả bởi Kim Nguyen và Shyam Banuprakash từ Clario.
Clario là nhà cung cấp hàng đầu các giải pháp dữ liệu điểm cuối cho ngành thử nghiệm lâm sàng, tạo ra bằng chứng lâm sàng chất lượng cao cho các công ty khoa học đời sống đang tìm cách mang lại các liệu pháp mới cho bệnh nhân. Kể từ khi thành lập hơn 50 năm trước, các giải pháp dữ liệu điểm cuối của Clario đã hỗ trợ các thử nghiệm lâm sàng hơn 26.000 lần với hơn 700 phê duyệt quy định tại hơn 100 quốc gia. Một trong những thách thức quan trọng mà Clario phải đối mặt khi hỗ trợ khách hàng là quy trình tạo tài liệu cho các thử nghiệm lâm sàng tốn nhiều thời gian, có thể mất hàng tuần.
Thách thức kinh doanh
Khi phân tích hình ảnh y tế là một phần của thử nghiệm lâm sàng mà nó hỗ trợ, Clario chuẩn bị một tài liệu quy trình điều lệ hình ảnh y tế (medical imaging charter) phác thảo định dạng và yêu cầu của việc xem xét trung tâm các hình ảnh thử nghiệm lâm sàng (Charter). Dựa trên Charter, đội ngũ hình ảnh của Clario tạo ra một số tài liệu tiếp theo (như trong hình sau), bao gồm đặc tả yêu cầu kinh doanh (BRS), slide đào tạo và các tài liệu phụ trợ. Nội dung của các tài liệu này phần lớn được lấy từ Charter, với yêu cầu định dạng lại và diễn đạt lại đáng kể. Quá trình này tốn thời gian, có thể gặp lỗi thủ công không chủ ý và mang nguy cơ thông tin không nhất quán hoặc dư thừa, điều này có thể làm trì hoãn hoặc ảnh hưởng tiêu cực đến thử nghiệm lâm sàng.

Đội ngũ hình ảnh của Clario nhận thấy sự cần thiết phải hiện đại hóa quy trình tạo tài liệu và hợp lý hóa các quy trình được sử dụng để tạo ra các luồng công việc tài liệu từ đầu đến cuối. Clario đã hợp tác với đội ngũ tài khoản AWS của họ và Trung tâm Sáng tạo Generative AI của AWS để khám phá cách generative AI có thể giúp hợp lý hóa quy trình.
Giải pháp
Đội ngũ AWS đã làm việc chặt chẽ với Clario để phát triển một giải pháp nguyên mẫu sử dụng các dịch vụ AI của AWS để tự động hóa quy trình tạo BRS. Giải pháp bao gồm các dịch vụ chính sau:
- Amazon Simple Storage Service (Amazon S3): Một dịch vụ lưu trữ đối tượng có khả năng mở rộng được sử dụng để lưu trữ các tài liệu BRS được tạo ra và có nguồn gốc từ charter.
- Amazon OpenSearch Serverless: Một cấu hình serverless theo yêu cầu cho Amazon OpenSearch Service được sử dụng làm vector store.
- Amazon Bedrock: Amazon Bedrock là một dịch vụ được quản lý hoàn toàn, cung cấp lựa chọn các foundation models (FMs) hiệu suất cao từ các công ty AI hàng đầu thông qua một API duy nhất, cùng với một bộ khả năng rộng lớn bạn cần để xây dựng các ứng dụng generative AI với bảo mật, quyền riêng tư và AI có trách nhiệm. Sử dụng Amazon Bedrock, bạn có thể thử nghiệm và đánh giá các FM hàng đầu cho trường hợp sử dụng của mình, tùy chỉnh chúng một cách riêng tư với dữ liệu của bạn bằng các kỹ thuật như fine-tuning và Retrieval Augmented Generation (RAG), và xây dựng các agent thực thi các tác vụ bằng cách sử dụng hệ thống và nguồn dữ liệu doanh nghiệp của bạn.
Giải pháp được thể hiện trong hình sau:

Phân tích kiến trúc
- Các tài liệu có nguồn gốc từ Charter được xử lý trong một script on-premises để chuẩn bị cho việc tải lên.
- Các tệp được gửi đến AWS bằng AWS Direct Connect.
- Script chia nhỏ (chunk) các tài liệu và gọi một mô hình embedding để tạo ra các document embeddings. Sau đó, nó lưu trữ các embeddings trong một cơ sở dữ liệu vector OpenSearch để ứng dụng của chúng tôi truy xuất. Clario sử dụng mô hình Amazon Titan Text Embeddings do Amazon Bedrock cung cấp. Mỗi chunk được gọi để tạo ra một embedding.
- Amazon OpenSearch Serverless được sử dụng làm vector store bền vững. Các document chunk embeddings được lưu trữ trong một chỉ mục vector OpenSearch, cho phép ứng dụng tìm kiếm các tài liệu có liên quan nhất về mặt ngữ nghĩa. Clario cũng lưu trữ các thuộc tính cho tài liệu nguồn và thử nghiệm liên quan để cho phép trải nghiệm tìm kiếm phong phú hơn.
- Một giao diện người dùng được xây dựng tùy chỉnh là điểm truy cập chính để người dùng truy cập hệ thống, khởi tạo các công việc tạo tài liệu và tương tác với giao diện trò chuyện. Giao diện người dùng được tích hợp với công cụ quy trình công việc (workflow engine) quản lý quá trình điều phối.
- Workflow engine gọi API Amazon Bedrock và điều phối quy trình tạo tài liệu đặc tả yêu cầu kinh doanh. Engine này:
- Sử dụng một đặc tả toàn cục lưu trữ các câu lệnh (prompts) sẽ được sử dụng làm đầu vào khi gọi mô hình ngôn ngữ lớn.
- Truy vấn OpenSearch để tìm Imaging charter có liên quan.
- Lặp qua mọi yêu cầu kinh doanh.
- Gọi mô hình ngôn ngữ lớn Claude 3.7 Sonnet từ Amazon Bedrock để tạo ra các phản hồi.
- Xuất tài liệu đặc tả yêu cầu kinh doanh ra giao diện người dùng, nơi một người viết yêu cầu kinh doanh có thể xem xét các câu trả lời để tạo ra một tài liệu cuối cùng. Clario sử dụng Claude 3.7 Sonnet từ Amazon Bedrock cho ứng dụng trả lời câu hỏi và AI đàm thoại.
- Các tài liệu cuối cùng được ghi vào Amazon S3 để được sử dụng và xuất bản bởi các luồng công việc tài liệu bổ sung sẽ được xây dựng trong tương lai.
- Một AI chat agent theo nhu cầu để cho phép khám phá dựa trên tài liệu và cho phép người dùng trò chuyện với một hoặc nhiều tài liệu.
Lợi ích và kết quả
Bằng cách sử dụng các dịch vụ AI của AWS, Clario đã hợp lý hóa đáng kể quy trình tạo BRS phức tạp. Giải pháp nguyên mẫu đã chứng minh những lợi ích sau:
- Cải thiện độ chính xác: Việc sử dụng các mô hình generative AI đã giảm thiểu nguy cơ lỗi dịch và sự không nhất quán, giảm nhu cầu làm lại và sự chậm trễ trong nghiên cứu.
- Khả năng mở rộng và linh hoạt: Kiến trúc serverless do các dịch vụ AWS cung cấp cho phép giải pháp mở rộng liền mạch khi nhu cầu tăng lên, trong khi thiết kế mô-đun cho phép tích hợp đơn giản với các hệ thống Clario khác.
- Bảo mật: Chiến lược bảo mật dữ liệu của Clario xoay quanh việc giới hạn tất cả thông tin của mình trong hệ sinh thái AWS an toàn bằng cách sử dụng các tính năng bảo mật của Amazon Bedrock. Bằng cách giữ dữ liệu bị cô lập trong cơ sở hạ tầng AWS, Clario giúp đảm bảo bảo vệ chống lại các mối đe dọa bên ngoài và truy cập trái phép. Cách tiếp cận này cho phép Clario đáp ứng các yêu cầu tuân thủ và cung cấp cho khách hàng sự tin tưởng vào tính bảo mật và toàn vẹn của dữ liệu nhạy cảm của họ.
Bài học kinh nghiệm
Việc triển khai thành công giải pháp nguyên mẫu này đã củng cố giá trị của việc sử dụng các mô hình generative AI cho các ứng dụng chuyên ngành như những ứng dụng phổ biến trong ngành khoa học đời sống. Nó cũng nhấn mạnh tầm quan trọng của việc thu hút các bên liên quan trong kinh doanh tham gia sớm vào quy trình và có một sự hiểu biết rõ ràng về giá trị kinh doanh sẽ được hiện thực hóa. Sau thành công của dự án này, Clario đang nỗ lực đưa giải pháp vào sản xuất trong hoạt động kinh doanh Hình ảnh Y tế của họ trong năm 2025 để tiếp tục cung cấp các dịch vụ tiên tiến cho khách hàng của mình nhằm đạt được dữ liệu chất lượng tốt nhất và các thử nghiệm lâm sàng thành công.
Kết luận
Sự hợp tác giữa Clario và AWS đã chứng minh tiềm năng của các dịch vụ AI và máy học (AI/ML) của AWS và các mô hình generative AI, chẳng hạn như Claude của Anthropic, để hợp lý hóa các quy trình tạo tài liệu trong ngành khoa học đời sống và, cụ thể là, cho các quy trình thử nghiệm lâm sàng phức tạp. Bằng cách sử dụng các công nghệ này, Clario đã có thể nâng cao và hợp lý hóa đáng kể quy trình tạo BRS, cải thiện độ chính xác và khả năng mở rộng. Khi Clario tiếp tục áp dụng AI/ML trên các hoạt động của mình, công ty đang ở một vị thế tốt để thúc đẩy sự đổi mới và mang lại kết quả tốt hơn cho các đối tác và bệnh nhân của mình.
Về tác giả

Kim Nguyen giữ chức vụ Giám đốc Cấp cao về Khoa học Dữ liệu tại Clario, nơi ông lãnh đạo một nhóm các nhà khoa học dữ liệu trong việc phát triển các giải pháp AI/ML sáng tạo cho ngành chăm sóc sức khỏe và thử nghiệm lâm sàng. Với hơn một thập kỷ kinh nghiệm trong quản lý và phân tích dữ liệu lâm sàng, Kim đã khẳng định mình là một chuyên gia trong việc biến đổi dữ liệu khoa học đời sống phức tạp thành những hiểu biết có thể hành động, thúc đẩy kết quả kinh doanh. Hành trình sự nghiệp của ông bao gồm các vai trò lãnh đạo tại Clario và Gilead Sciences, nơi ông liên tục đi tiên phong trong các sáng kiến tự động hóa và tiêu chuẩn hóa dữ liệu trên nhiều nhóm chức năng. Kim có bằng Thạc sĩ về Khoa học và Kỹ thuật Dữ liệu của UC San Diego và bằng Cử nhân của Đại học California, Berkeley, cung cấp cho ông nền tảng kỹ thuật để xuất sắc trong việc phát triển các mô hình dự đoán và chiến lược dựa trên dữ liệu. Sống tại San Diego, California, ông tận dụng chuyên môn của mình để thúc đẩy các phương pháp tiếp cận tư duy tiến bộ đối với khoa học dữ liệu trong lĩnh vực nghiên cứu lâm sàng.

Shyam Banuprakash giữ chức vụ Phó Chủ tịch Cấp cao về Khoa học và Phân phối Dữ liệu tại Clario, nơi ông lãnh đạo các chương trình phân tích phức tạp và phát triển các giải pháp dữ liệu sáng tạo cho lĩnh vực hình ảnh y tế. Với gần 12 năm kinh nghiệm thăng tiến tại Clario, ông đã thể hiện khả năng lãnh đạo xuất sắc trong việc ra quyết định dựa trên dữ liệu và cải tiến quy trình kinh doanh. Chuyên môn của ông vượt ra ngoài vai trò chính, khi ông đóng góp kiến thức của mình với tư cách là Thành viên Ban Cố vấn cho cả Modal và Chương trình Trải nghiệm Khách hàng của UC Irvine. Shyam có bằng Thạc sĩ Nghiên cứu Nâng cao về Khoa học và Kỹ thuật Dữ liệu của UC San Diego, được bổ sung bởi khóa đào tạo chuyên ngành từ MIT về khoa học dữ liệu và phân tích dữ liệu lớn. Sự nghiệp của ông là một minh chứng cho sự giao thoa mạnh mẽ giữa chăm sóc sức khỏe, công nghệ và khoa học dữ liệu, định vị ông là một nhà lãnh đạo tư tưởng trong việc tận dụng phân tích để chuyển đổi nghiên cứu lâm sàng và hình ảnh y tế.

John O’Donnell là một Kiến trúc sư Giải pháp Chính tại Amazon Web Services (AWS), nơi ông cung cấp sự tham gia và thiết kế ở cấp độ CIO cho các giải pháp phức tạp dựa trên đám mây trong ngành chăm sóc sức khỏe và khoa học đời sống (HCLS). Với hơn 20 năm kinh nghiệm thực tế, ông đã có một hồ sơ thành tích đã được chứng minh trong việc mang lại giá trị và sự đổi mới cho khách hàng HCLS trên toàn cầu. Với tư cách là một nhà lãnh đạo kỹ thuật đáng tin cậy, ông đã hợp tác với các nhóm AWS để đi sâu vào các thách thức của khách hàng, đề xuất các kết quả và đảm bảo các chuyển đổi đám mây có giá trị cao, có thể dự đoán và thành công. John đam mê giúp khách hàng HCLS đạt được mục tiêu của họ và đẩy nhanh các nỗ lực hiện đại hóa đám mây gốc của họ.

Praveen Haranahalli là một Kiến trúc sư Giải pháp Cấp cao tại Amazon Web Services (AWS), nơi ông cung cấp hướng dẫn chuyên môn và kiến trúc các giải pháp đám mây an toàn, có khả năng mở rộng cho các khách hàng doanh nghiệp đa dạng. Với gần hai thập kỷ kinh nghiệm CNTT, bao gồm hơn mười năm chuyên về Điện toán Đám mây, ông đã có một hồ sơ thành tích đã được chứng minh trong việc cung cấp các triển khai đám mây mang tính chuyển đổi trên nhiều ngành công nghiệp. Với tư cách là một cố vấn kỹ thuật đáng tin cậy, Praveen đã hợp tác thành công với khách hàng để triển khai các đường ống DevSecOps mạnh mẽ, thiết lập các rào cản bảo mật toàn diện và phát triển các giải pháp AI/ML sáng tạo. Praveen đam mê giải quyết các thách thức kinh doanh phức tạp thông qua các kiến trúc đám mây tiên tiến và giúp các tổ chức đạt được các chuyển đổi kỹ thuật số thành công được hỗ trợ bởi trí tuệ nhân tạo và công nghệ máy học.