Tối ưu hóa nghiên cứu và vận chuyển cho các loại thuốc phức tạp bằng các hiểu biết sâu sắc về dữ liệu

Ngành khoa học đời sống dựa vào lượng dữ liệu khổng lồ để nhanh chóng và tự tin đánh giá các liệu pháp mới trên quy mô toàn cầu. Để đẩy nhanh nghiên cứu, các bác sĩ và nhà khoa học cần các giải pháp tối ưu hóa truy cập dữ liệu, đảm bảo tính toàn vẹn và tuân thủ quy định.

Các đội ngũ nghiên cứu và phát triển (R&D) đang tận dụng các nền tảng quản lý dữ liệu để khai thác hiệu quả hàng triệu điểm dữ liệu, đồng thời cung cấp khả năng kiểm soát phiên bản, tính bất biến và sở hữu trí tuệ.

Gần đây, AWS Marketplace đã tổ chức một hội thảo trực tuyến về cách các đội ngũ R&D hàng đầu đón nhận đổi mới để nhanh chóng thu thập thông tin nghiên cứu và cải thiện điều trị cho bệnh nhân trên toàn thế giới. Trong hội thảo này, Adam Mendez, Trưởng phòng Kỹ thuật & Kiến trúc Dữ liệu tại Resilience, đã trình bày cách tổ chức của họ sử dụng Quilt Platform với Nextflow của Seqera để tự động hóa việc cung cấp đầu ra của quy trình thế hệ tiếp theo (NGS). Bài viết này nêu bật những điểm quan trọng, bao gồm tổng quan về các ví dụ thực tế và trích đoạn từ phần hỏi đáp.

Xu hướng thay đổi trong bức tranh R&D của ngành khoa học đời sống

Bức tranh R&D trong ngành khoa học đời sống đang phát triển, được thúc đẩy bởi những hiểu biết sâu sắc từ dữ liệu giúp tăng tốc phát triển các loại thuốc phức tạp. Tuy nhiên, ngành này đang đối mặt với những thách thức lớn:

Dù đối mặt với những thách thức này, vẫn có những cơ hội tận dụng hiểu biết từ dữ liệu như đồng tiền mới:

  • Lưu trữ và quản lý tập trung dữ liệu thực tế để hợp tác hiệu quả
  • Chuyển đổi kỹ thuật số và kết nối để hỗ trợ các bên liên quan chính, cải tiến quy trình thử nghiệm lâm sàng, nâng cao hiệu quả, tăng cường sự nghiêm ngặt khoa học, và tăng cường công bằng y tế (Deloitte)
  • Tiếp nhận dữ liệu thiết bị tích hợp, ưu tiên kỹ thuật số để quản lý khối lượng dữ liệu ngày càng tăng
  • AI tạo sinh để phân tích nhanh và chính xác các tập dữ liệu khổng lồ (Stanford Medicine)

Bằng cách đón nhận những xu hướng này, các tổ chức đổi mới có thể vượt qua thách thức và thúc đẩy tương lai của R&D trong ngành khoa học đời sống.

Ví dụ thực tế

Dưới đây là một số ví dụ thực tế được trình bày trong hội thảo trực tuyến:

TriNetX giúp ngành công nghệ sinh học chống lại bệnh truyền nhiễm tốt hơn 

TriNetX hỗ trợ một công ty công nghệ sinh học lớn trong các chương trình giám sát bệnh truyền nhiễm. Công ty cần phân tích tính mùa vụ của RSV tại Mỹ trong suốt 8 năm. Thông qua AWS Data Exchange, TriNetX đã cung cấp năm tập dữ liệu trực tiếp vào môi trường Amazon Redshift của công ty, cho phép phân tích ngay lập tức. Dự án này cung cấp các tập dữ liệu lớn nhanh hơn và tiết kiệm chi phí hơn so với các cuộc khảo sát, cho phép công ty nhanh chóng thu thập và sử dụng dữ liệu để đạt kết quả nhanh chóng.

Verana giúp thu thập dữ liệu thực tế chất lượng cao

Verana Health đã giúp Boehringer Ingelheim thu thập dữ liệu chất lượng cao về nhãn khoa trong năm vùng bệnh, tích hợp liền mạch với hệ thống của họ. Quy trình được tối ưu hóa với tính bảo mật cao và tối thiểu chi phí quản lý, giúp cập nhật dữ liệu nhanh hơn và truy cập vào các tập dữ liệu đặc thù của loại bệnh cho các nghiên cứu chứng cứ thực tế. Dự án thử nghiệm này được hoàn thành trong 30 ngày.

Quilt và Nextflow tự động hóa đầu ra quy trình NGS

Resilience phải đối mặt với những thách thức với việc phân tích dữ liệu bộ gen thủ công, tốn thời gian, khó tái tạo và sử dụng các công cụ dòng lệnh. Họ đã tự động hóa quy trình xử lý dữ liệu NGS bằng Nextflow và AWS Batch, giảm thời gian từ 6 tuần xuống chỉ còn 2 ngày mỗi lần chạy. Kết quả được lưu vào gói Quilt. Giải pháp này cung cấp quy trình tự động hóa toàn diện, tài nguyên tính toán mở rộng và song song, và khả năng tái sản xuất thông qua việc sử dụng container và lưu trữ metadata.’

Hỏi và đáp

Chúng tôi đã hỏi Adam một số câu hỏi tiếp theo về bài thuyết trình của anh trong phần thảo luận Hỏi & Đáp.

Q: Đối với Resilience, tầm quan trọng của việc nhanh chóng chuyển dữ liệu đến các nhà khoa học là gì và tốc độ khoa học mang lại gì cho khách hàng của bạn?

A: Tốc độ là tất cả trong nghiên cứu, đặc biệt là đối với Resilience. Chúng tôi tập trung vào việc tăng tốc độ chuyển giao dữ liệu đến các nhà khoa học trong hai lĩnh vực chính:

  1. Phát triển phân tích quy trình (PAD): Tốc độ rất quan trọng trong việc hỗ trợ các nhà khoa học xử lý và tăng tốc kết quả cho khách hàng.
  1. Sản xuất: Vốn dĩ chậm chạp và tốn nhiều công sức, chúng tôi đặt mục tiêu giảm các nút thắt và thời gian đưa sản phẩm ra thị trường.

Q: Làm thế nào để quản lý truy cập dữ liệu trước đây và bạn đã làm gì? Việc cho phép truy cập trực tiếp vào dữ liệu đã cải thiện môi trường làm việc cho các nhóm nội bộ của bạn như thế nào?

A: Giống như nhiều công ty công nghệ sinh học khác, Resilience ban đầu dựa vào việc sao chép dữ liệu thủ công không hiệu quả. Các nhà khoa học phải sao chép dữ liệu thủ công và liên tục và điều lo lắng là việc liệu họ có phiên bản mới nhất hay không. Điều này dẫn đến sự đứt gãy trong chuỗi quản lý và khó khăn trong việc quản lý các tập dữ liệu quan trọng của khách hàng.

Q: Khi lựa chọn các giải pháp quản lý dữ liệu cho dự án này, bạn chọn sản phẩm nào và như thế nào?

A: Chúng tôi đã khám phá các giải pháp gốc AWS và của bên thứ ba. Chúng tôi chọn AWS DataSync vì nó giúp giảm tải công việc di chuyển từ các thiết bị, đảm bảo tính toàn vẹn và ngăn ngừa quá tải cho thiết bị.

Các nhà cung cấp bên thứ ba có giá cực kì đắt đỏ so với AWS.

Q: Làm thế nào để đảm bảo các nhóm có thể hiểu được nguồn gốc của kết quả phân tích Nextflow nếu một lần chạy chuỗi được xử lý nhiều lần?

A: Các tính năng phiên bản tệp của Quilt cho phép điều này thông qua việc liên kết metadata của các công việc Nextflow tham chiếu đến các bảng tính hoặc thiết bị tương tự. Việc tìm kiếm metadata hiệu quả hơn nhiều so với các nhật ký riêng lẻ hoặc kiến thức tổ chức.

Q: Ngoài công nghệ sinh học, có ngành nào khác đang khám phá giải pháp này không? Tương lai của Resilience trông như thế nào?

A: Việc chuyển tệp lên AWS và tận dụng các tính năng dịch vụ không giới hạn trong một ngành cụ thể. Mặc dù vấn đề này phổ biến hơn trong công nghệ sinh học do số lượng thiết bị cao, giải pháp này có thể áp dụng ở bất cứ đâu.

Về AWS Marketplace và các bước tiếp theo

Làm thế nào để tổ chức của bạn tìm được các đối tác giúp khai thác thông tin từ dữ liệu và chuyển đổi quy trình nghiên cứu và cung cấp dịch vụ? AWS Marketplace có các giải pháp như Quilt Data, Verana Health, và TriNetX, giúp thúc đẩy đổi mới và đáp ứng nhu cầu của các tổ chức khoa học đời sống trên toàn cầu.

AWS Marketplace là một danh mục kỹ thuật số được tuyển chọn, giúp khách hàng dễ dàng tìm kiếm, mua, triển khai và quản lý phần mềm, dịch vụ và dữ liệu từ bên thứ ba. Nó cung cấp khả năng triển khai nhanh chóng, dễ dàng và an toàn, mô hình tiêu thụ và hợp đồng linh hoạt, cùng với quy trình mua sắm và thanh toán hợp lý. Hơn 330.000 tổ chức, từ nhỏ đến lớn, sử dụng AWS Marketplace hàng tháng để thúc đẩy chuyển đổi số và cải thiện hiệu quả trên toàn bộ doanh nghiệp của họ.

Nghiên cứu từ Forrester ước tính rằng mất một nửa thời gian để tìm, mua và triển khai các giải pháp thông qua AWS Marketplace so với các kênh khác.

Hãy ghé thăm các giải pháp Khoa học đời sống trên AWS Marketplace để tìm hiểu thêm về các giải pháp có sẵn.

Xem hội thảo trực tuyến “Optimize research and delivery of complex medicines using data insights” để tìm hiểu thêm về các chủ đề được thảo luận trong bài viết này.

Bài viết được dịch từ Blog: Optimize research and delivery of complex medicines using data insights