Cách Nông nghiệp và Thực phẩm Canada xây dựng giải pháp phát hiện thay đổi độ kết hợp dựa trên đám mây với AWS

Tác giả: Rabie Almatarneh, Joy Fasnacht, và Calvin Poff
Ngày phát hành: 26 JAN 2026
Chuyên mục: Agriculture, Customer Solutions, Public Sector

Nền thương hiệu AWS với dòng chữ "Cách Nông nghiệp và Thực phẩm Canada xây dựng giải pháp phát hiện thay đổi độ kết hợp dựa trên đám mây với AWS"

Việc giám sát các hoạt động nông nghiệp trên khắp cảnh quan rộng lớn của Canada là điều cần thiết để bảo vệ sức khỏe đất và chất lượng nước. Để giải quyết thách thức này ở quy mô lớn, Nông nghiệp và Thực phẩm Canada (AAFC) đã hợp tác với Amazon Web Services (AWS) để xây dựng một giải pháp bằng chứng khái niệm (PoC) dựa trên đám mây, xử lý hình ảnh vệ tinh radar khẩu độ tổng hợp (SAR), có thể phát hiện những thay đổi trong việc sử dụng đất nông nghiệp và các phương pháp canh tác.

Với giải pháp này, nhóm nghiên cứu tại AAFC đã xây dựng dựa trên nghiên cứu khoa học được mô tả trong “Dingle Robertson et al., 2023 (Heliyon),” đã xác thực việc sử dụng các kỹ thuật phát hiện thay đổi độ kết hợp (CCD) để theo dõi các sự kiện canh tác và thu hoạch trên các cánh đồng nông nghiệp bằng cách sử dụng dữ liệu vệ tinh Sentinel-1 Single Look Complex (SLC) và RADARSAT Constellation Mission (RCM). Giải pháp—chạy trên AWS—đã đưa những phát hiện này tiến thêm một bước, cho thấy cách các kiến trúc dựa trên đám mây có thể mở rộng các quy trình làm việc khoa học thành các hệ thống vận hành hỗ trợ các mục tiêu giám sát và chính sách quốc gia.

Từ khoa học đến quy trình làm việc đám mây có khả năng mở rộng

Nghiên cứu ban đầu đã chứng minh rằng các giá trị CCD được lấy từ các cặp hình ảnh SAR có thể xác định hiệu quả các thay đổi trên bề mặt đất khi nông dân thu hoạch, canh tác hoặc xử lý hóa học một cánh đồng. Độ nhám và cấu trúc bề mặt làm thay đổi độ kết hợp của tín hiệu radar, tạo ra các mẫu có thể phát hiện được. Hình ảnh SAR của Sentinel-1 đặc biệt phù hợp với loại nghiên cứu này sử dụng dữ liệu quan sát Trái đất từ vệ tinh.

Các vệ tinh Sentinel-1 thu thập hình ảnh radar của Trái đất bằng cách chụp nhanh các bức ảnh, được gọi là bursts, trong khi quét qua các khu vực khác nhau, tương tự như việc chụp nhiều ảnh chồng lên nhau để tạo ra một bức ảnh toàn cảnh. Định dạng SLC bảo toàn thông tin tín hiệu radar hoàn chỉnh cho mỗi burst, cho phép phân tích khoa học chính xác về điều kiện mặt đất—làm cho nó lý tưởng cho các tác vụ như đo chuyển động mặt đất hoặc tạo bản đồ bề mặt chi tiết.

Bằng cách tự động hóa phân tích địa không gian dữ liệu quan sát Trái đất trên đám mây, AAFC có thể xử lý lượng lớn hình ảnh vệ tinh nhanh hơn và với chi phí thấp hơn so với trên các bộ xử lý máy tính để bàn của các nhà khoa học nghiên cứu—cho phép thu thập thông tin chi tiết cấp quốc gia về hoạt động và quy trình quản lý nông nghiệp.

Giải pháp của AAFC tập trung vào khu vực Canada xung quanh Ontario, với mục tiêu mở rộng ra toàn Canada. Trong các lần lặp lại trong tương lai, các nhà khoa học sẽ áp dụng thuật toán CCD khoa học cho nhiều trường hợp sử dụng, bao gồm giám sát các phương pháp canh tác bảo tồn, lập bản đồ dư lượng cây trồng và đánh giá các chương trình sức khỏe đất. Hình ảnh sau đây minh họa dấu chân Sentinel-1 của việc thu thập dữ liệu trên khắp Canada, và làm nổi bật khu vực cụ thể của việc thu thập dữ liệu được tự động hóa cho PoC.


Hình 1: Các khu vực quan tâm (AOI) trên khắp Canada đối với dữ liệu Sentinel-1. Vùng PoC ở Ontario được làm nổi bật

Xây dựng pipeline CCD trên AWS

AAFC và AWS đã hợp tác để thiết kế và triển khai giải pháp trong Shared Services Canada (SSC) Landing Zone Accelerator (LZA), một môi trường đám mây an toàn hơn, tuân thủ hơn được thiết kế đặc biệt cho các khối lượng công việc nghiên cứu và phát triển của liên bang. Môi trường này đáp ứng các yêu cầu về bảo mật và chủ quyền dữ liệu của Chính phủ Canada.

Giải pháp của AAFC sử dụng các ứng dụng khoa học được đóng gói trong container, tự động hóa dựa trên sự kiện và các dịch vụ tính toán được quản lý để điều phối quy trình làm việc từ việc nhập dữ liệu đến tạo sản phẩm.

Tổng quan kiến trúc

Sơ đồ kiến trúc dưới đây mô tả cách giải pháp xử lý dữ liệu vệ tinh này được tự động hóa.


Hình 2: Kiến trúc AWS của giải pháp CCD của AAFC

Ở cấp độ cao, kiến trúc bao gồm các thành phần sau:

  • AWS Lambda (Lambda) – Một hàm Lambda được sử dụng để tải xuống Sentinel-1 SLC từ Trung tâm Lưu trữ Dữ liệu Phân tán Cơ sở Vệ tinh Alaska (ASF DAAC) của NASA, nơi cung cấp khả năng phân phối dữ liệu SAR thu được từ vệ tinh và trên không nhanh chóng, đáng tin cậy. Các tệp dữ liệu vệ tinh này được tải xuống từ ASF DAAC dưới dạng tệp .zip và được lưu trữ trong một Amazon S3 incoming data bucket.
  • Amazon Simple Storage Service (Amazon S3) – Amazon S3 đóng vai trò là data lake cho hình ảnh SAR Sentinel-1 và RCM đến cũng như các kết quả đã xử lý. Amazon S3 cũng được sử dụng để cho phép người dùng tải lên các tệp cấu hình xác định khu vực và phạm vi thời gian. Khi dữ liệu mới được tải lên, sự kiện tải lên đó sẽ tự động kích hoạt quy trình xử lý.
  • Amazon DynamoDB (DynamoDB) – Một bảng NoSQL trong DynamoDB theo dõi trạng thái của các tệp dữ liệu vệ tinh đã được tải xuống và đặt vào các Amazon S3 bucket dựa trên các khu vực quan tâm (AOI) và giới hạn thời gian mà các nhiệm vụ của AAFC cần.
  • AWS Step Functions (Step Functions) – Step Functions hoạt động như một lớp điều phối, quản lý trạng thái quy trình làm việc và gọi các tác vụ được đóng gói trong container trên Amazon ECS với AWS Fargate.
  • Amazon Elastic Container Service (Amazon ECS) với AWS Fargate – Amazon ECS chạy container Docker European Space Agency Sentinel Application Platform (ESA SNAP) trong một môi trường tính toán không máy chủ, được quản lý hoàn toàn. ESA đã phát triển một loạt các hộp công cụ mã nguồn mở miễn phí để khai thác khoa học các nhiệm vụ quan sát Trái đất. SNAP là một trong những hộp công cụ này. Các hộp công cụ của ESA hỗ trợ khai thác khoa học cho các nhiệm vụ Sentinel 1, 2 và 3, các nhiệm vụ European Remote Sensing/Environmental Satellite (ERS/Envisat) và một loạt các nhiệm vụ quốc gia và bên thứ ba. SNAP đã được đóng gói trong Docker và có sẵn để sử dụng công khai. Mỗi tác vụ được đóng gói trong container xử lý một hoặc nhiều cảnh vệ tinh, tạo ra các sản phẩm độ kết hợp bằng cách sử dụng các lệnh Graph Processing Tool (GPT) của SNAP.
  • Amazon Elastic Container Registry (Amazon ECR) – Amazon ECR lưu trữ các hình ảnh container ESA SNAP.

Kiến trúc mô-đun này có nghĩa là mỗi giai đoạn xử lý được tự động hóa, có thể tái tạo, được giám sát và có khả năng mở rộng trong khi vẫn tuân thủ các yêu cầu khoa học và bảo mật của liên bang. Hình ảnh sau đây minh họa chi tiết thuật toán của Coherence Change Detection.

Cách giải pháp hoạt động


Hình 3: Chi tiết thuật toán CCD

Step Functions theo dõi từng chuyển đổi trạng thái từ tải xuống hình ảnh và ước tính độ kết hợp đến hiệu chỉnh địa hình và xuất, phản ánh các bước tương tự được mô tả trong quy trình ước tính độ kết hợp của SNAP. Khi các tác vụ hoàn thành, các sản phẩm cuối cùng được xuất bản trở lại Amazon S3 để trực quan hóa hoặc phân tích hạ nguồn. Mô hình dựa trên sự kiện này cung cấp nền tảng để mở rộng khối lượng công việc khoa học lên cấp độ xử lý quốc gia trong khi vẫn duy trì tính minh bạch và khả năng truy xuất nguồn gốc.

Với tính mô-đun và đàn hồi của hệ thống, nó có thể được chạy theo yêu cầu từ các thử nghiệm quy mô nhỏ đến phạm vi phủ sóng toàn quốc. Thời gian xử lý thay đổi từ khoảng 15 đến 30 phút cho mỗi cặp hình ảnh, với khoảng 10 quy trình đồng thời chạy cùng lúc. Điều này cho phép khả năng mở rộng từ các khu vực thử nghiệm nhỏ đến phạm vi phủ sóng cấp quốc gia chỉ trong vài giờ. Quy trình làm việc có thể được chạy theo yêu cầu cho toàn bộ mùa vụ, mang lại sự linh hoạt để điều chỉnh và tinh chỉnh các phương pháp khi cần thiết.

Xử lý một tháng phân tích độ kết hợp đầy đủ yêu cầu khoảng 2 terabyte (TB) tổng dung lượng lưu trữ trên 272 cặp cảnh. Toàn bộ quá trình tính toán được hoàn thành trong gần chính xác 12 giờ với tổng chi phí khoảng 200 USD. Sự linh hoạt này đẩy nhanh nghiên cứu, giảm thời gian thiết lập và cho phép thử nghiệm lặp lại. Trong tương lai, một quy trình thu thập và tiền xử lý dữ liệu tự động có thể liên tục nhập hình ảnh Sentinel-1, cung cấp quyền truy cập chung cho nhiều nhóm nghiên cứu làm việc trên khắp Canada. Hình ảnh sau đây minh họa dữ liệu đầu ra ví dụ của quá trình xử lý CCD trên dữ liệu Sentinel-1 gần Montreal, Canada.


Hình 4: Ví dụ về dữ liệu đầu ra của quá trình xử lý CCD trên dữ liệu Sentinel-1 gần Montreal, Canada

Lợi ích của phương pháp tiếp cận dựa trên đám mây

Bằng cách chuyển pipeline xử lý sang AWS, AAFC có thể:

  • Tự động hóa các quy trình làm việc khoa học lặp lại trên các khu vực địa lý rộng lớn mà không cần can thiệp thủ công, tạo điều kiện thuận lợi cho việc xác thực đầu ra thuật toán bởi các nhà khoa học AAFC
  • Sử dụng các ứng dụng được đóng gói trong container như ESA SNAP để đảm bảo khả năng tái tạo khoa học và kết quả nhất quán
  • Tích hợp các trình kích hoạt gần như thời gian thực bằng cách sử dụng Amazon EventBridge và Step Functions, giảm thời gian thu thập thông tin chi tiết về các thay đổi cấp độ trường
  • Chuẩn bị cho việc mở rộng quy mô để mở rộng quá trình xử lý từ Ontario ra khắp Canada

Từ PoC đến tác động quốc gia

Việc hoàn thành thành công giải pháp PoC này chứng minh cách các phương pháp tiếp cận dựa trên đám mây có thể đẩy nhanh nghiên cứu khoa học và đổi mới trong khu vực công của Canada. Bằng cách kết hợp khoa học CCD với tính đàn hồi và tự động hóa của AWS, AAFC hiện có nền tảng để mở rộng giám sát môi trường và phân tích chính sách trên các tỉnh và mùa vụ.

Các bước tiếp theo có thể bao gồm mở rộng Step Functions để tích hợp logic phát hiện canh tác tự động, cho phép phát hiện các sự kiện nông nghiệp cụ thể trực tiếp từ thay đổi độ kết hợp. Sự phát triển này sẽ mở rộng pipeline hiện có để hỗ trợ phân loại nâng cao và phân tích đa nguồn, tăng cường hơn nữa khả năng thu thập thông tin môi trường gần như thời gian thực. Amazon EventBridge sẽ được sử dụng để kích hoạt xử lý dựa trên sự kiện. Mỗi khi dữ liệu quan sát Trái đất từ vệ tinh mới được tải lên Amazon S3, Amazon EventBridge sẽ khởi tạo một quy trình làm việc của Step Functions. Quy trình làm việc này gọi một hoặc nhiều tác vụ AWS Fargate cho Amazon ECS bằng cách sử dụng mẫu tích hợp RunTask, truyền siêu dữ liệu về tập dữ liệu và các bước xử lý được yêu cầu.

Các lần lặp lại trong tương lai của giải pháp sẽ khám phá việc tích hợp thêm các nhiệm vụ SAR, mở rộng phạm vi phủ sóng toàn quốc và kết hợp học máy để tự động phân loại các hoạt động nông nghiệp.

Kết luận

Giải pháp CCD được xây dựng bởi AAFC chứng minh cách các kiến trúc đám mây hiện đại có thể biến khoa học quan sát Trái đất phức tạp thành các quy trình làm việc tự động, có khả năng mở rộng. Bằng cách kết hợp xử lý được đóng gói trong container với điều phối dựa trên sự kiện, hệ thống cho phép tạo ra các sản phẩm độ kết hợp nhanh chóng, tự động từ dữ liệu Sentinel-1 và RADARSAT, biến dữ liệu quan sát Trái đất từ vệ tinh thô thành thông tin chi tiết có thể hành động để giám sát các hoạt động nông nghiệp.

PoC này thiết lập một nền tảng có thể tái sử dụng cho các tổ chức nghiên cứu liên bang để thực hiện phân tích địa không gian quy mô lớn trên AWS. Nó hỗ trợ xử lý lặp lại và hiệu quả về chi phí, hợp lý hóa việc tích hợp các nguồn dữ liệu mới và cung cấp một lộ trình để mở rộng phạm vi phủ sóng trên khắp Canada. Với thiết kế dựa trên đám mây, giải pháp sẵn sàng giúp các nhà nghiên cứu và nhóm chính sách tạo ra thông tin chi tiết kịp thời, dựa trên bằng chứng, theo định hướng dữ liệu nhằm thúc đẩy nông nghiệp bền vững và quản lý môi trường.

Để có kinh nghiệm thực tế trong việc xây dựng loại quy trình làm việc quản lý dữ liệu tự động này, hãy thử các quy trình làm việc của Serverless Land, workshop Xử lý dữ liệu quy mô lớn với Step Functions, và workshop Serverlesspresso.

Về tác giả


Rabie Almatarneh
Rabie là kiến trúc sư giải pháp tại AWS trong lĩnh vực công cộng toàn cầu, làm việc tại Ottawa, Canada. Anh làm việc với các khách hàng chính phủ liên bang Canada, tập trung vào khoa học và nghiên cứu. Trước khi gia nhập AWS, Rabie đã có 13 năm kinh nghiệm trong lĩnh vực phát triển phần mềm và kiến trúc giải pháp.


Joy Fasnacht
Joy là kiến trúc sư giải pháp chính tại AWS, hỗ trợ các khách hàng hàng không vũ trụ và vệ tinh tại AWS, tập trung vào dữ liệu và các ứng dụng địa không gian. Trước đây, cô đã dành hơn 25 năm để phát triển phần mềm, bao gồm 12 năm làm kỹ sư chính tại Ball Aerospace.


Calvin Poff
Calvin là nhà phân tích địa tin học thuộc nhóm Quan sát Trái đất của Nông nghiệp và Thực phẩm Canada. Anh phát triển các mô hình cho các ứng dụng nông nghiệp và môi trường bằng cách sử dụng viễn thám, dữ liệu môi trường và các tập dữ liệu công cộng lớn.

Leave a comment