Tác giả: Benjamin Weber,
Ngày đăng: ngày 24 tháng 4 năm 2025
Thể loại: Amazon Bedrock, Amazon Textract, Artificial Intelligence, Best Practices, Industries, Manufacturing
Giới thiệu
Việc phát triển một mỏ mới là một quá trình kéo dài. Số liệu từ S&P Global¹ cho thấy thời gian trung bình hiện nay đã kéo dài hơn 15 năm kể từ khi phát hiện đến khi đưa vào vận hành. Để đáp ứng nhu cầu tăng cao về các khoáng sản thiết yếu, ngành khai thác mỏ ngày càng nhắm đến các khu vực đã từng được khai thác hoặc thăm dò trước đây, và đánh giá lại tính khả thi của các mỏ này bằng các kỹ thuật thăm dò và khai thác mới.
Các hoạt động khai thác cũ này đi kèm với lượng hồ sơ phong phú, bao gồm báo cáo thực địa, khảo sát địa vật lý, mẫu đất và dữ liệu khoan. Dữ liệu khai thác mỏ lịch sử cung cấp một kho tàng thông tin về bản chất và khả năng thu hồi của thân quặng. Tuy nhiên, việc sàng lọc qua những bộ dữ liệu khổng lồ này theo cách truyền thống lại tiêu tốn rất nhiều tài nguyên.
Việc áp dụng công nghệ trí tuệ nhân tạo tạo sinh (generative artificial intelligence – gen AI) vào việc phân tích các hồ sơ này mang lại một cách thức mới mạnh mẽ để tận dụng thông tin giá trị mà chúng chứa đựng. Bài viết này trình bày cách sử dụng mô hình ngôn ngữ lớn (large language model – LLM) để tóm tắt hiệu quả các hồ sơ lịch sử phi cấu trúc bằng Amazon Bedrock.
Trích xuất văn bản so với ngữ cảnh
Những nỗ lực số hóa ban đầu tập trung vào việc tạo ra một bản sao kỹ thuật số của tài liệu lịch sử, nhưng điều này rất tốn thời gian vì cần phải xem xét và tóm tắt từng trang của từng tài liệu. Phần mềm nhận dạng ký tự quang học (optical character recognition – OCR) hiện đại giúp cải thiện điều đó bằng cách tăng khả năng tìm kiếm nội dung. Các dịch vụ như Amazon Textract mở rộng khả năng của OCR bằng học máy (machine learning) để xác định và trích xuất dữ liệu cụ thể từ số lượng lớn các tài liệu có cấu trúc tương tự nhau. Tuy nhiên, các hệ thống này thiếu khả năng suy luận ngữ cảnh từ văn bản mà chúng số hóa, thường phải dựa vào phân tích của máy móc sau đó hoặc đánh giá của con người để có kết quả.
Large language model là một loại mô hình trí tuệ nhân tạo tiên tiến có thể thực hiện nhiều nhiệm vụ liên quan đến ngôn ngữ. Quá trình huấn luyện một LLM bao gồm việc cho mô hình tiếp xúc với lượng lớn dữ liệu để thiết lập mối quan hệ toán học về khả năng xuất hiện của một từ sau một từ khác. LLM sử dụng kiến thức này để dự đoán hoặc tạo văn bản dựa trên một lượng đầu vào tương đối nhỏ, trong trường hợp này là các hồ sơ lịch sử.
Điều này có nghĩa là chất lượng của đầu ra được tạo ra phụ thuộc vào dữ liệu mà mô hình được huấn luyện, nhưng khối lượng dữ liệu khổng lồ được sử dụng mang lại một nền tảng cực kỳ vững chắc. Khi các mô hình bắt đầu chạm đến giới hạn trong các ứng dụng chuyên biệt, các kỹ thuật như tạo sinh tăng cường truy xuất (retrieval augmented generation) và tinh chỉnh (fine tuning) có thể được sử dụng để cải thiện chất lượng và khả năng truy vết của đầu ra mô hình.
Điều quan trọng cần nhớ là LLM đang tạo ra văn bản hoàn toàn mới và không xuất ra nguyên văn từ nguồn gốc, vì vậy có thể xảy ra hiện tượng không chính xác (hay còn gọi là ảo giác – hallucinations). Không có mối quan hệ trực tiếp giữa bản tóm tắt và nguồn, và kết quả có thể khác nhau mỗi lần mô hình được chạy, do đó văn bản được tạo bởi LLM không nên được sử dụng mà không có bước xác minh.
Sử dụng Converse API để truy vấn tài liệu
Amazon Bedrock Converse API là một giao diện thống nhất để tương tác với các mô hình generative AI dựa trên văn bản trong Amazon Bedrock. API cho phép các nhà phát triển gửi tin nhắn và nhận phản hồi bằng một định dạng thống nhất giữa các mô hình khác nhau. Tôi đã sử dụng Amazon Bedrock Converse API để tạo một Jupyter notebook nhằm phân tích báo cáo của chủ mỏ năm 1939.
Tinh chỉnh đầu ra bằng Câu lệnh (Prompts).
Câu lệnh (Prompts) là các đầu vào bạn cung cấp để tạo ra phản hồi phù hợp cho một nhiệm vụ hoặc hướng dẫn cụ thể. Càng chi tiết và cụ thể, phản hồi được tạo ra càng tốt.
Ví dụ, nếu tôi yêu cầu mô hình “Provide a summary of the document”, nó trả về:
This document is a Mine Owner’s Report filed with the Arizona Department of Mineral Resources in 1939 for the Cyrus Mine, located in Pima County, Arizona. The key details provided are:
và sau đó tiếp tục với thêm 190 từ mô tả báo cáo.
Claude, mô hình ngôn ngữ lớn được sử dụng trong ví dụ này, khá “nhiều lời” khi không được cung cấp đầu vào phù hợp. Nếu tôi cung cấp một câu lệnh (prompt) chi tiết hơn yêu cầu một bản tóm tắt ngắn gọn như “Provide a brief analysis of the document. Include the primary mineral being mined and whether mining has occurred”, nó trả về:
This document is a mine owner’s report for the Cyrus Mine located in Pima County, Arizona. The primary minerals of interest are copper, gold, silver, and molybdenum. No active mining operations are mentioned, but the owner C.P. Thomas indicates plans to run a 600-foot tunnel along the vein or sink a 40-foot shaft to the 200 level and drift 200 feet to further explore and access the mineralized contact vein between limestone and porphyry that is exposed at the surface. The mine appears to be an exploration prospect at this stage.
Đây là phản hồi tốt hơn, nhưng vẫn rất chi tiết. Để cải thiện phản hồi, tôi sử dụng một quy trình gọi là ra lệnh theo vai trò (role prompting).Tôi đặt vai trò của Claude là “a geologist for a mining company” và cung cấp cấu trúc cụ thể cho đầu ra, chẳng hạn như “Provide a brief analysis of the document. Follow the format: Name. Location. Mineralization. Total mineral recovered”, nó trả về:
Cyrus Mine. Pima County, Arizona. Mineralization: Contact vein between limestone and porphyry, containing copper, gold, silver, and molybdenum. Total mineral recovered: None mentioned, appears to be an undeveloped prospect.
Cung cấp cho mô hình nhiều hướng dẫn cụ thể hơn với các đầu vào chi tiết giúp công cụ tạo ra phản hồi có các chi tiết chính xác mà bạn đang tìm kiếm, giúp việc xem xét các tài liệu lịch sử khổng lồ trở nên nhanh chóng và dễ dàng hơn.
Tạo đầu ra có cấu trúc
Giờ đây khi chúng ta đã biết cách đặt câu hỏi đầu vào để tạo ra bản tóm tắt tài liệu hiệu quả, làm thế nào để tích hợp các đầu ra này với các hệ thống khác để phân tích thêm? Chức năng sử dụng công cụ (tool use) của Claude cho phép bạn tạo đầu ra dựa trên một định dạng mà chúng ta định nghĩa. Trong ví dụ này, chúng ta yêu cầu Claude cung cấp đầu ra ở định dạng JSON. JSON là một định dạng trao đổi dữ liệu được hỗ trợ rộng rãi, dễ đọc và dễ sử dụng. Đầu vào là:
“Provide a summary of the document and provide the output in JSON
Follow the format provided below:
file_name – filename
mine_name – mine name
summary – a single line analysis in the following format: Name, Location, Mineralization, Total mineral recovered.
location – location
first_mined – date of first mining activity. n/a if unknown
recovery – total ore recovered. 0 if unknown
primary_mineralization – primary mineral
primary_concentration – primary mineral concentration
secondary_mineralization – an array of secondary minerals identified”
Công cụ sau đó xuất ra:
{
“file_name”: “CyrusPima528.pdf”,
“mine_name”: “Cyrus Mine”,
“summary”: “Cyrus Mine. Pima County, Arizona. Contact veins between limestone and porphyry, showing gossan outcrop, garnet, limonite of iron, quartz, sulfide ores assaying 6-25% copper, 4-150 oz/ton gold, 2-20 oz silver, and up to 3% molybdenum.”,
“location”: “Pima County, Arizona”,
“first_mined”: “n/a”,
“recovery”: 0,
“primary_mineralization”: “Copper”,
“primary_concentration”: “6-25%”,
“secondary_mineralization”: [“Gold”, “Silver”, “Molybdenum”]
}
Mặc dù nó hoạt động, nhưng không được đảm bảo rằng sẽ luôn tạo ra JSON hợp lệ. Xem Forcing JSON with tool use để biết ví dụ chi tiết hơn về kỹ thuật này.
Hướng phát triển tiếp theo
Việc sử dụng Amazon Bedrock để tóm tắt hiệu quả các hồ sơ lịch sử phi cấu trúc rất hữu ích khi xem xét hàng nghìn trang tài liệu, giúp đơn giản hóa và tăng tốc quá trình tìm kiếm thông tin bạn cần. Trong tương lai, chúng ta có thể mở rộng công cụ này hơn nữa thông qua phân tích đa phương thức (multi-modal analysis) và tinh chỉnh mô hình (model fine tuning).
AI tạo sinh (Generative AI) mang lại một bước thay đổi lớn trong cách ngành khai thác mỏ có thể khai thác thông tin giá trị từ các hồ sơ lịch sử. Hãy xem ví dụ notebook trên GitHub và tìm hiểu cách bạn có thể sử dụng Amazon Bedrock ngay hôm nay.
TAGS: AWS for Industrial, Mining
Về tác giả

Benjamin Weber Ben là Kiến trúc sư giải pháp chính (Principal Solutions Architect) tại AWS, chuyên về phần mềm công nghiệp và khai thác mỏ. Với hơn hai thập kỷ kinh nghiệm về công nghệ, ông cung cấp vai trò lãnh đạo kỹ thuật để hỗ trợ hành trình đám mây của các nhà cung cấp công nghệ trong các ngành như khai thác mỏ, nông nghiệp, bán dẫn và hàng không vũ trụ.