Category: AWS Big Data Blog
-
Tự động điều chỉnh quy mô theo yêu cầu và theo lịch trình cho các cụm dựa trên Amazon MSK Express
Tác giả: Subham Rakshit và Rakshith RaoNgày phát hành: 22 JAN 2026Chuyên mục: Advanced (300), Amazon Managed Streaming for Apache Kafka (Amazon MSK), Technical How-to Các khối lượng công việc streaming hiện đại có tính động cao—lưu lượng truy cập biến động dựa trên thời gian trong ngày, chu kỳ kinh doanh hoặc các đợt…
-
Hợp lý hóa việc di chuyển đối tượng nhị phân lớn: Giải pháp dựa trên Kafka cho Oracle sang Amazon Aurora PostgreSQL và Amazon S3
Tác giả: Naresh Dhiman, Archana Sharma, Ron Kolwitz, và Karan LakhwaniNgày phát hành: 21 JAN 2026Chuyên mục: Advanced (300), Amazon Aurora, Amazon Managed Streaming for Apache Kafka (Amazon MSK), Amazon Simple Storage Service (S3), PostgreSQL compatible, Technical How-to Các khách hàng di chuyển từ cơ sở dữ liệu Oracle tại chỗ sang AWS phải đối…
-
Sử dụng bộ nhớ đệm kế hoạch chia sẻ cho Amazon Aurora PostgreSQL
Tác giả: Stephen Wood, Jungkook Lee, và Souvik BhattacherjeeNgày phát hành: 20 JAN 2026Chuyên mục: Advanced (300), Amazon Aurora, PostgreSQL compatible, Technical How-to Trong bài viết này, chúng tôi thảo luận về cách tính năng Shared Plan Cache của Amazon Aurora PostgreSQL-Compatible Edition có thể giảm đáng kể mức tiêu thụ bộ nhớ của các…
-
Di chuyển tại chỗ quy mô doanh nghiệp sang Apache Iceberg: Hướng dẫn triển khai
Tác giả: Mihir Borkar, Arghya Banerjee, and Amit MaindolaNgày phát hành: 20 JAN 2026Chuyên mục: Advanced (300), Amazon EMR, Analytics, AWS Glue, Technical How-to Các tổ chức quản lý khối lượng công việc phân tích quy mô lớn ngày càng đối mặt với những thách thức với các data lake truyền thống dựa trên Apache…
-
Bazaarvoice đã hiện đại hóa hạ tầng Apache Kafka của họ với Amazon MSK như thế nào
Tác giả: Oleh Khoruzhenko, Aravind Marthineni, Christian SilvaNgày phát hành: 20 JAN 2026Chuyên mục: Advanced (300), Amazon Managed Streaming for Apache Kafka (Amazon MSK), Customer Solutions Đây là bài đăng của khách mời bởi Oleh Khoruzhenko, Kỹ sư DevOps cấp cao tại Bazaarvoice, hợp tác với AWS. Bazaarvoice là một công ty có trụ sở…
-
Mở khóa kiểm soát tài nguyên chi tiết với QMR dựa trên hàng đợi trong Amazon Redshift Serverless
Tác giả: Srini Ponnada, Davide Pagano, Ashish Agrawal, và Niranjan KulkarniNgày phát hành: 15 JAN 2026Chuyên mục: Amazon Redshift, Announcements, Intermediate (200), Serverless, Technical How-to Amazon Redshift Serverless loại bỏ việc quản lý cơ sở hạ tầng và các yêu cầu mở rộng thủ công khỏi các hoạt động kho dữ liệu. Quản lý tài…
-
Sử dụng Amazon EMR DeltaStreamer để truyền dữ liệu đến nhiều bảng Apache Hudi
Tác giả: Gautam Bhaghavatula, Sucharitha Boinapally, Veera Bhargav Nunna, and Radhakant SahuNgày phát hành: 15 JAN 2026Chuyên mục: Advanced (300), Amazon Athena, Amazon EMR, Amazon Managed Streaming for Apache Kafka (Amazon MSK), Technical How-to Trong bài viết này, chúng tôi sẽ chỉ cho bạn cách triển khai thu nạp dữ liệu thời gian thực từ…
-
Truy cập dữ liệu từ Snowflake Horizon Catalog bằng liên kết danh mục trong AWS Glue Data Catalog
Tác giả: Andries Engelbrecht, Nidhi Gupta, Pratik Das, and Srividya ParthasarathyNgày phát hành: 14 JAN 2026Chuyên mục: Advanced (300), Amazon Athena, AWS Glue, AWS Lake Formation, Technical How-to Đây là bài viết của khách mời bởi Andries Engelbrecht, Principal Partner Solutions Engineer tại Snowflake, hợp tác với AWS. AWS đã công bố một tính năng…
-
AWS analytics at re:Invent 2025: Hợp nhất dữ liệu, AI và quản trị ở quy mô lớn
Tác giả: Larry WeberNgày phát hành: 07 JAN 2026Chuyên mục: Amazon EMR, Amazon Managed Workflows for Apache Airflow (Amazon MWAA), Amazon OpenSearch Service, Amazon Redshift, Amazon SageMaker Data & AI Governance, Amazon SageMaker Unified Studio, Analytics, AWS Glue, AWS Lake Formation, AWS re:Invent, Intermediate (200) re:Invent 2025 đã giới thiệu tầm nhìn táo bạo của…