AWS Storage Masterclass

Giảng viên: Solutions Architect & Cyber Security Engineer

Region Ref: US East (N. Virginia) Cập nhật: 15/04/2025

"Lựa chọn storage không chỉ là chọn chỗ chứa dữ liệu,
mà là thiết kế Performance và Cost."

1. AWS Storage Landscape Overview

Block Storage

Low latency, Boot disks, DBs

Amazon EBS

Storage cho từng EC2 instance riêng lẻ.

Tương đương: SAN (ở mức volume)

File Storage

Shared access, NFS/SMB

Amazon EFS

NFS cho Linux, Serverless scaling.

Amazon FSx

Workloads chuyên biệt (Windows, ONTAP, Lustre).

Object Storage

Scalable, Internet-accessible

Amazon S3

Chứa file qua API, không giới hạn dung lượng.

Tương đương: Cloud Storage / Data Lake

2. Bảng so sánh trọng tâm

Tiêu chí EBS EFS S3 FSx (ONTAP/Windows)
Loại Storage Block Storage File Storage (NFS) Object Storage File Storage (SMB/NFS)
Gắn vào đâu? 1 EC2 (Single AZ) Nhiều EC2 (Multi-AZ) Internet/VPC (Anywhere) Nhiều EC2/On-prem
Performance Latency cực thấp (<1ms) Độ trễ thấp, High Throughput Độ trễ trung bình, High Thrp. Tùy chỉnh cực cao
Scaling Manual / Elastic Volumes Tự động (Pay-as-you-go) Tự động, Không giới hạn Manual / Scheduled
Cost Model Provisioned (trả theo mức đặt) Usage (dùng bao nhiêu trả bấy nhiêu) Storage + Requests + Transfer Provisioned + Throughput

Amazon Elastic Block Store (EBS)

EBS là "ổ cứng" ảo gắn vào EC2. Nó hoạt động độc lập với vòng đời của instance (nếu cấu hình không delete on termination).

Volume Types chủ đạo:

  • gp3 (SSD): Mặc định cho hầu hết workloads. Hiệu năng tách biệt với dung lượng. 3,000 IOPS & 125 MB/s miễn phí.
  • io2 / io2 Block Express (SSD): Cho Database khổng lồ (SAP HANA, Oracle) cần độ trễ microsecond và IOPS cực cao.
  • st1 (HDD): Cho Throughput-intensive workloads như Big Data, Log processing.
Lưu ý: EBS Volume nằm trong 1 AZ duy nhất. Để backup hoặc chuyển AZ, bạn PHẢI dùng Snapshots (lưu trữ trên S3 ngầm).
EBS Architecture Flow
EC2 Instance
EBS Volume
Snapshot (S3)

3. Phân tích Use Cases thực tế

Web Server Fleet

Chia sẻ Code/Assets

"Tôi có 10 servers cần đọc chung 1 thư mục code."

Solution: Amazon EFS
Self-managed DB

Database on EC2

"Tôi tự cài SQL Server lên EC2 và cần độ trễ thấp nhất."

Solution: EBS gp3 / io2
Data Archive

Backup 10 năm

"Cần lưu trữ logs và record khách hàng theo luật định."

Solution: S3 Glacier Deep
Windows Migration

Shared Drive Công ty

"Chuyển Windows File Server từ on-prem lên AWS."

Solution: FSx for Windows

4. Pricing & Cost Model (Ref: US-East-1, April 2025)

Scenario: Startup App

  • 500 GB EBS (gp3) $40.00/mo
  • 100 GB S3 Standard $2.30/mo
  • Backup Snapshots ~$5.00/mo
  • Tổng cộng $47.30/mo

* EBS gp3: $0.08/GB-month. 3k IOPS free.

Scenario: Content Sharing

  • 2 TB Shared Linux (EFS) $600.00/mo
  • EFS IA (80% data) -$450.00*
  • Throughput (Bursting) $0.00
  • Tổng cộng (tối ưu) ~$150.00/mo

* EFS Standard: $0.30/GB. IA: $0.013/GB. Lifecycle là chìa khóa!

Scenario: Enterprise Data Lake

  • 50 TB S3 Standard $1,150.00/mo
  • 200 TB Glacier Deep $198.00/mo
  • Data Retrieval fees Variable
  • Tổng cộng ~$1,348.00/mo

* S3 Deep Archive chỉ $0.00099/GB. Rẻ kỷ lục cho backup.

Cost Mindset & Hidden Traps

Cái gì làm tăng tiền âm thầm?

  • EBS Snapshots: Snapshot không nén, để càng nhiều bản càng tốn.
  • S3 Requests: Lưu hàng triệu file tí hon tốn tiền Requests hơn tiền dung lượng.
  • EFS Throughput: Nếu vượt mức miễn phí, bạn phải trả tiền cho Provisioned Throughput.
  • Data Transfer Out: Lấy dữ liệu từ S3/EFS ra ngoài Internet.

Cách tiết kiệm tiền hiệu quả:

  • Dùng S3 Intelligent-Tiering ngay từ đầu.
  • Dùng gp3 thay cho gp2 (rẻ hơn 20%).
  • Bật EFS Lifecycle Management (7-day policy).
  • Dùng EBS Elastic Volumes để tăng size thay vì tạo mới.

5. Decision Framework (Quick Selector)

Chào Architect! Workload của bạn cần gì nhất?

6. Góc khuất & Những sai lầm phổ biến

"Rẻ nhất" không phải lúc nào cũng đúng

Người mới thường chọn S3 Glacier Deep Archive cho mọi thứ vì giá siêu thấp. Nhưng họ quên phí Retrieval (lấy dữ liệu ra). Nếu bạn cần lấy dữ liệu thường xuyên, S3 Standard thực tế lại rẻ hơn nhiều.

Bài học: Tính toán cả Lifecycle (Vòng đời dữ liệu) thay vì chỉ nhìn vào giá Storage/GB.

EBS Multi-attach vs EFS

AWS có tính năng EBS Multi-attach cho một số loại Volume (io1/io2). Tuy nhiên, nó đòi hỏi ứng dụng của bạn phải hỗ trợ Clustered File System để tránh data corruption.

Bài học: Nếu muốn chia sẻ file mức độ ứng dụng thông thường (Web, App), hãy luôn ưu tiên EFS. Chỉ dùng EBS Multi-attach khi bạn thực sự là chuyên gia về Storage Cluster.

7. Hướng dẫn thiết lập (Architecture Level)

EBS Setup

Create EBS Volume trong cùng AZ với EC2.
Attach Volume vào EC2 qua AWS Console/API.
SSH vào EC2, lsblk để kiểm tra.
Format ổ đĩa (mkfs) và Mount vào thư mục.
Security: Enable Encryption at rest.

EFS Setup

Create EFS File System.
Setup Mount Targets trong từng Subnet của VPC.
Mở Port 2049 (NFS) trong Security Group.
Dùng amazon-efs-utils để mount trên nhiều máy.
Scaling: Chế độ Elastic throughput mặc định.

S3 Setup

Create Bucket (Global unique name).
Configure Bucket Policy cho phép IAM Roles truy cập.
Enable Versioning để chống ghi đè/xóa nhầm.
Add Lifecycle Rules (Standard -> IA -> Glacier).
Security: Block Public Access mặc định.