Giới thiệu
Trong bài này chúng ta sẽ tìm hiểu về một chủ đề rất quan trọng là bảo mật trong Terraform. Ta sẽ quản lý những thông tin nhạy cảm trong Terraform như thế nào?
Khi ta dùng Terraform để quản lý và tạo hạ tầng cho môi trường production, thì đối với các resource như Database, Redis, Bastion Host, thông tin để truy cập được những thằng này là thông tin nhạy cảm và cần bảo mật. Và nếu bạn để ý thì sẽ thấy là toàn bộ những bài ta đã làm trong series này, dữ liệu của hạ tầng của ta đều được lưu trữ trong tệp tin State ở dạng văn bản thô (Plain Text). Có nghĩa là nếu ai truy cập được tệp tin State này thì đều có thể thấy được những thông tin nhạy cảm.
Nên ở bài này chúng ta sẽ học cách làm sao để bảo mật được những dữ liệu nhạy cảm đã nói ở trên. Ta sẽ tìm hiểu:
- Bảo mật logs
- Bảo mật tệp tin State
- Dynamic Secrets
- Sentinel (Policy as Code)
Bảo mật logs
Thứ đầu tiên có thể lộ thông tin bảo mật là logs, khi bạn chạy câu lệnh terraform plan
hoặc terraform apply
, những thứ in ra Terminal sẽ được lưu vào tệp tin logs ở thư mục /tmp
(linux) trong một khoảng thời gian.
Sensitive Variable
Nếu trong lúc Terraform chạy apply
mà ta có in ra những thông tin nhạy cảm thì nó sẽ bị lộ nếu ai truy cập được vào máy của bạn. Ví dụ nếu ta dùng local-exec
như sau:
resource "null_resource" "print" {
provisioner "local-exec" {
command = <<-EOF
echo "username = ${var.postgres_username}"
echo "password = ${var.postgres_password}"
EOF
}
}
Khi ta chạy câu lệnh terraform apply
thì logs nó sẽ in ra như sau:
...
null_resource.uh_oh (local-exec): username=secret-username
null_resource.uh_oh (local-exec): password=secret-password
null_resource.uh_oh: Creation complete after 0s [id=5973892021553480485]
...
Thông in bảo mật của ta sẽ lưu vào trong logs, nên khi ta sử dụng variable
trong Terraform thì những biến chứa thông tin nhạy cảm ta nên thêm một trường cho nó là sensitive
, ví dụ:
variable "postgres_username" {
type = string
sensitive = true
}
variable "postgres_password" {
type = string
sensitive = true
}
resource "null_resource" "print" {
provisioner "local-exec" {
command = <<-EOF
echo "username = ${var.postgres_username}"
echo "password = ${var.postgres_password}"
EOF
}
}
Khi ta chạy apply
thì nó sẽ được in ra Terminal như sau:
...
null_resource.uh_oh (local-exec): (output suppressed due to sensitive value in config)
null_resource.uh_oh (local-exec): (output suppressed due to sensitive value in config)
null_resource.uh_oh: Creation complete after 0s [id=5973892021553480485]
...
Sự nguy hiểm của TF_LOG=trace
Khi bạn chạy apply
với TF_LOG=trace
thì ta sẽ thấy có rất nhiều thông tin được in ra.
export TF_LOG=trace
terraform apply
Thông tin nó in ra như sau:
...
Trying to get account information via sts:GetCallerIdentity
[aws-sdk-go] DEBUG: Request sts/GetCallerIdentity Details:
---[ REQUEST POST-SIGN ]-----------------------------
POST / HTTP/1.1
Host: sts.amazonaws.com
User-Agent: aws-sdk-go/1.30.16 (go1.13.7; darwin; amd64) APN/1.0
HashiCorp/1.0 Terraform/0.12.24 (+https://www.terraform.io)
Content-Length: 43
Authorization: AWS4-HMAC-SHA256 Credential=AKIATESI2XGPMMVVB7XL/20200504/us-east-1/sts/aws4_request, SignedHeaders=content-length;content-type;host;x-amz-date, Signature=c4df301a200eb46d278ce1b6b9ead1cfbe64f045caf9934a14e9b7f8c207c3f8
Content-Type: application/x-www-form-urlencoded; charset=utf-8
...
Bạn sẽ thấy có một thông tin rất quan trọng ở phần Authorization, đây là Token được lấy từ AWS STS, thông tin này ta có thể dùng để gọi API lên AWS. Nếu bạn dùng AWS IAM với quyền Admin thì càng nguy hiểm hơn, tuy rằng Token này chỉ tồn tại trong vòng 15 phút nhưng cũng khá nguy hiểm. Nên bạn chỉ nên dùng TF_LOG=trace
khi thực sự cần debug.
Bảo mật tệp tin State
Terraform được sinh ra với mục đích là quản lý và cung cấp hạ tầng thông qua tệp tin State, nó sẽ không quan tâm những thông tin được lưu trữ trong tệp tin State có phải là thông tin nhạy cảm hay không và nó cũng không có quá nhiều tính năng để làm điều đó. Nên để bảo mật được những dữ liệu trong tệp tin State thì ta phải tìm những phương pháp khác, đây là một số cách để ta có thể bảo mật dữ liệu trong tệp tin State.
Xóa thông tin nhạy cảm khỏi Terraform
Mặc dù chúng ta không thể mã hóa thông tin bảo mật ở trong tệp tin State, nhưng ta có thể xóa bớt những thông tin được coi là nhạy cảm nhiều nhất có thể khi ta viết code cho Terraform.
Fewer secrets means you have less to lose in the event of a data breach
Cách bảo mật tốt nhất là ta càng có càng ít thông tin cần được bảo mật thì càng tốt.
Trong Terraform chỉ có 3 Configuration Blocks sau là sẽ lưu trữ thông tin trong State: resources, data, và output. Còn các Blocks khác như providers
, input variables
, local values
, … thì sẽ không được lưu trong State.
Nên đối với các giá trị mà sẽ không lưu thông tin vào trong State thì thay vì để cứng giá trị trong code. Ta nên để nó trong biến môi trường và truyền vào khi ta chạy câu lệnh apply
, ví dụ như sau, thay vì để giá trị trong code.
provider "aws" {
region = var.region
access_key = "ABCXYZ"
secret_key = "ABCXYZ"
}
Thì ta nên dùng.
provider "aws" {
region = var.region
access_key = var.access_key
secret_key = var.secret_key
}
terraform apply -var="access_key=ABCXYZ" -var="secret_key=ABCXYZ"
Nhưng với những Blocks mà lưu dữ liệu vào trong State như resources thì cho dù ta có dùng biến môi trường thì nó vẫn được lưu vào trong State, ví dụ.
resource "aws_rds_cluster" "postgres" {
cluster_identifier = "postgres"
engine = "aurora-postgresql"
engine_mode = "provisioned"
engine_version = "13.6"
database_name = "terraform"
master_username = var.username
master_password = var.password
}
Thì khi ta tạo resource này, ta kiểm tra trong State ta vẫn thấy giá trị của nó vẫn được lưu ở dạng Plain Text.
...
{
"mode": "managed",
"type": "aws_db_instance",
"name": "postgres",
"provider": "provider[\"registry.terraform.io/hashicorp/aws\"]",
"instances": [
{
"schema_version": 1,
"attributes": {
...
"nchar_character_set_name": "",
"option_group_name": "default:postgres-12",
"parameter_group_name": "custom-postgres12",
"password": "secret-password", // plain text
...
"username": "secret-username", // plain text
...
...
}
]
...
}
...
Như bạn thấy thì thông tin password
vẫn được lưu trong State và không có mã hóa gì hết, nên để bảo mật những thông tin thế này thì ta nên làm theo phương pháp tiếp theo đây.
Terraform Backend
Sử dụng biến môi trường đối với các Blocks mà không được lưu trong State, còn với các Blocks khác ta không thể ngăn chặn được việc nó được lưu vào trong State theo dạng Plain Text, thì thay vào đó ta nên sử dụng Terraform Backend để lưu State ở một chỗ có thể coi là rất bảo mật, và ta có thể cho phép ai mới được vào đó để đọc State.
Ví dụ như là ta dùng S3 Standard Backend , lúc này thì tệp tin State của ta sẽ được lưu trên AWS S3.
Và với AWS thì nó đã cung cấp cho ta sẵn một bộ phân quyền cho S3, chỉ có ai ta cho phép thì họ mới có thể vào xem được, nên lúc này thì dữ liệu của ta có được lưu ở dạng Plain Text cũng không có vấn đề lắm, vì ta kiểm soát được việc ai mới có quyền để xem.
Mã hóa (Encryption at rest)
Encryption at rest là cách để ta mã hóa dữ liệu và chuyển nó thành một dạng mà con người không thể đọc hiểu được, và chỉ có người đã mã hóa mới biết nó là gì.
Hầu hết các loại Terraform Backend đều có Encryption at Rest, ví dụ đối với S3 thì nó có cung cấp cho ta khá nhiều phương pháp để mã hóa.
Kết luận
Vậy là ta đã tìm hiểu xong những vấn đề bảo mật ta có thể gặp phải và cách khắc phục nó, những ý quan trọng là ta nên sử dụng sensitive
cho các biến bảo mật, và dữ liệu sẽ được lưu trong tệp tin State ở dạng Plain Text, do đó ta nên sử dụng Terraform Backend và ta có thể kiểm soát người nào mới có thể truy cập được tệp tin State của ta.
Nếu bài viết có gì sai hoặc cần cập nhật thì liên hệ Admin.
Tham gia nhóm chat của DevOps VN tại Telegram.
Kém tiếng Anh và cần nâng cao trình độ giao tiếp: Tại sao bạn học không hiệu quả?