Quá trình khởi tạo Raid
Jan 28, 2022Hệ thống RAID là một phương tiện hiệu quả để bảo vệ dữ liệu khỏi dữ liệu được lưu trữ. Trong quá trình tạo RAID, quá trình khởi tạo hệ thống thường mất nhiều thời gian. Tại sao lại có thao tác như vậy trong quá trình khởi tạo RAID? Hoạt động này sẽ có những khía cạnh nào trên SSD? Hãy phân tích và nghiên cứu quá trình khởi tạo RAID dưới góc độ phát triển công nghệ.
Cấu trúc tổ chức cơ bản của mảng RAID truyền thống là tất cả các đĩa được thêm vào Nhóm RAID được chia thành một loạt lát cắt dựa trên địa chỉ LBA của chúng. Những lát cắt này được gọi là Đơn vị Sọc. Các đơn vị sọc tương ứng với các địa chỉ LBA giống nhau trên các đĩa khác nhau được tổ chức thành một sọc. Mã hóa tất cả dữ liệu trong một dải, chẳng hạn như RAID6 tạo ra hai khối dữ liệu được mã hóa P và Q, cho phép cả hai đĩa dữ liệu bị hỏng cùng một lúc.
Do đó, trong hệ thống RAID, tất cả dữ liệu trong dải cần đáp ứng các quy tắc mã hóa và thuật toán giải mã, nghĩa là tất cả dữ liệu trong dải có thể tạo dữ liệu mã hóa theo các quy tắc nhất định và dữ liệu mã hóa giống như dữ liệu mã hóa được lưu trữ trong dải. Tình huống này được gọi là dữ liệu trong dải đó. Khi một đĩa bị lỗi, các khối dữ liệu bị mất có thể được khôi phục bằng dữ liệu được mã hóa được lưu trữ trong dải.
Nếu dữ liệu trong một dải không nhất quán, nghĩa là kết quả mã hóa mà dữ liệu trong dải thu được không giống nhau, thì một khi đĩa bị lỗi, khối dữ liệu bị thiếu sẽ không thể được khôi phục chính xác bằng dữ liệu được mã hóa được lưu trữ trong dải. Do đó, một dải dữ liệu không nhất quán sẽ gây ra các vấn đề về tính chính xác của dữ liệu khi xảy ra lỗi.
Khi tạo hệ thống RAID, đĩa trong Nhóm RAID có thể là đĩa mới hoặc đĩa dữ liệu đã được sử dụng, trong đó tất cả dữ liệu sẽ không bằng không. Trong trường hợp này, các dải dữ liệu được tạo bằng các đĩa này không được đáp ứng nhu cầu về tính nhất quán của dữ liệu. Đó là, dữ liệu mã hóa trong mỗi băng tần được tính toán theo các quy tắc nhất định không phù hợp với dữ liệu mã hóa trong băng tần. Các dải dữ liệu không nhất quán như vậy sẽ tạo ra rủi ro lớn đối với vấn đề về tính chính xác của dữ liệu RAID.
Vì lý do này, khi tạo RAID, bạn cần quan tâm đến việc khởi tạo tất cả các dải trong hệ thống để đảm bảo tính thống nhất của dữ liệu trong các dải. Việc khởi tạo băng tần thường có thể được giải quyết theo hai cách:
1. Khởi tạo tất cả các băng tần trong hệ thống RAID bằng cách ghi tổng số không. Tất cả dải dữ liệu bằng không, dữ liệu kiểm tra của nó cũng bằng không. Do đó, dữ liệu bằng không có thể đảm bảo tính nhất quán của băng tần.
2. Kiểm tra tất cả các dải và cập nhật dữ liệu kiểm tra trong các dải để đạt được sự nhất quán của dữ liệu dải.
Khi một hệ thống RAID được khởi tạo, dữ liệu trong tất cả các dải sẽ trở nên nhất quán. Quá trình khởi tạo hệ thống RAID là một quá trình rất dài, chủ yếu là do cần phải khởi tạo tất cả các dải trong hệ thống. Sự cân bằng hiệu suất giữa IO của người dùng phía trước, do đó, quá trình khởi tạo hệ thống RAID thường là một quá trình thực thi nền, sẽ tồn tại trong một thời gian dài và ảnh hưởng đến hiệu suất của các ứng dụng phía trước.
Đối với SSD, quá trình khởi tạo hệ thống RAID cũng gây ra các vấn đề khác. Trong quá trình khởi tạo hệ thống, dữ liệu cần được ghi vào SSDS, bất kể ở chế độ cập nhật dữ liệu chẵn lẻ hay ghi bằng 0. Quá trình này dẫn đến việc mở rộng ghi dữ liệu không cần thiết. Trước khi dữ liệu người dùng được ghi, một bảng ánh xạ dữ liệu được thiết lập bên trong SSD thông qua quá trình khởi tạo. Tuổi thọ và hiệu suất của SSDS bị giảm. Do đó, một hệ thống RAID cho SSD cần phải được tối ưu hóa cho quá trình khởi tạo hệ thống, đây là điểm đặc biệt mà RAID truyền thống không tính đến. Do đó, mảng RAID truyền thống không thể được triển khai trực tiếp trên SSD, điều này ảnh hưởng đến hiệu suất và tuổi thọ của SSD.
Các hệ thống RAID sử dụng phân loại để bảo vệ dữ liệu, nhưng một loạt các vấn đề cũng được đưa ra trong quá trình phân loại bảo vệ dữ liệu. Khởi tạo hệ thống là một vấn đề điển hình của tính nhất quán của dải. Một hệ thống bảo vệ dữ liệu RAID tốt sẽ giải quyết vấn đề này trong quá trình thiết kế. Ví dụ: RAID miền dữ liệu EMC không có quy trình khởi tạo hệ thống, tất nhiên, nó cần hợp tác với hệ thống tệp và đã thực hiện rất nhiều tối ưu hóa trong phân phối dữ liệu dải RAID.