CS 지식
[리눅스 마스터 2급] RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지
ImJay
2025. 8. 9. 19:02
반응형
RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지
1. RAID란?
RAID(Redundant Array of Independent/Inexpensive Disks)는 여러 개의 물리 디스크를 하나의 논리적 장치처럼 묶어서 성능 향상, 데이터 안정성, 또는 둘 다를 달성하는 기술입니다.
2. RAID-5란 무엇인가?
- 구성: 최소 3개의 디스크 필요
- 방식: 데이터를 스트라이핑(Stripe)하여 나누고, 각 스트라이프마다 패리티(Parity) 블록을 1개씩 저장
- 장점: 읽기 속도 우수, 디스크 1개 장애에도 데이터 복구 가능
- 단점: 쓰기 성능이 다소 저하(패리티 연산), 동시에 2개 이상 장애 시 복구 불가
- 용량 계산: (전체 디스크 수 - 1) × 각 디스크 용량
3. 스페어 디스크(Hot Spare)란?
- 정의: RAID에 포함되어 있지만 평상시에는 데이터 저장에 쓰이지 않고, 고장 시 자동으로 투입되는 예비 디스크
- 역할: 장애 발생 시 즉시 리빌드(Rebuild)를 시작하여 Degraded 모드의 위험 기간을 최소화
- 차이점:
- 패리티 저장 공간: 정상 동작 시 항상 데이터와 복구 정보를 저장하는 주전 선수
- 스페어 디스크: 평상시 놀다가 고장나면 들어오는 교체 선수
4. RAID-5와 스페어 디스크가 함께 있을 때 용량 계산
문제 예시
- 10GB 디스크 8개
- 스페어 디스크 1개, 나머지로 RAID-5 구성
- 전체: 8 × 10GB = 80GB
- 스페어 제외: 8 - 1 = 7개
- RAID-5 패리티: 7 - 1 = 6개 데이터 디스크
- 실제 용량: 6 × 10GB = 60GB
✅ 정답: 60GB
5. RAID-5의 패리티 원리
- 패리티는 단순 복사본이 아닌, 같은 스트라이프 내의 데이터 블록들을 XOR 연산한 결과
- XOR 특징: A ⊕ B ⊕ B = A → 한 블록이 없어도 나머지 블록과 패리티로 복원 가능
- 각 스트라이프의 패리티 블록은 내용이 다르며, 모든 디스크에 분산 저장되어 부하가 고르게 분배됨
6. 복구 과정 (예시)
예: 디스크 4개, Disk3 장애
StripeDisk1Disk2Disk3Disk4
| 1 | D1 | D2 | D3(복구 대상) | P1(D1⊕D2⊕D3) |
| 2 | D4 | D5 | P2(복구 대상) | D6 |
복구 방법
- Stripe 1: D3 = D1 ⊕ D2 ⊕ P1
- Stripe 2: P2 = D4 ⊕ D5 ⊕ D6 (패리티 재생성)
이 과정을 각 스트라이프별로 반복하여 고장 디스크의 모든 블록을 재구성
7. Degraded 모드란?
- 디스크 1개 고장 시, RAID-5는 남은 데이터 + 패리티로 즉시 서비스를 유지
- 하지만 고장난 블록이 있을 때마다 실시간으로 패리티 연산을 수행해야 하므로 성능 저하 발생
- 이 상태에서 추가 장애가 나면 데이터 전체 손실 → Hot Spare로 즉시 복구를 시작하는 이유
8. RAID-5가 같은 데이터를 여러 번 저장하나?
- 아니요
RAID-5는 RAID-1처럼 같은 데이터를 통째로 복사하지 않습니다.
→ N개의 디스크 중 1개 분량만 패리티로 사용, 나머지는 모두 실제 데이터 저장 - 용량 효율: (N-1)/N
9. RAID 구성별 비교표
RAID 종류최소 디스크 수저장 방식장애 허용용량 효율장점단점
| RAID 0 | 2 | 스트라이핑 | 0개 | 100% | 속도 매우 빠름 | 고장 시 전체 손실 |
| RAID 1 | 2 | 미러링 | N/2개 | 50% | 안정성 높음 | 용량 효율 낮음 |
| RAID 5 | 3 | 스트라이핑+단일 패리티 | 1개 | (N-1)/N | 성능·안정성 균형 | 쓰기 느림 |
| RAID 6 | 4 | 스트라이핑+이중 패리티 | 2개 | (N-2)/N | 안정성↑ | 쓰기 더 느림 |
| RAID 10 | 4 | 미러+스트라이프 | 각 미러에서 1개 | 50% | 빠름+안정성↑ | 비용↑ |
10. 마무리
RAID-5는 용량 효율, 성능, 안정성의 균형이 좋아서 많이 쓰입니다.
하지만 복구 중에는 취약하므로 Hot Spare 구성으로 위험 기간을 최소화하는 것이 안전합니다.
또한 RAID는 백업이 아니므로, 중요한 데이터는 반드시 별도 백업 체계를 운영해야 합니다.
반응형