CS 지식

[리눅스 마스터 2급] RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지

ImJay 2025. 8. 9. 19:02
반응형

RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지

1. RAID란?

RAID(Redundant Array of Independent/Inexpensive Disks)는 여러 개의 물리 디스크를 하나의 논리적 장치처럼 묶어서 성능 향상, 데이터 안정성, 또는 둘 다를 달성하는 기술입니다.


2. RAID-5란 무엇인가?

  • 구성: 최소 3개의 디스크 필요
  • 방식: 데이터를 스트라이핑(Stripe)하여 나누고, 각 스트라이프마다 패리티(Parity) 블록을 1개씩 저장
  • 장점: 읽기 속도 우수, 디스크 1개 장애에도 데이터 복구 가능
  • 단점: 쓰기 성능이 다소 저하(패리티 연산), 동시에 2개 이상 장애 시 복구 불가
  • 용량 계산: (전체 디스크 수 - 1) × 각 디스크 용량

3. 스페어 디스크(Hot Spare)란?

  • 정의: RAID에 포함되어 있지만 평상시에는 데이터 저장에 쓰이지 않고, 고장 시 자동으로 투입되는 예비 디스크
  • 역할: 장애 발생 시 즉시 리빌드(Rebuild)를 시작하여 Degraded 모드의 위험 기간을 최소화
  • 차이점:
    • 패리티 저장 공간: 정상 동작 시 항상 데이터와 복구 정보를 저장하는 주전 선수
    • 스페어 디스크: 평상시 놀다가 고장나면 들어오는 교체 선수

4. RAID-5와 스페어 디스크가 함께 있을 때 용량 계산

문제 예시

  • 10GB 디스크 8개
  • 스페어 디스크 1개, 나머지로 RAID-5 구성
  1. 전체: 8 × 10GB = 80GB
  2. 스페어 제외: 8 - 1 = 7개
  3. RAID-5 패리티: 7 - 1 = 6개 데이터 디스크
  4. 실제 용량: 6 × 10GB = 60GB

정답: 60GB


5. RAID-5의 패리티 원리

  • 패리티는 단순 복사본이 아닌, 같은 스트라이프 내의 데이터 블록들을 XOR 연산한 결과
  • XOR 특징: A ⊕ B ⊕ B = A → 한 블록이 없어도 나머지 블록과 패리티로 복원 가능
  • 각 스트라이프의 패리티 블록은 내용이 다르며, 모든 디스크에 분산 저장되어 부하가 고르게 분배됨

6. 복구 과정 (예시)

예: 디스크 4개, Disk3 장애

StripeDisk1Disk2Disk3Disk4
1 D1 D2 D3(복구 대상) P1(D1⊕D2⊕D3)
2 D4 D5 P2(복구 대상) D6
 

복구 방법

  • Stripe 1: D3 = D1 ⊕ D2 ⊕ P1
  • Stripe 2: P2 = D4 ⊕ D5 ⊕ D6 (패리티 재생성)
    이 과정을 각 스트라이프별로 반복하여 고장 디스크의 모든 블록을 재구성

7. Degraded 모드란?

  • 디스크 1개 고장 시, RAID-5는 남은 데이터 + 패리티로 즉시 서비스를 유지
  • 하지만 고장난 블록이 있을 때마다 실시간으로 패리티 연산을 수행해야 하므로 성능 저하 발생
  • 이 상태에서 추가 장애가 나면 데이터 전체 손실 → Hot Spare로 즉시 복구를 시작하는 이유

8. RAID-5가 같은 데이터를 여러 번 저장하나?

  • 아니요
    RAID-5는 RAID-1처럼 같은 데이터를 통째로 복사하지 않습니다.
    → N개의 디스크 중 1개 분량만 패리티로 사용, 나머지는 모두 실제 데이터 저장
  • 용량 효율: (N-1)/N

9. RAID 구성별 비교표

RAID 종류최소 디스크 수저장 방식장애 허용용량 효율장점단점
RAID 0 2 스트라이핑 0개 100% 속도 매우 빠름 고장 시 전체 손실
RAID 1 2 미러링 N/2개 50% 안정성 높음 용량 효율 낮음
RAID 5 3 스트라이핑+단일 패리티 1개 (N-1)/N 성능·안정성 균형 쓰기 느림
RAID 6 4 스트라이핑+이중 패리티 2개 (N-2)/N 안정성↑ 쓰기 더 느림
RAID 10 4 미러+스트라이프 각 미러에서 1개 50% 빠름+안정성↑ 비용↑
 

10. 마무리

RAID-5는 용량 효율, 성능, 안정성의 균형이 좋아서 많이 쓰입니다.
하지만 복구 중에는 취약하므로 Hot Spare 구성으로 위험 기간을 최소화하는 것이 안전합니다.
또한 RAID는 백업이 아니므로, 중요한 데이터는 반드시 별도 백업 체계를 운영해야 합니다.

반응형