관리 메뉴

ImJay

[리눅스 마스터 2급] RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지 본문

CS 지식

[리눅스 마스터 2급] RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지

ImJay 2025. 8. 9. 19:02
반응형

RAID 완벽 정리 — 원리부터 스페어 디스크, 복구 방식까지

1. RAID란?

RAID(Redundant Array of Independent/Inexpensive Disks)는 여러 개의 물리 디스크를 하나의 논리적 장치처럼 묶어서 성능 향상, 데이터 안정성, 또는 둘 다를 달성하는 기술입니다.


2. RAID-5란 무엇인가?

  • 구성: 최소 3개의 디스크 필요
  • 방식: 데이터를 스트라이핑(Stripe)하여 나누고, 각 스트라이프마다 패리티(Parity) 블록을 1개씩 저장
  • 장점: 읽기 속도 우수, 디스크 1개 장애에도 데이터 복구 가능
  • 단점: 쓰기 성능이 다소 저하(패리티 연산), 동시에 2개 이상 장애 시 복구 불가
  • 용량 계산: (전체 디스크 수 - 1) × 각 디스크 용량

3. 스페어 디스크(Hot Spare)란?

  • 정의: RAID에 포함되어 있지만 평상시에는 데이터 저장에 쓰이지 않고, 고장 시 자동으로 투입되는 예비 디스크
  • 역할: 장애 발생 시 즉시 리빌드(Rebuild)를 시작하여 Degraded 모드의 위험 기간을 최소화
  • 차이점:
    • 패리티 저장 공간: 정상 동작 시 항상 데이터와 복구 정보를 저장하는 주전 선수
    • 스페어 디스크: 평상시 놀다가 고장나면 들어오는 교체 선수

4. RAID-5와 스페어 디스크가 함께 있을 때 용량 계산

문제 예시

  • 10GB 디스크 8개
  • 스페어 디스크 1개, 나머지로 RAID-5 구성
  1. 전체: 8 × 10GB = 80GB
  2. 스페어 제외: 8 - 1 = 7개
  3. RAID-5 패리티: 7 - 1 = 6개 데이터 디스크
  4. 실제 용량: 6 × 10GB = 60GB

정답: 60GB


5. RAID-5의 패리티 원리

  • 패리티는 단순 복사본이 아닌, 같은 스트라이프 내의 데이터 블록들을 XOR 연산한 결과
  • XOR 특징: A ⊕ B ⊕ B = A → 한 블록이 없어도 나머지 블록과 패리티로 복원 가능
  • 각 스트라이프의 패리티 블록은 내용이 다르며, 모든 디스크에 분산 저장되어 부하가 고르게 분배됨

6. 복구 과정 (예시)

예: 디스크 4개, Disk3 장애

StripeDisk1Disk2Disk3Disk4
1 D1 D2 D3(복구 대상) P1(D1⊕D2⊕D3)
2 D4 D5 P2(복구 대상) D6
 

복구 방법

  • Stripe 1: D3 = D1 ⊕ D2 ⊕ P1
  • Stripe 2: P2 = D4 ⊕ D5 ⊕ D6 (패리티 재생성)
    이 과정을 각 스트라이프별로 반복하여 고장 디스크의 모든 블록을 재구성

7. Degraded 모드란?

  • 디스크 1개 고장 시, RAID-5는 남은 데이터 + 패리티로 즉시 서비스를 유지
  • 하지만 고장난 블록이 있을 때마다 실시간으로 패리티 연산을 수행해야 하므로 성능 저하 발생
  • 이 상태에서 추가 장애가 나면 데이터 전체 손실 → Hot Spare로 즉시 복구를 시작하는 이유

8. RAID-5가 같은 데이터를 여러 번 저장하나?

  • 아니요
    RAID-5는 RAID-1처럼 같은 데이터를 통째로 복사하지 않습니다.
    → N개의 디스크 중 1개 분량만 패리티로 사용, 나머지는 모두 실제 데이터 저장
  • 용량 효율: (N-1)/N

9. RAID 구성별 비교표

RAID 종류최소 디스크 수저장 방식장애 허용용량 효율장점단점
RAID 0 2 스트라이핑 0개 100% 속도 매우 빠름 고장 시 전체 손실
RAID 1 2 미러링 N/2개 50% 안정성 높음 용량 효율 낮음
RAID 5 3 스트라이핑+단일 패리티 1개 (N-1)/N 성능·안정성 균형 쓰기 느림
RAID 6 4 스트라이핑+이중 패리티 2개 (N-2)/N 안정성↑ 쓰기 더 느림
RAID 10 4 미러+스트라이프 각 미러에서 1개 50% 빠름+안정성↑ 비용↑
 

10. 마무리

RAID-5는 용량 효율, 성능, 안정성의 균형이 좋아서 많이 쓰입니다.
하지만 복구 중에는 취약하므로 Hot Spare 구성으로 위험 기간을 최소화하는 것이 안전합니다.
또한 RAID는 백업이 아니므로, 중요한 데이터는 반드시 별도 백업 체계를 운영해야 합니다.

반응형
Comments