캐시 스탬피드 현상에 대하여 설명해주세요.

표자 2025. 5. 27. 10:40

캐시 스탬피드 현상에 대하여 설명해주세요.

백엔드와 관련된 질문이에요.

대규모 트래픽 환경에서 캐시를 운용하는데, Cache Aside(캐시 미스 발생 시 적재) 전략을 사용한다고 가정하겠습니다. 이때, 수많은 요청들이 동시에 캐시 미스를 확인하고 원본 저장소에서 데이터를 가져와 캐시에 적재하는 상황이 발생할 수 있는데요. 이를 캐시 스탬피드 현상 혹은 Thundering Herd 문제라고 표현합니다. 캐시 스탬피드 현상은 원본 데이터베이스와 캐시의 성능을 저하할 수도 있습니다.

이 문제는 어떻게 풀어볼 수 있을까요? 🤓

해당 방식은 크게 잠금, 외부 재계산, 확률적 조기 재계산 방식으로 풀어볼 수 있습니다.

잠금(Locking) 방식 은 한 요청 처리 스레드가 해당 캐시 키에 대한 잠금을 획득합니다. 이로인해 다른 요청 처리 스레드들은 잠시 대기합니다. 잠금을 획득한 스레드는 사용자 요청에 응답하는 과정동안 캐시 적재 작업은 비동기 스레드로 처리할 수 있습니다. 잠금을 사용하기 때문에 성능 저하 가능성이 존재하며, 잠금 획득 스레드의 실패, 잠금의 생명 주기, 데드락 등 다양한 상황을 고려해야한다는 단점이 존재합니다.

외부 재계산(External Recomputation) 방식 은 모든 요청 처리 스레드가 캐시 적재를 수행하지 않습니다. 대신, 캐시를 주기적으로 모니터링하는 스레드를 별도로 관리하여 캐시의 만료시간이 얼마 남지 않은 경우, 데이터를 갱신하여 문제를 예방합니다. 해당 방식은 다시 사용되지 않을 데이터를 포함하여 갱신하기 때문에 메모리에 대한 불필요한 연산이 발생하고, 메모리 공간을 비효율적으로 사용할 가능성이 존재합니다.

확률적 조기 재계산(Probablistic Early Recomputation) 방식 은 캐시 만료 시간이 얼마 남지 않았을 경우, 확률이라는 개념을 사용하여 여러 요청 처리 스레드 중에서 적은 수만이 캐시를 적재하는 작업을 수행하여 스탬피드 현상을 완화할 수 있습니다.

좋아! 쉽고 명확하게 설명해볼게요. 😊

캐시 스탬피드 현상은 왜 발생할까?
웹사이트나 앱에서 많은 사용자가 같은 데이터를 요청하면, 보통 캐시에서 데이터를 가져와 빠르게 응답해요. 그런데, 캐시가 만료되면 어떻게 될까요? 모든 사용자가 같은 데이터를 원본 저장소(데이터베이스)에서 가져오려고 동시에 요청하면 서버 부하가 폭발할 수도 있어요! 이걸 캐시 스탬피드 현상이라고 해요.

🔧 이 문제를 해결하는 방법
1. 잠금(Locking) 방식
   → 하나의 요청만 데이터베이스에서 정보를 가져오고, 나머지는 기다리게 해요.
   → 데이터가 캐시에 적재되면 다른 요청들도 사용 가능!
   → 단점: 잠금을 잘못 관리하면 서버가 느려질 수 있음. 😰

2.외부 재계산(External Recomputation) 방식
   → 별도의 스레드(백그라운드 작업)가 주기적으로 캐시를 갱신해요.
   → 사용자가 요청을 보내기 전에 미리 캐시를 업데이트하니까 부담이 적음!
   → 단점: 안 쓰는 데이터를 갱신하면 불필요한 리소스 낭비가 생김. 😥

3. 확률적 조기 재계산(Probabilistic Early Recomputation) 방식
   → 캐시가 만료되기 전에 일부 요청만 캐시를 갱신해요!
   → 예를 들어, 5%의 요청만 새로운 데이터를 캐시에 저장하고, 나머지는 기존 데이터 사용.
   → 단점: 갱신될 확률을 잘 조정해야 함.

---

✅ 어떤 방식이 좋을까?
- 트래픽이 많다면 외부 재계산 방식이 안정적이에요.
- 실시간 성능이 중요하다면 확률적 조기 재계산 방식이 효과적이에요.
- 잠금 방식은 신중하게 써야 하고, 작은 시스템에서는 유용할 수도 있어요.

728x90

저작자표시 (새창열림)