압축 2

시계열데이터 PostgreSQL Timescale 압축률과 조회속도

📦 압축률 (Compression Ratio)일반적으로 90~95% 감소 (원본 대비 5~10% 크기)가 대표적입니다.사례 유형 원본 크기 압축 후 크기 압축률금융 틱 데이터5694 MB75 MB89% ↓IoT 센서 데이터1100 GB~5-10 GB90-95% ↓시계열 로그 데이터71 TB~50-100 GB90-95% ↓핵심 메커니즘:컬럼 기반 압축(Array 형식 저장) + 중복 제거segmentby(그룹화 컬럼)와 orderby(정렬 컬럼) 설정에 따라 효율성 차이5⚡ 조회 성능 향상시간 기반 청크(Chunk) 사용 시 50~90% 쿼리 시간 단축이 일반적입니다. 주요 요인별 개선 효과:1. 시간 필터 쿼리SELECT * FROM sensor_data WHERE time >= NOW() - INTE..

코딩공부/DB 2025.04.23

PostgreSQL TimescaleDB의 청크와 압축 개념정리

✅ 1. 청크(Chunk)의 개념과 "물리적인 데이터 분리"🔹 청크란?하나의 큰 테이블 데이터를 시간/범위 기준으로 나누어 저장한 작은 단위주로 TimescaleDB와 같은 확장 모듈에서 사용예: test라는 테이블이 있다고 하면, test_chunk_1, test_chunk_2 등으로 나뉘게 됨🧱 “물리적인 데이터 분리”란?단순히 "논리적으로 구분된 데이터"가 아니라, 실제 디스크상에서 각각의 청크가 독립된 테이블로 생성되어 분산 저장되는 것을 말합니다.📌 쉽게 말하면:큰 창고(test 테이블)를 작은 박스들(test_chunk_xx 테이블)로 나눠 담는 것!🖼 그림 예시┌────────────────────────────┐│ test 테이블 │└────────────..

코딩공부/DB 2025.04.18