방구석 상상코딩

08. 물리 데이터 저장소 설계 본문

정보처리기사 실기

08. 물리 데이터 저장소 설계

구석탱 2022. 1. 17. 21:13

물리 데이터 모델링

논리 모델을 적용하고자 하는 기술에 맞도록 상세화해 가는 과정

인덱스 (Index)

1. 개념

전체 데이터의 검색 없이 필요한 정보에 대해 신속한 조회가 가능

 

2. 인덱스 적용 기준

인덱스 분포도가 10~15% 이내인 경우 아래 수식을 참고

  • 분포도 = (1 / (컬럼 값의 종류)) X 100
  • 분포도 = (컬럼 값의 평균 Row 수) / (테이블의 총 Row 수) X 100

3. 인덱스 컬럼 선정

  • 분포도가 좋은 컬럼은 단독적으로 생성
  • 자주 조합되어 사용되는 컬럼은 결합 인덱스로 생성

파티션 (Partition) 종류

1. 레인지 파티셔닝 (Range Partitioning)

연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법

손쉬운 관리 기법을 제공하여 관리 시간의 단축이 가능

예 ) 일별, 월별, 분기별

 

2. 해시 파티셔닝 (Hash Partitioning)

파티션 키의 해시 함수 값에 의한 파티셔닝 기법

균등한 데이터 분할이 가능하고 질의 성능이 향상 가능

 

3. 리스트 파티셔닝 (List Partitioning)

특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능한 파티셔닝 기법

분포도가 비슷하고 데이터가 많은 SQL에서 컬럼의 조건이 많이 들어오는 경우 유용

예 ) [한국, 중국, 일본 → 아시아], [동대문구, 중구, 금천구 -> 서울시]

 

4. 컴포지트 파티셔닝 (Composite Partitioning)

레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝 중 2개 이상의 파티셔닝을 결합하는 파티셔닝 기법

큰 파티션에 대한 I/O 요청을 여러 파티션으로 분산할 수 있음

'정보처리기사 실기' 카테고리의 다른 글

10. 연계 데이터 구성  (0) 2022.01.18
09. 데이터베이스 기초 활용하기  (0) 2022.01.17
07. 논리 데이터 저장소 확인  (0) 2022.01.17
06. UI 설계  (0) 2022.01.17
05. UI 요구사항 확인  (0) 2022.01.16