물리데이터 저장소의 파티션 설계에서 파티션 유형은
범해조 라고 외우자
데이터 웨어하우스(data warehouse)는 사용자의 의사 결정에 도움을 주기 위하여 분석 가능한 형태로 정보들이 저장되어 있는 중앙 저장소다.
OLAP(online analytical processing) 개념
OLAP는 쉽게 다차원 분석으로 생각하면 된다. 정의를 내리자면, 최종사용자가 직접 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정 에 활용하는 방식을 말한다.
OLAP 연산
- Roll-up : 상세 데이터에서 요약된 형태의 데이터로 접근하는 기능.
- Drill-down : 요약된 데이터에서 상세한 데이터로 접근하는 기능.
- Drill-through : 데이터 웨어하우스나 OLTP에 존재하는 상세 데이터에 접근하는 기능.
- Drill-across : 다른 데이터 큐브의 데이터에 접근하는 기능.
- Pivoting : 행, 열, 페이지 차원을 바꾸어 볼 수 있는 기능.
- Slicing : 다양한 각도에서 조회하고 자유롭게 비교하는 기능
- Dicing : Slicing을 더 세분화 하는 기능
OLAP 종류
- ROLAP(Relational-OLAP) : 관계형 DB와 관계형 쿼리를 사용하여 저장 및 분석
- MOLAP(Multi-dimension OLAP) : 특수한 구조의 다차원 DB를 사용함.검색 속도를 향상시키기 위해 큐브 캐시(Cube Cache)라고 하는 주기억 장치 속에 데이터 큐브를 보관함.
- HOLAP(Hybrid OLAP) : ROLAP과 MOLAP의 특성을 모두 가짐.
출처: https://cbts.tistory.com/254 [IT일기장]
뷰(View)란 무엇인가?
1. 뷰는 사용자에게 접근이 허용된 자료만을 제한적으로 보여주기 위해 하나 이상의 기본 테이블로부터 유도된, 이름을 가지는 가상 테이블이다.
2. 뷰는 저장장치 내에 물리적으로 존재하지 않지만 사용자에게 있는 것처럼 간주된다.
3. 뷰는 데이터 보정작업, 처리과정 시험 등 임시적인 작업을 위한 용도로 활용된다.
4. 뷰는 조인문의 사용 최소화로 사용상의 편의성을 최대화 한다.
뷰(View)의 특징
1. 뷰는 기본테이블로부터 유도된 테이블이기 때문에 기본 테이블과 같은 형태의 구조를 사용하며, 조작도 기본 테이블과 거의 같다.
2. 뷰는 가상 테이블이기 때문에 물리적으로 구현되어 있지 않다.
3. 데이터의 논리적 독립성을 제공할 수 있다.
4. 필요한 데이터만 뷰로 정의해서 처리할 수 있기 때문에 관리가 용이하고 명령문이 간단해진다.
5. 뷰를 통해서만 데이터에 접근하게 하면 뷰에 나타나지 않는 데이터를 안전하게 보호하는 효율적인 기법으로 사용할 수 있다.
6. 기본 테이블의 기본키를 포함한 속성(열) 집합으로 뷰를 구성해야지만 삽입, 삭제, 갱신, 연산이 가능하다.
7. 일단 정의된 뷰는 다른 뷰의 정의에 기초가 될 수 있다.
8. 뷰가 정의된 기본 테이블이나 뷰를 삭제하면 그 테이블이나 뷰를 기초로 정의된 다른 뷰도 자동으로 삭제된다.
뷰(View)사용시 장 단점
장점
1. 논리적 데이터 독립성을 제공한다.
2. 동일 데이터에 대해 동시에 여러사용자의 상이한 응용이나 요구를 지원해 준다.
3. 사용자의 데이터관리를 간단하게 해준다.
4. 접근 제어를 통한 자동 보안이 제공된다.
단점
1. 독립적인 인덱스를 가질 수 없다.
2. ALTER VIEW문을 사용할 수 없다. 즉 뷰의 정의를 변경할 수 없다.
3. 뷰로 구성된 내용에 대한 삽입, 삭제, 갱신, 연산에 제약이 따른다.
Hadoop (High-Availability Distributed Object-Oriented Platform)
; 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크.
일을 하다보면 관계형데이터베이스(RDB)에서 하둡으로 테이블을 보내거나, 반대로 하둡에서 RDB로 테이블을 보내야 할 때가 있습니다. 아파치 스쿱은 RDB와 하둡 사이에서 둘 사이의 연결을 도와주는 명령 줄 인터페이스(Command-Line Interface) 애플리케이션 입니다.
이런 형태로 스쿱이 RDB와 하둡의 중간에 위치한다고 볼 수 있습니다. 명령어는 크게 import와 export로 구성 되어있습니다.
- import : RDB -> HDFS (RDB에서 HDFS로 데이터를 가져옵니다.)
- export : HDFS -> RDB (HDFS에서 RDB로 데이터를 가져옵니다.)
'미래를 위한 준비 > 정보처리기사' 카테고리의 다른 글
정보처리기사 13일차 (0) | 2021.08.07 |
---|---|
정보처리기사 12일차 (0) | 2021.08.06 |
정보처리기사 10일차 (0) | 2021.08.04 |
정보처리기사 9일차 (0) | 2021.08.03 |
정보처리기사 8일차 (0) | 2021.08.02 |