sec 41) 관계형 데이터베이스의 제약조건 - Key(A)
* 키(key) - 데이터베이스에서 조건에 만족하는 튜플을 찾거나 순서대로 정렬할 때 기준이 되는 속성
필기 20.6
* 후보키(Candidate Key) - 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합, 기본키로 사용할 수 있는 속성, 유일성(Unique), 최소성(Minimality)를 모두 만족
필기 20.6
- 유일성(Unique) - 하나의 키 값으로 하나의 튜플만을 유일하게 식별
필기 20.6
- 최소성(Minimality) - 키를 구성하는 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성되어야 함.
* 기본키(Primary Key) - 후보키 중에서 특별히 선정된 주키(Main Key), 중복된 값을 가질 수 없다, 한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있는 속성, NULL값을 가질 수 없다. 즉 튜플에서 기본키로 설정된 속성에는 NULL값이 있어서는 안된다.
* 대체키(Alternate Key) - 대체키는 후보키가 둘이상일 땐 기본키를 제외한 나머지 후보키를 의미, 보조키라고도 함.
필기 20.9
* 슈퍼키(Super Key) - 슈퍼키는 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키, 릴레이션을 구성하는 모든 튜플 중 슈퍼키로 구성된 속성의 집합과 동일한 값은 나타나지 않음, 릴레이션을 구성하는 모든 튜플에 대해 유일성은 만족, 최소성은 만족하지 못함.
필기 20.6
* 외래키(Foreign Key) - 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합을 의미, 한 릴레이션에 속한 속성 A와 참조 릴레이션의 기본키인 B가 동일한 도메인상에서 정의되었을 때의 속성A를 외래키라고 함. 외래키로 지정되면 참조 릴레이션의 기본키에 없는 값은 입력할 수 없다.
sec 42) 관계형 데이터베이스의 제약조건 - 무결성(Integrity) (A)
* 무결성(Integrity) - 데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제값이 일치하는 정확성을 의미한다. 무결성 제약 조건은 데이터베이스에 들어 있는 데이터의 정확성을 보장하기 위해 부정확한 자료가 데이터 베이스 내에 저장되는 것을 방지하기 위한 제약조건을 말함.
필기 20.8, 20.6
* 무결성의 종류
필기 20.8, 20.6
- 개체 무결성 - 기본 테이블의 기본키를 구성하는 어떤 속성도 Null 값이나 중복값을 가질 수 없다는 규정
- 참조 무결성 - 외래키 값은 Null이거나 참조 릴레이션의 기본키 값과 동일해야함. 즉 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없다는 규정
- 도메인 무결성 - 주어진 속성 값이 정의된 도메인에 속한 값이어야 한다는 규정
- 사용자 정의 무결성 - 속성 값들이 사용자가 정의한 제약조건에 만족되어야 한다는 규정
- NULL 무결성 - 릴레이션의 특정 속성 값이 NULL이 될 수 없도록 하는 규정
- 고유 무결성 - 릴레이션의 특정 속성에 대해 각 튜플이 갖는 속성값들이 서로 달라야 한다는 규정
- 키 무결성 - 하나의 릴레이션에는 적어도 하나의 키가 존재해야 한다는 규정
- 관계 무결성 - 릴레이션에 어느 한 튜플의 삽입 가능 여부 또는 한 릴레이션과 다른 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정
* 데이터 무결성 강화
- 데이터 무결성은 데이터 품질에 직접적인 영향을 미치므로 테이터 특성에 맞는 적절한 무결성을 정의하고 강화해야한다.
- 데이터 무결성은 애플리케이션, 데이터베이스 트리거, 제약조건을 이용해 강화할 수 있다.
애플리케이션 - 데이터 생성, 수성, 삭제시 무결성 조건을 검증하는 코드를 프로그램내에 추가함.
데이터베이스 트리거 - 트리거 이벤트에 무결성 조건을 실행하는 절차형 SQL을 추가함
제약조건 - 데이터베이스에 제약조건을 설정하여 무결성을 유지함
sec 43) 관계대수 및 관계해석(A)
필기 20.9
* 관계대수 - 관계형 데이터베이스에서 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어, 릴레이션을 처리하기 위해 연산자와 연산규칙을 제공하며, 피연산자와 연산 결과가 모두 릴레이션이다. 질의에 대한 해를 구하기 위해 수행해야 할 연산의 순서를 명시한다. 관계 데이터베이스에 적용하기 위해 특별히 개발한 순수 관계 연산자와 수학적 집합 이론에서 사용하는 일반 집합 연산자가 있다.
필기 20.8, 20.6
* 순수 관계 연산자
필기 20.8
- Select - 릴레이션에 존재하는 튜플 중에서 선택 조건을 만족하는 튜플의 부분집합을 구하여 새로운 릴레이션을 만드는 연산/ 릴레이션의 행에 해당하는 튜플(Tuple)을 구하는 것이므로 수평 연산이라고도 함 - σ(시그마)
필기 20.8
- Project - 주어진 릴레이션에서 속성 리스트(Attribute List)에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산/ 연산 결과에 중복이 발생하면 중복 제거됨/ 릴레이션의 열에 해당하는 속성을 추출하는 것이므로 수직연산자라고도 함 - π(파이)
필기 20.6
- Join - 공통속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산/ Join의 결과는 Cartesian Pruduct(교차곱)을 수행한 다음 Select를 수행한 것과 같음 - ▷◁
20.10, 필기 20.8
- Division - X⊃Y인 두 개의 릴레이션 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구하는 연산 - ÷
* 일반 집합연산자
- 일반 집합 연산자는 수학적 집합 이론에서 사용하는 연산자
- 일반 집합 연산자 중 합집합, 교집합, 차집합을 하기위해선 합병조건을 만족해야함
합병조건( 두 릴레이션 간의 속성의 수가 같고 대응되는 속성별로 도메인이 같아야함, 속성의 이름이 같아야 하는 건 아님)
- 합병 가능한 두 릴레이션 R과 S가 있을 때 각 연산의 특징을 요약하면 다음과 같음
연산자 | 기능 및 수학적 표현 | 카디널리티 |
합집합(Union) | 두 릴레이션에 존재하는 튜플의 합집합을 구하되, 결과로 생성된 릴레이션에서 중복되는 튜플은 제거되는 연산 | |R∪S|≤|R|+|S| |
교집합(Intersection) | 두 릴레이션에 존재하는 튜플의 교집합을 구하는 연산 | |R∩S|≤Min{|R|,|S|} |
차집합(Difference) | 두 릴레이션에 존재하는 튜플의 차집합을 구하는 연산 | |R-S|≤|R| |
교차곱(Cartesian Product) | 두 릴레이션에 있는 튜플들의 순서쌍을 구하는 연산 | |R×S|=|R|×|S| |
* 관계해석(Relational Calculus) - 관계 데이터의 연산을 표현하는 방법
- 관계해석은 원하는 정보가 무엇이라는 것만 정의하는 비절차적 특성을 지님
- 원하는 정보를 정의 할 때는 계산 수학을 사용.
sec44) 이상/ 함수적 종속(B)
* 이상(Anomaly) - 테이블에서 일부 속성들의 종속으로 인해 데이터의 중복이 발생하고, 이 중복(Redundancy)으로 인해 테이블 조작시 문제가 발생하는 현상
>> 이상종료
- 삽입 이상(Insertion Anomaly): 테이블에 데이터를 삽입할 때 의도와 상관없이 원하지 않는 값들로 인해 삽입할 수 없는 현상
- 삭제 이상(Deletion Anomaly): 테이블에서 한 튜플을 삭제할 EO 의도와는 상관없는 값들도 함께 삭제되는, 즉 연쇄 삭제가 발생하는 현상
- 갱신 이상(Update Anomaly): 테이블에서 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성(Inconsistency)이 생기는 현상.
* 함수적 종속(Functional Dependency) - 어떤 테이블 R에서 X와 Y를 각각 R의 속성 집합의 부분 집합이라 하자. 속성 X의 값 각각에 대해 시간에 관계없이 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때 Y는 X에 함수적 종속 또는 X가 Y를 함수적으로 결정한다고 하고, X->Y로 표기한다. / 데이터의 의미를 표현하는 것으로, 현실세계를 표현하는 제약조건이 되는 동시에 데이터베이스에서 항상 유지되어야 할 조건이다. / X->Y의 관계를 갖는 속성 X와 Y에서 X를 결정자(Determinant)라 하고, Y를 종속자(Dependent)라고 한다. 예를 들어 ‘학번->이름’ 이면 학번이 결정자, 이름이 종속자 (p193 예시 참고)
>> 완전/ 부분 함수적 종속 및 이해
* 완전 함수적 종속 - 어떤 테이블 R에서 속성 Y가 다른 속성 집합 X 전체에 대해 함수적 종속이면서 속성 집합 X의 어떠한 진부분 집합 Z(즉, Z⊂X)에도 함수적 종속이 아닐 때 속성 Y는 속성 집합 X에 완전 함수적 종속이라고 한다.
* 부분 함수적 종속 - 어떤 테이블 R에서 속성 Y가 다른 속성 집합 X 전체에 대해 함수적 종속이면서 속성 집합 X의 임의의 진부분 집합에 대해 함수적 종속일 때, 속성 Y는 속성 집합 X에 부분 함수적 종속이라고 한다.
* 완전/부분 함수적 종속의 이해 - 완전 함수적 종속이라는 말은 어떤 속성이 기본키에 대해 완전히 종속적일 때를 말한다. 예를 들어 <수강>테이블은 (학번,과목번호)가 기본키인데, 성적은 학번과 과목번호가 같을 경우에는 항상 같은 성적이 오므로, 즉 성적은 학번과 과목번호에 의해 결정되므로 성적은 기본키(학번,과목번호)에 완전 함수적 종속이 되는 것. 반면에 학년은 과목번호에 관계없이 학번이 같으면 항상 같은 학년이 오므로, 즉 기본키의 일부인 학번에 의해서 학년이 결정되므로 학년은 부분 함수적 종속이라고 함.
sec 45) 정규화(Normalization) (A)
필기 20.9
* 정규화(Normalization) - 테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용해 테이블을 무손실 분해하는 과정/ 목적은 가능한 한 중복을 제거하여 삽입, 삭제, 갱신 이상의 발생 가능성을 줄이는 것/ 종류는(제1,제2,제3,BCNF,제4,제5) 정규화가 있고 순서대로 정규화의 정도가 높아짐
- 무손실 분해(Nonloss Decomposition) - 테이블 R의 프로젝션(특정 테이블에서 일부속성들만 추출하여 만든 테이블)인 R1,R2가 NATURAL JOIN을 통해 원래의 테이블 R로 정보 손실 없이 복귀되는 경우 R은 R1과 R2로 무손실 분해되었다고 함
ex)
필기 20.9,20.8,20.6
>> 정규화 과정( tip, 제4,제5는 실제 프로젝트에서는 거의 발생하지 않으므로 정의만 기술)
<주문목록>
제품번호 | 제품명 | 재고수량 | 주문번호 | 고객번호 | 주소 | 주문수량 |
1001 | 모니터 | 2000 | A345 D347 |
100 200 |
서울 부산 |
150 300 |
1007 | 마우스 | 9000 | A210 A345 B230 |
300 100 200 |
광주 서울 부산 |
600 400 700 |
1201 | 키보드 | 2100 | D347 | 200 | 부산 | 300 |
교재 p.198 참고
* 제 1정규형 - 테이블 R에 혹한 모든 속석의 도메인(Domain)이 원자값(Atomic Value)만으로 되어있는 정규형. 즉 테이블의 모든 속성 값이 원자 값으로만 되어있는 정규형/ <주문목록> 테이블에서는 하나의 제품에 대해 여러개의 주문 관련 정보(주문번호, 고객번호, 주소, 주문수량)이 발생. 따라서 <주문목록>은 테이블은 제1정규형이 아니다.
>> 제1 정규화한 모습
<제품> <제품주문>
제품번호 | 제품명 | 재고수량 |
1001 | 모니터 | 2000 |
1007 | 마우스 | 9000 |
1201 | 키보드 | 2100 |
주문번호 | 제품번호 | 고객번호 | 주소 | 주문수량 |
A345 | 1001 | 100 | 서울 | 150 |
D347 | 1001 | 200 | 부산 | 300 |
A210 | 1007 | 300 | 광주 | 600 |
A345 | 1007 | 100 | 서울 | 400 |
B230 | 1007 | 200 | 부산 | 700 |
D347 | 1201 | 200 | 부산 | 300 |
주문, 제품번호 -> 고객번호, 주소, 주문수량
주문번호 -> 고객번호, 주소
고객번호 -> 주소
* 제 2정규형 - 테이블 R이 제 1정규형이고, 기본키가 아닌 모든 속성이 기본키에 대해 완전 함수적 종속을 만족하는 정규형이다. <주문목록> 테이블이 <제품> 테이블과 <제품주문> 테이블로 무손실 분해되면서 모두 제 1정규형이 되었지만 그 중 <제품주문> 테이블에는 기본키인 (주문번호, 제품번호)에 완전 함수적 종속이 되지 않는 속성이 존재한다. 즉 주문수량은 기본키에 대해 완전 함수적 종속이지만 고객번호와 주소는 주문번호에 의해서도 결정될 수 있으므로, 기본키에 대해 완전 함수적 종속이 아니다. 따라서 <제품주문>테이블은 제 2정규형이 아니다.
>> <제품주문>을 제2정규화하기.
주문번호 | 제품번호 | 고객번호 | 주소 | 주문수량 |
A345 | 1001 | 100 | 서울 | 150 |
D347 | 1001 | 200 | 부산 | 300 |
A210 | 1007 | 300 | 광주 | 600 |
A345 | 1007 | 100 | 서울 | 400 |
B230 | 1007 | 200 | 부산 | 700 |
D347 | 1201 | 200 | 부산 | 300 |
<주문목록> <주문>
주문번호 | 제품번호 | 주문수량 |
A345 | 1001 | 150 |
D347 | 1001 | 300 |
A210 | 1007 | 600 |
A345 | 1007 | 400 |
B230 | 1007 | 700 |
D347 | 1201 | 300 |
주문번호 | 고객번호 | 주소 |
A345 | 100 | 서울 |
D347 | 200 | 부산 |
A210 | 300 | 광주 |
B230 | 200 | 부산 |
주문번호 -> 고객번호, 주소
고객번호 -> 주소
* 제 3정규형
- 테이블 R이 제 2정규형이고 기본키가 아닌 모든 속성이 기본키에 대해 이행적 함수적 종속(Transitive Functional Dependency)을 만족하지 않는 정규형
- <제품주문> 테이블이 <주문목록> 테이블과 <주문> 테이블로 무손실 분해되면서 모두 제 2정규형이 되었다. 그러나 <주문> 테이블에서 고객번호가 주문번호에 함수적 종속이고, 주소가 고객번호에 함수적 종속이므로 주소는 기본키인 주문번호에 대해 이행적 함수적 종속을 만족한다. 즉 주문번호 -> 고객번호이고, 고객번호 -> 주소 이므로 주문번호 -> 주소는 이행적 함수적 종속이 된다. 따라서 <주문> 테이블은 제 3정규형이 아니다.(이행적 함수적 종속: A->B이고 B->C 일 때 A->C를 만족하는 관계를 이야기함)
>> <주문> 제 3정규형하기
<주문>
주문번호 | 고객번호 | 주소 |
A345 | 100 | 서울 |
D347 | 200 | 부산 |
A210 | 300 | 광주 |
B230 | 200 | 부산 |
<주문> <고객>
주문번호 | 고객번호 |
A345 | 100 |
D347 | 200 |
A210 | 300 |
B230 | 200 |
고객번호 | 주소 |
100 | 서울 |
200 | 부산 |
300 | 광주 |
* BCNF
- BCNF는 테이블 R에서 모든 결정자가 후보키(Candidate Key)인 정규형
- 일반적으로 제 3정규형에 후보키가 여러개 존재하고, 이런한 후보키들이 서로 중첩되어 나타나는 경우에 적용가능하다.
- 아래의 <수강_교수> 테이블(제 3정규형)은 함수적 종속{(학번, 과목명)->담당교수, (학번, 담당교수)->과목명, 담당교수 -> 과목명}을 만족하고 있다. <수강_교수> 테이블의 후보키는 (학번, 과목명)과 (학번, 담당교수)이다.
<수강_교수>
학번 | 과목명 | 담당교수 |
12 | 데이터베이스 | 홍길동 |
13 | 네트워크 | 유관순 |
14 | 인공지능 | 윤봉길 |
15 | 데이터베이스 | 홍길동 |
16 | 데이터베이스 | 이순신 |
17 | 네트워크 | 유관순 |
- <수강_교수> 테이블에서 결정자 중 후보키가 아닌 속성이 존재, 즉 함수적 종속 담당교수-> 과목명이 존재, 담당교수가 <수강_교수>태이블에서 후보키가 아니기 때문에 <수강_교수> 테이블은 BCNF가 아님
>> <수강_교수> BCNF 하기
<수강> <교수>
학번 | 담당교수 |
12 | 홍길동 |
13 | 유관순 |
14 | 윤봉길 |
15 | 홍길동 |
16 | 이순신 |
17 | 유관순 |
담당교수 | 과목명 |
홍길동 | 데이터베이스 |
이순신 | 데이터베이스 |
윤봉길 | 인공지능 |
유관순 | 네트워크 |
* 제 4정규형
- 테이블 R에 다중 값 종속 (MVD; Multi Valued Dependency) A->-> B가 존재할 경우 R의 모든 속성이 A에 함수적 종속 관계를 만족하는 정규형(다중값 종속: A,B,C 3개의 속성을 가진 테이블 R에서 어떤 복합 속성(A,C)에 대응하는 B값의 집합이 A값에만 종속되고 C값에는 무관하면, B는 A에 다중값 종속이라고함, A->->B 로 표기)
** 정규화 단계 암기 요령 p201
sec 46) 반정규화(Denormalization)
20.5 필기 20.9
* 반정규화 - 시스템의 성능을 향상하고 개발 및 운영의 편의성 등을 높이기 위해 정규화된 데이터 모델을 의도적으로 통합, 중복, 분리하여 정규화 원칙을 위배하는 행위, 반정규화를 수행하면 시스템의 성능이 향상되고 관리 효율성은 증가하지만 데이터의 일관성 및 정합성이 저하될 수 있음. 과도한 반정규화는 오히려 성능을 저하시킬 수 있음
>> 반정규화의 방법
* 테이블 통합 - 두 개의 테이블이 조인(Join)dl 되어 사용되는 경우가 많을 경우 성능 향상을 위해 아예 하나의 테이블로 만들어 사용.
- 테이블 통합을 고려하는 경우 - 두 개의 테이블에서 발생하는 프로세스가 동일하게 자주 처리되는 경우. 상상 두 개의 테이블을 이용해 조회를 수행하는 경우
- 테이블 통합의 종류 - 1:1 관계 테이블 통합, 1:N 관계 테이블 통합, 슈퍼타입/서브타입 테이블 통합
* 테이블 분할 - 테이블을 수직 또는 수평으로 분할 하는 것
- 수평 분할: 레코드(Record)를 기준으로 테이블을 분할 하는 것, 레코드 별로 사용 빈도의 차이가 큰 경우 사용 빈도에 따라 테이블을 분할함
- 수직 분할: 하나의 테이블에 속성이 너무 많을 경우 속성을 기준으로 테이블을 분할하는 것, 종류: 갱신 위주의 속성 분할, 자주 조회되는 속성 분할, 크기가 큰 속성 분할, 보안을 적용해야 하는 속성 분할
필기 20.6
* 중복 테이블 추가 - 작업의 효율성을 향상시키기 위해 테이블을 추가하는 것
- 중복 테이블을 추가하는 경우 - 여러 테이블에서 데이터를 추출해서 사용해야 할 경우, 다른 서버에 저장된 테이블을 이용해야 하는 경우
- 중복 테이블 추가 방법
- 집계 테이블의 추가: 집계 데이터를 위한 테이블을 생성, 각 원본 테이블에 트리거(Trigger)를 설정하여 사용하는 것
- 진행 테이블의 추가: 이력관리 등의 목적으로 추가하는 테이블
- 특정 부분만을 포함하는 테이블의 추가: 데이터가 많은 테이블의 특정 부분만을 사용하는 경우 해당부분만으로 새로운 테이블을 생성
* 중복 속성 추가 - 조인해서 데이터를 처리할 때 데이터를 조회하는 경로를 단축하기 위해 자주 사용하는 속성을 하나 더 추가하는 것, 중복 속성을 추가하면 데이터의 무결성 확보가 어렵고, 디스크 공간이 추가로 필요
- 중복 속성을 추가하는 경우
- 조인이 자주 발생하는 속성, 접근 경로가 복잡한 속성인 경우, 액세스의 조건으로 자주 사용되는 속성, 기본키의 형태가 적절하지 않거나 여러 개의 속성으로 구성된 경우
sec 47) 시스템 카탈로그 (B)
* 시스템 카탈로그(System Catalog)
- 시스템 그 자체에 관련이 있는 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스
- 시스템 카탈로그 내의 각 테이블은 사용자를 포함하여 DBMS에서 지원하는 모든 데이터 객체에 대한 정의나 명세에 관한 정보를 유지 관리하는 시스템 테이블
- 카탈로그들이 생성되면 데이터 사전(Data Dictionary)에 저장되기 때문에 좁은 의미로는 카탈로그를 데이터 사전이라고도 한다.
* 메타 데이터(Meta-Data)
- 메타 데이터는 시스템 카탈로그에 저장된 정보를 의미
- 메타 데이터의 유형
- 데이터베이스 객체 정보: 테이블(Table), 인덱스(Index), 뷰(View) 등의 구조 및 통계 정보
- 사용자 정보: 아이디, 패스워드, 접근 권한 등
- 테이블 무결성 제약 조건 정보: 기본키, 외래키, NULL값 허용 여부 등
- 함수, 프로시저, 트리거 등에 대한 정보
* 데이터 디렉터리(Data Directory)
- 데이터 디렉터리는 데이터 사전에 수록된 데이터에 접근하는 데 필요한 정보를 관리 유지하는 시스템
- 시스템 카탈로그는 사용자와 시스템 모두 접근할 수 있지만 데이터 디렉터리는 시스템만 접근할 수 있다.
sec 48) 데이터베이스 저장공간 설계(C)
* 데이터베이스 저장공간 설계
- 테이블(Table) - 데이터베이스의 가장 기본적인 객체, 로우(Row,행), 컬럼(Colum, 열)으로 구성되어 있음, 데이터베이스의 모든 데이터는 테이블에 저장됨
- 컬럼(Column) - 테이블의 열을 구성하는 요소, 데이터 타입(Data Type), 길이(Length) 등으로 정의됨
- 테이블스페이스(Tablespace) - 테이블이 저장 되는 논리적인 영역, 한 개의 테이블스페이스에 한 개 이상의 테이블을 저장할 수 있음
* 테이블 종류
- 일반 테이블(=힙 구조 테이블_Heap-Organized Table) - 대부분 DBMS에서 표준 테이블로 사용되는 테이블 형태
- 클러스터드 인덱스 테이블(Clustered Index Table) - 기본키(Primary Key)나 인덱스키의 순서에 따라 데이터가 저장되는 테이블, 일반적인 인덱스를 사용하는 테이블에 비해 접근 경로가 단축됨
- 파티셔닝 테이블(Partitioning Table) - 대용량의 테이블을 작은 논리적 단위인 파티션(Partition)으로 나눈 테이블
- 외부 테이블(External Table) - 데이터베이스에서 일반 테이블처럼 이용할 수 있는 외부 파일, 데이터베이스 내에 객체로 존재함
- 임시 테이블(Temporary Table) - 트랜잭션이나 세션별로 데이터를 저장하고 처리할 수 있는 테이블, 임시 테이블에 저장된 데이터는 트랜잭션이 종료되면 삭제됨
sec 49) 트랜잭션 분석/ CRUD 분석 (A)
* 트랜잭션(Transaction) - DB의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산들을 의미, 데이터베이스 시스템에서 병향제어 및 회복작업 시 처리되는 작업의 논리적 단위로 사용된다. 사용자가 시스템에 대한 서비스 요구 시 시스템이 응답하기 위한 상태 변환과정의 작업 단위로 사용
20.5 필기 20.9, 20.8, 20.6
* 트랜잭션의 특성(ACID_앞글자들만 따서)
20.5 필기 20.9, 20.8, 20.6
- Atomicity(원자성) - 트랜잭션의 연산은 DB에 모두 반영되도록 완료(Commit)되든지 아니면 전혀 반영되지 않도록 복구(Rollback)되어야 함
20.5
- Consistency(일관성) - 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환함
20.5
- Isolation(독립성, 격리성, 순차성) - 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행중에 다른 트랜잭션의 연산이 끼어들 수 없음
20.5
- Durability(영속성, 지속성) - 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라도 영구적으로 반영되어야 함
필기 20.9
* CRUD 분석(생성_Create,읽기_Read,갱신_Update,삭제_Delete)
- 프로세스와 테이블 간에 CRUD 매트릭스를 만들어서 트랜잭션을 분석하는 것, CRUD 분석을 통해 많은 트랜잭션이 몰리는 테이블을 파악할 수 있으므로 디스크 구성 시 유용한 자료로 활용
- CRUD 매트릭스 - 2차원 형태의 표로서, 행(Row)에는 프로세스를, 열(Column)에는 테이블을, 행과 열이 만나는 위치에는 프로세스가 테이블에 발생시키는 변화를 표시하여 프로세스와 데이터 간의 관계를 분석하는 표이다. CRUD 매트릭스를 통해 트랜잭션이 테이블에 수행하는 작업을 검증, CRUD 매트릭스의 각 셀에는 Create, Read, Update, Delete의 앞글자가 들어가며, 복수의 변환를 줄 때는 기본적으로 ‘C>D>U>R'의 우선순위를 적용하여 한 가지만 적지만, 활용 목적에 따라 모두 기록할 수 있다. (p213 추가 참고)
필기 20.9
* 트랜잭션 분석
- CRUD매트릭스를 기반으로 테이블에 발생하는 트랜잭션 양을 분석해 테이블에 저장되는 데이터의 양을 유추하고 이를 근거로 DB의 용량 산정 및 구조의 최적화를 목적으로 한다.
- 트랜잭션 분석은 업무 개발 담당자가 수행한다.
- 트랜잭션 분석을 통해 프로세스가 과도하게 접근하는 테이블을 확인할 수 있으며, 이러한 집중 접근 테이블을 여러 디스크에 분산 배치함으로써 디스크 입,출력 향상을 통한 성능 향상을 가져올 수 있다.
- 트랜잭셕 분석서
- 단위 프로세스와 CRUD 매트릭스를 이용해 작성한다.
- 구성요소: 단위 프로세스, CRUD 연산, 테이블명, 컬럼명, 테이블 참조 횟수, 트랜잭션 수, 발생주기 등(p214 추가참고)
sec 50) 인덱스 (B)
* 인덱스(Index) - 데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터구조, 레코드가 저장된 물리적 구조에 접근하는 방법을 제공, 인덱스를 통해 파일의 레코드에 빠르게 액세스 할 수 있음, 레코드 삽입과 삭제가 수시로 일어나는 경우에는 인덱스의 개수를 최소로 하는 것이 효율적.
* 인덱스(Index)의 종류
- 트리 기반 인덱스 - 인덱스를 저장하는 블록들이 트리 구조를 이루고 있는 것
- 비트맵 인덱스 - 인덱스 컬럼의 데이터를 Bit 값인 0 또는 1로 변환하여 인덱스키로 사용하는 방법
- 함수 기반 인덱스 - 컬럼의 값 대신 컬럼에 특정 함수(Function)나 수식(Expression)을 적용하여 산출된 값을 사용하는 것
- 비트맵 조인 인덱스 - 다수의 조인된 객체로 구성된 인덱스
- 도메인 인덱스 - 개발자가 필요한 인덱스를 직접 만들어 사용하는 것
* 클러스터드/넌클러스터드 인덱스
- 클러스터드 인덱스(Clustered Index) - 인덱스 키의 순서에 따라 데이터가 정렬되어 저장되는 방식, 실제 데이터가 순서대로 저장되어 있어 인덱스를 검색하지 않아도 원하는 데이터를 빠르게 찾을 수 있음
- 넌클러스터드 인덱스(Non-Clustered Index) - 인덱스의 키 값만 정렬되어 있고 실제 데이터는 정렬되지 않는 방식, 데이터 삽입, 삭제 발생 시 순서를 유지하기 위해 데이터를 재정렬해야함