데이터베이스 기초

데이터베이스 기초

CS ( Computer Science )/데이터 베이스 2022. 10. 13. 14:05

- 현업에서 많이 사용하는 DB는

관계형 DB (RDB)와 비관계형 DB (NoSQL)로 나눌 수 있다.

관계형 DB

- 일반적으로 많이 알려진 Oracle, Mysql, Mssql 등이 존재

ㆍ이들 중 DB를 활용해본 경험이 있는지 물어보는 것이 기본 시작 질문

- 핵심 개념

ㆍ행(Row), 열(Column), 스키마(Schema)

ㆍ트랜잭션 (Transaction)

ㆍPK, FK, Index

ㆍ정규화

- 관계형 데이터베이스는 키(key)와 값(value)들의 간단한 관계를 테이블화 시킨 매우 간단한 원칙의 전산정보 데이터베이스이다.

- 왜 관계형?

ㆍ각각의 테이블들이 서로 관계를 맺을 수 있기 때문

ㆍTable : Row + Column + Schema

- 열 ( Column )

ㆍ항목의 속성(명칭)을 나타냄

ㆍ각각 정수, 텍스트 같은 데이터 유형을 지정

- 행 ( Row )

ㆍ각 데이터 항목을 저장한다.

- 스키마 ( Schema )

ㆍ필드는 데이터 유형 + 제약사항도 지정할 수 있는데 이러한 제약사항을 스키마라고 부른다.

ㆍ예를 들어 필드는 unique 또는 not null등의 제약사항을 지정할 수 있다.

- Table 예시

ㆍ위 테이블의 문제점이 있다면 무엇일까?

ㆍ어떻게 수정하면 좋을까?

ㆍ주문 테이블 관리자는 이제 고객 번호만 가지고 주문을 처리할 수 있게 되었음

ㆍ테이블을 분리하고 중복 데이터를 제거하는 과정을 ' 정규화 ' 라고 한다.

* 특정 테이블을 주고 정규화를 시켜보는 면접 문제 출제 가능.

제 1,2 정규화 등의 개념은 물어보진 않았음

- 정규화 목적

ㆍ불필요한 데이터를 제거, 중복을 최소화

ㆍ각종 이상 현상(Anomaly) 방지

- Join : 2개 이상의 테이블을 결합해서 한개의 테이블인 것처럼 출력

ㆍINNER JOIN : 조인하는 두 개의 테이블 모두에 데이터가 존재하는 행에 대해서만 출력

ㆍOUTER JOIN : 매칭되는 행이 없어도 결과를 가져오고 매칭되는 행이 없는 경우 NULL로 표시

- 인덱스 (Index)

ㆍDB를 검색 속도를 빠르게 도와주는 역할 ( Binary Tree 방식 )

ㆍ인덱스는 B-Tree 방식 ( binary, 이진법 ) 구조를 사용하는데 이진법으로 0과 1로만 탐색하기 때문에

속도가 빨라서 사용

ㆍ그래서 Select 문의 where, join 에서 좋은 성능을 발휘함

ㆍ대신 insert, update, delete문에서 성능이 떨어짐

* 1. Index를 쓰면 성능이 좋아진다고 했는데, 모든 컬럼에 인덱스를 사용하지 않을까?

* 2. 인덱스는 Binary Tree로 구현한다면 했는데, Hash Table을 사용하면 O(1)의 속도로 접근이 가능한데,

왜 그렇게 사용하지 않았을까?

- Transaction

ㆍ하나의 작업을 수행하기 위해 필요한 데이터베이스의 연산들을 모아놓은 것으로,

데이터베이스에서 논리적인 작업의 단위 ( commit / rollback 개념 숙지 )

ㆍ예시 ) 은행 ATM의 송금

- Transaction 4가지 특성 ( ACID )

ㆍ원자성(Atomicity), 일관성(Consistency), 격리성(Isolation), 지속성(Durability)

- View 란?

ㆍ테이블에 대한 일부 데이터들을 따로 추출한 가상의 테이블

ㆍ실제 데이터가 저장되는 것은 아님

ㆍ따라서 View로 구성된 내용에 대해 Insert, Delete, Update에 제약이 있음

- SQL의 종류

ㆍDML ( Data Manipulation Language ) : Select, Insert, Update, Delete

ㆍDDL ( Data Definition Language ) : Create, Alter, Drop 등

ㆍDCL ( Data Control Language ) : Grant, Revoke

비관계형 DB ( NoSQL )

- 기본적으로 관계형 DB와 반대되는 접근 방식

- 스키마 없음

- 관계 없음

- 대표적으로 MongDB나 CouchDB 등이 있음

- Key, Value로 구성되어 있어서 json 형식과 비슷

- 대용량 데이터 처리에 효과적

- RDB에 비해서 Read, Write가 빠름

- 복잡한 데이터 구조를 표현하기 좋음

- 확장성이 좋음 ( 스키마가 없기 때문 )

- Cf. 위 예시는 Document Database의 특징, 요즘에는 Graph Database 개념도 등장

* 데이터 베이스는 개념과 내부 구현 원리도 파악하기

댓글

ABOUT ME

PHM, who became a Programmer. PHM, who became a Programmer.

관계형 DB

비관계형 DB ( NoSQL )

티스토리툴바