정규화
·
Computer Science/Database
정규화란?정규화(Normalization)는 관계형 데이터베이스에서 데이터를 구조화하여 데이터 중복을 최소화하고 무결성을 보장하기 위한 과정이다. 주요 목적은 다음과 같다.데이터 중복 제거저장 공간 효율적 사용데이터 일관성 유지데이터 갱신 시 이상 현상 방지 하지만 정규화 진행 시 다음과 같은 단점이 발생할 수 있다.복잡한 쿼리 : 여러 테이블로 분할되어 쿼리가 복잡해질 수 있다.성능 저하 : 높은 정규화로 인해 일부 쿼리의 성능이 저하될 수 있다. (JOIN 연산같은 경우 성능 저하 요인이 됨.)  정규화는 1NF, 2NF, 3NF, BCNF, 4NF, 5NF가 있다. 순서대로 살펴보자.   제 1 정규형 (1NF)모든 열이 원자값(Atomic Value)을 가져야한다.각 컬럼은 유일한 이름을 가져야하..
SQL과 NoSQL
·
Computer Science/Database
SQL정의SQL은 Structured Query Language의 약자이다.SQL 데이터베이스는 구조화된 데이터를 관계형 모델로 관리하는 데이터베이스 시스템으로, SQL을 사용해 데이터를 정의하고 조작한다.  특징스키마 기반. 정해진 스키마에 따라 데이터 저장관계형 데이터 모델로, 테이블 간 관계를 통해 데이터 분산ACID 준수 : 트랜잭션은 원자성(Atomicity), 일관성(Consistency), 고립성(Isolation), 지속성(Durability)을 보장SQL이라는 표준화된 쿼리 언어를 사용. 복잡한 쿼리를 지원주로 수직적 확장 가능.수평적 확장이 어려워 데이터 양이 크게 증가하면 성능 저하 발생할 수 있음 DBMS 예시Mysql : 오픈 소스 RDBMS.Oracle : 상용 RDBMS. 대규..
SQL injection 종류와 방지
·
Computer Science/Database
SQL Injection이란?SQL Injection은 공격자가 웹 애플리케이션의 데이터베이스에 악의적인 SQL 쿼리를 삽입하여 비정상적인 동작을 유도하거나, 데이터를 탈취하거나, 데이터베이스를 손상시키는 공격 기법이다.주로 입력값이 제대로 검증되지 않고 SQL 쿼리에 포함될 때 발생한다. SQL Injection은 여러 유형이 있으며, 각 유형에 따라 공격방법과 피해가 달라진다. 주요 SQL Injection 종류에 대해 살펴보자.   Error based SQL Injection논리적 에러를 활용한 SQL Injection이다.의도적으로 오류를 발생시켜 공격자가 시스템에 대한 정보를 얻을 수 있다.-- 정상적인 쿼리SELECT * FROM users WHERE username = 'admin' AN..
조인(JOIN) - ANSI SQL, MySQL, Oracle 예
·
Computer Science/Database
조인(JOIN)이란? 데이터베이스 조인(Join)은 두 개 이상의 테이블에서 관련된 데이터를 결합하여 하나의 결과 집합으로 만드는 작업이다.조인은 관계형 데이터베이스에서 매우 중요한 기능으로, 데이터 간의 관계를 기반으로 유용한 정보를 추출하는 데 사용된다. 아래의 테이블을 예시로 쿼리와 함께 주요 조인 유형을 설명하겠다. students 테이블 courses 테이블  내부 조인 (Inner Join)내부 조인은 두 테이블에서 일치하는 데이터만 반환-- ANSI SQL, MySQL, OracleSELECT students.name, courses.course_nameFROM studentsINNER JOIN courses ON students.student_id = courses.student_id; ..
트라이(Trie)
·
Computer Science/Data Structure
트라이(Trie)란?트라이는 문자열을 저장하고 효율적으로 탐색하기 위한 트리형태의 자료구조이다.노드의 계층 구조로 구성되며, 각 노드가 문자열의 한 문자 또는 키의 일부를 나타낸다.문자열을 저장할 때, 공통된 접두사는 공유하도록 설계되어 공간 효율성이 높다.   트라이의 구조 루트 노드: 트리의 시작점으로, 문자열 집합에 공통된 접두사가 없는 최상위 노드.자식 노드: 한 문자씩 연결되며, 문자열의 경로를 형성.종료 표시: 단어가 끝날 때 해당 노드에 플래그 또는 값을 설정. (위 그림에서는 빨간 원이 그 역할을 함) 예시) 문자열 ["cat", "car", "dog"]를 트라이에 저장한 경우 (root) / \ c d / \ \ a..
B-Tree와 B+Tree
·
Computer Science/Data Structure
B트리 (B-Tree)정의B트리는 자가 균형 다진 트리(M-ary tree)이다. 즉, 모든 리프의 노드가 같은 depth 를 가지며, 내부 노드가 여러 자식을 가질 수 있다.m은 B트리의 차수이다. 각 노드는 최대 m개의 자식을 가질 수 있다.ㄴ 3차 B트리라고 한다면, m은 3이고 최대 3개의 자식을 가질 수 있다는 것.  구조와 속성루트 노드: (트리가 비어있지 않을 때) 2개 이상, m개 이하의 자식을 가진다. 내부 노드: ⌈m/2⌉개 이상, m개 이하의  자식을 가진다.리프노드: 모든 리프 노드는 동일한 레벨에 있다. 균형 유지노드의 키: 각 노드는 ⌈m/2⌉개 이상, m-1개 이하의 키를 가진다. 정렬된 상태를 유지하고 있어 효율적 탐색이 가능하다.  장단점장점자동으로 균형을 유지하여 검색, ..
트랜잭션(Transaction) & 트랜잭션 격리성
·
Computer Science/Database
트랜잭션(Transaction)이란?DBMS에서 일련의 연산을 논리적인 작업 단위로 묶어 처리하는 개념. 여러 작업을 하나의 단위로 처리.데이터베이스의 무결성 유지를 위함.무결성 : 데이터의 정확성, 일관성, 유효성을 유지하는 것예시) 은행 시스템계좌 A에서 계좌 B로 돈을 이체할 때, A의 잔고 감소와 B의 잔고 증가가 하나의 트랜잭션으로 처리되어야 한다.만약 하나라도 실패하면 전체 트랜잭션이 롤백되어야 한다.    트랜잭션의 특성 (ACID)Atomicty / All or nothing (원자성)트랜잭션의 연산은 모두 성공하거나 모두 실패해야한다.Consistency (일관성)트랜잭션이 수행 결과는 항상 일관되어야 한다.Isolation (고립성/독립성)트랜잭션이 수행되는 동안 다른 트랜잭션의 작업이..
힙(Heap)과 완전이진트리(Complete Binary Tree)
·
Computer Science/Data Structure
완전이진트리(Complete Binary Tree)란?완전이진트리는 이진트리의 일종으로 최대 2개의 자식노드를 가질 수 있다.마지막 레벨을 제외한 모든 레벨이 꽉 차있어야 한다.마지막 레벨은 왼쪽부터 채워져 있어야 한다.완전 이진트리의 예올바른 예틀린 예마지막 레벨을 제외한 모든 레벨이 꽉 채워져 있음.마지막 레벨은 왼쪽부터 채워져 있음.마지막 레벨을 제외한 모든 레벨이 꽉 채워져 있음.하지만 노드 2의 오른쪽 자식이 비워져있음.  완전이진트리 특성노드의 개수: 레벨 h에 있는 노드의 최대 개수는 2^h이다.예를 들어, 루트 레벨(레벨 0)에는 최대 1개의 노드가 있고, 레벨 1에는 최대 2개의 노드, 레벨 2에는 최대 4개의 노드가 있을 수 있다.트리의 높이: 노드의 개수가 n인 완전 이진 트리의 ..
이진탐색트리(Binary Search Tree, BST)
·
Computer Science/Data Structure
이진탐색트리란?이진탐색트리(Binary Search Tree, BST)는 이진 트리의 일종으로 데이터를 효율적으로 저장, 검색, 삽입 및 삭제할 수 있도록 설계된 자료구조이다. 이진탐색트리는 다음과 같은 특징을 가지고 있다.각 노드가 최대 두개의 자식 노드를 가지고 있다.왼쪽 서브트리의 모든 노드의 값은 루트 노드의 값보다 작다.오른쪽 서브트리의 모든 노드의 값은 루트 노드의 값보다 크다.중복 요소는 허용하지 않는다.왼쪽 및 오른쪽 서브트리도 각각 이진탐색트리여야 한다.  이진탐색트리의 연산탐색 (Search)root 노드부터 탐색 시작현재 위치의 값과 비교하여 찾고자 하는 key 가 작으면 왼쪽 서브트리로, 오른쪽 서브트리로 재귀.일치하는 값을 찾을 때까지 절차 반복.리프노드에 도달할 때 까지 검색 값..