티스토리 뷰

1. 데이터베이스 & SQL

1) 의미

데이터베이스 = 구조화된 데이터의 모임

2) 구조

데이터베이스는 테이블로 구조화되어있으며, 테이블은 행(observation), 열(feature)로 구성된다. 각 테이블은 특정 열의 조합으로 구성된다.

3) 종류

  • RDB : 관계형 데이터베이스. 행, 열로 구조화되어있다.(=SQL을 통해 조회 가능하다), MySQL, MariaDB, Oracle 등
  • NoSQL : 문서(document) 개념으로 데이터를 바라본다. 대용량 데이터 처리에 용이하다. MongoDB, Hbase, Casandara 등

4) 데이터베이스와 서버

  • 서버 : 특정 목적을 위해 설정된 컴퓨터
  • DB서버 / 웹 서버 / 도메인 서버 등이 있다.
  • 웹서버 : 클라이언트(ex. 웹 브라우저 등)로부터 HTTP 요청을 받고 웹 페이지를 반환하는 서버
    최근 클라우드 서비스를 활용해서 사용자 환경 밖에서 서비스, 컴퓨터 자원을 사용하고 이에 대한 비용을 지불한다.
  • 데이터베이스 서버 : 데이터베이스 서비스를 다른 컴퓨터나 컴퓨터 프로그램에 제공하는 서버

5) SQL

데이터베이스에 접근하고, 조작하는 언어

6) DB GUI 툴

SQL을 사용하기 쉽게 만들어 놓은 환경, MySQL Workbench 등

7) SQL 쿼리 작성법

  • 문법, 작성법 숙지하기
  • 절차 고민하기 : 정확성과 속도를 위해 어떤 데이터가 필요하고, 어떤 형식으로 가공/결합해 추출할지 절차를 생각!
    요청사항 > 데이터 탐색, 쿼리 작성
  • 데이터 정합성과 정확성
    • 정합성 : 다양한 데이터베이스 내에 불일치가 없는 상태
    • 확보하는 방법
      • 부분 합과 전체 합 비교 : 전체 > 부분 진행 시 반드시 확인
      • 분석하기 편한 형태로 데이터 가공
      • Review : 쿼리 리뷰하기

 

 

기타

github에서 csv파일 다운로드 받기 : raw file에서 ctrl + s

 

출처 : SQL로 맛보는 데이터 전처리 분석

 

'데이터 공부' 카테고리의 다른 글

도서] 그로스 해킹  (0) 2023.10.11
[도서] Data-Driven UX  (1) 2023.06.04
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/06   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함