본문 바로가기

IT개념/데이터베이스

[DataBase] 1-1. 데이터베이스의 필요성 및 정의와 특성 이해

728x90

데이터베이스의 필요성

데이터와 정보

데이터(Data)

  • 현실 세계의 관찰, 측정하여 수집한 사실이나 값

정보(Information)

  • 의사 결정을 유용하게 할 수 있도록 데이터를 처리한 결과물

정보처리

  • 데이터에서 정보를 추출하는 과정 또는 방법

정보 시스템과 데이터베이스

정보시스템

  • 조직 운영에 필요한 데이터를 수집해 필요할 때 유용한 정보를 만들어 주는 수단

데이터베이스

  • 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 담당

데이터베이스의 정의와 특징

데이터베이스란?

특정 조직의 여러 사용자가 공유할 수 있도록 통합해서 저장한 운영 데이터의 집합

데이터베이스 4대 정의 요소

  • 공유데이터: 특정 조직 여러 사용자가 함께 소유하고 사용할 수 있음
  • 통합데이터: 최소한의 중복과 통제 가능한 중복만 허용하는 데이터
  • 저장데이터: 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
  • 운영데이터: 조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터

데이터베이스의 특징

  • 실시간 접근성: 사용자 데이터 요구에 실시간 응답
  • 계속 변화: 데이터 변경이 항상 유지됨
  • 동시 공유: 데이터 동시 사용
  • 내용 기반 참조: 주소나 위치가 아닌 내용으로 참조

데이터의 분류

정형 데이터(structured data)

  • 구조화된 데이터, 정해진 구조에 따라 저장된 데이터
  • 엑셀의 스프레드시트, 관계 데이터베이스의 테이블

반정형 데이터(semi-structured data)

  • 구조에 따라 저장되었지만 데이터 내용 안에 구조와 함께 구조에 대한 설명이 함께 존재한다. (SKIMA = METADATA)
  • 구조를 파악하는 파싱(parsing) 과정이 필요
  • 보통 파일 형태로 저장
  • 예: 웹에서 데이터를 교환하기 위해 작성하는 HTML, XML, JSON 문서나 웹 로그, 센서 데이터 등

비정형 데이터(unstructured data)

  • 정해진 구조가 없이 저장된 데이터
  • 예: 소셜 데이터의 텍스트, 영상, 이미지 , 워드 PDF 문서와 같은 멀티미디어 데이터