Rei’s Tech diary

Chapter 2. IT프로젝트 정보시스템 구축관리 본문

정보처리기사/[5] 정보시스템 구축관리

Chapter 2. IT프로젝트 정보시스템 구축관리

Reiger 2022. 3. 30. 23:06

[1] 네트워크 구축관리

 

#. 네트워크 관련 신기술 

기술 설명
Wi-Sun
˙ 스마트 그리드와 연계하여 전기, 수도, 가스 등의 공급자와 사용자가 무선 네트워크를 이용하여 효율적으로 관리할 수 있도록 활용하는 IEEE 802.15.4 표준 기반의 무선 통신 기술
˙ Wi-SUN은 저가격 및 저전력(8mA), 통신사 제공 서비스가 아닌 자체 자가망 구축 형태의 비면허대역을 사용
NFC ˙ 13.56MHz 주파수를 사용하고, 424Kbps의 속도로 데이터를 전송하는 RFID의 확장 기술로, 10cm 이내에서 저전력, 비접촉식 무선 통신 기술
˙ 고주파(HF)를 이용하는 ISO/IEC 18092 표준으로 아주 가까운 거리에서 양방향 통신을 지원
스몰 셀
(Small Cell)
˙ 기존의 높은 전송 파워와 넓은 커버리지를 갖는 매크로 셀과 달리 낮은 전송 파워와 좁은 커버리지를 가지는 소형 기지국
˙ 기존의 매크로 셀과 다양한 스몰 셀 및 Wi-Fi 등으로 구성된 네트워크로 사용자 수와 트래픽 수요에 따라 스몰 셀을 배치하여 셀 용량과 커버리지 증대에 활용
SON
(Self Organizing
Network)
˙ 모바일 무선 접속 네트워크의 계획, 구성, 관리, 최적화, 문제 수정을 더 간단하고 빠르게 만들기 위해 설계된 자동화 기술
˙ 노드 간 상호작용으로 자발적 환경적응, 최적화하는 자율적 네트워크 기술
블루투스 ˙ 2.4Hz ISM 주파수 대역을 이용하여 10m 이내의 근거리 디바이스 간 통신을 지원하기 위한 무선 접속 규격
˙ 피코넷은 마스터와 슬레이브 방식으로 링크를 설정하고, 한대의 마스터로 7개까지의 슬레이브를 연결하여 네트워크를 구성할 수 있도록 하는 방식
˙ 스캐터넷은 피코넷이 여러 개 모여서 계층적이고 규모가 큰 네트워크를 구성할 수 있는 방식
BLE
(Bluetooth Low
Energy)
˙ 저전력 기반 기기 간 근거리 무선 통신 기능을 제공하는 기술 및 규격
˙ 짧은 거리를 극복하고,  1Mbps의 전송속도로 2.4GHz 주파수를 사용하는 저비용으로 구성 가능한 블루투스 기술
애드 혹 네트워크
(Ad-hoc Network)
˙ 고정된 기반 망의 도움 없이 이동 노드 간에 자율적으로 구성되는 망
˙ 네트워크에 자율성과 융통성을 부여한 네트워크
매시 네트워크
(Mash Network)
˙ 기존 무선 랜의 한계 극복을 위해 등장
˙ 대규모 디바이스의 네트워크 생성에 최적화되어 차세대 이동통신, 홈 네트워킹, 공공 안전 등의 특수목적을 위한 새로운 방식의 네트워크 기술
UWB
(Ultra Wide Band)
˙ 매우 낮은 전력을 사용하며, 초광대역 주파수 대역으로 디지털 데이터를 전송하는 무선 전송 기술
˙ 무선 디지털 펄스라고도 하며, 0.5m/W 정도의 저전력으로 많은 데이터를 1Km의 거리까지 전송 가능
UsN
(Ubiquitous Sensor
Network)
˙ 통신 기능이 있는 스마트 RFID 태그 및 센서를 부착
˙ 사물의 인식정보 및 주변의 환경정보를 탐지, 실시간으로 네트워크에 연결하여 정보를 관리하는 기술
WBAN
(Wireless Body Area
Network)
˙ 체내 혹은 인체 주변 3m 이내에서 일어나는 저비용, 저전력, 고속통신이 가능한 신체 접촉 근거리 무선 네트워크
NDN
(Named Data
Networking)
˙ 기존의 IP 주소 대신 Data의 이름을 활용하여 정보(콘텐츠)의 효율적인 검색 및 배포를 목적으로 하는 미래 인터넷 기술
네트워크 슬라이싱
(Network Slicing)
˙ 하나의 물리적 코어 네트워크를 독립된 다수 가상 네트워크로 분리한 뒤 고객 맞춤형 서비스를 제공하는 5G 핵심 기술
˙ SDN과 NFV 기술을 활용하여 하나의 물리적인 망에 여러 개의 논리적인 망을 만들어 비용 절감 가능
NOMA
(Non-Orthogonal
Multiple-Access)
˙ 동일한 시간, 주파수, 공간 지원상에 두 대 이상의 단말에 대한 데이터를 동시에 전송하여 주파수 효율을 향상시키는 비직교 다중 접속 기술
MEC
(Mobile Edge
Computiong/Cloud)
˙ 무선 기지국에 분산 클라우드 컴퓨팅 기술을 적용하여 서비스와 캐싱 콘텐츠를 이용자 단말에 가까이 전개함으로써 모바일 코어 망의 혼잡을 와해하는 기술
사물 인터넷
(IoT)
˙ 각종 사물에 센서와 통신 기능을 내장하여 무선 통신을 통해 각종 사물을 인터넷에 연결하는 기술
MQTT ˙ IoT 장치, 텔레메트리 장치 증에서 최적화되어 사용할 수 있도록 개발된 프로토콜
˙ 브로커를 사용한 발행, 구독 방식의 경량 메시징을 전송하는 프로토콜
COAP ˙ M2M 노드들 사이에서 이벤트에 대한 송수신을 비동기적으로 전송하는 REST 기반의 프로토콜이자 제약이 있는 장치들을 위한 특수한 인터넷 애플리케이션 프로토콜
Zigbee ˙ 근거리 통신을 지원하는 IEEE 802.15.4 표준 중 하나
˙ 저전력, 저속, 저비용의 근거리 무선통신 기술
스마트 그리드
(Smart Grid)
˙ 전기 및 정보통신기술을 활용하여 전력망을 지능화, 고도화함으로써 고품질의 전력서비스를 제공하고 에너지 이용효율을 극대화하는 전력망

 

#. 네트워크 설치 구조

1) 버스(Bus)형 구조

- 버스형 구조는 하나의 네트워크 회선에 여러 개의 노드가 멀티 포인트로 연결된 구조 형태

- 구조가 간단, 설치 용이, 비용 저렴

- 네트워크 회선에 노드 추가 및 삭제 용이

- 노드를 무분별하게 추가할 경우 네트워크 성능 저하

- 네트워크 회선의 특정 부분 고장 시 전체 네크워크에 영향을 끼침

 

2) 트리(Tree)형 구조

- 트리형 구조는 각 노드가 계층적으로 연결되어 있는 구성 형태로 나뭇가지가 사방으로 뻗어 있는 것과 유사한 모양의 구조 형태

- 허브만 준비되어 있다면 많은 단말 노드를 쉽게 연결할 수 있음

- 모든 네트워크가 허브를 통해서만 이루어지므로 스타형처럼 허브가 고장나면 연결된 단말 노드의 네트워크가 제한됨

 

3) 링(Ring)형 구조

- 링형 구조는 모든 노드가 하나의 링에 순차적으로 연결되는 형태

- 네트워크 회선에 단말 노드를 추가하거나 삭제하는 등의 네트워크 재구성 용이

- 링의 어느 한 부분에 장애가 발생하면 전체 네트워크에 영향

 

4) 성(Star)형 구조

- 성형 구조는 각 단말 노드가 허브라는 네트워크 장비에 점 대 점으로 연결되어 있는 구성 형태

- 소규모의 네트워크 설치 및 재구성이 간편

- 중앙 허브가 고장이 나면 전체 네트워크에 영향

 

#. 네트워크 장비 유형

 

①  스위치 장비

- OSI 2계층에서 사용하는 네트워크 장비

- 출발지에서 들어온 목적지 MAC 주소 기반으로 빠르게 포워드하는 인터 네트워킹 장비

 

② 라우터 장비

- OSI 3계층에서 사용하는 네트워크 장비

- 스위치를 서로 연결해서 네트워크 간 비용 소모가 최적화된 라우팅 경로를 설정, 결정된 경로를 따라 트래픽을 전달하는 역할

 

▼ 라우팅 프로토콜

프로토콜 알고리즘 특징
RIP 거리 벡터 알고리즘,
Bellman-Ford 알고리즘
˙최대 홉 수를 15개로 제한
˙ 사용 포트로는 UDP를 사용
˙ 30초마다 전체 라우팅 정보를 브로드캐스팅
OSFP 링크 상태 알고리즘,
다익스트라 알고리즘
˙ 최소 지연, 최대 처리량 등 관리자가 라우팅 메트릭 지정
˙ AS를 지역으로 나누어 라우팅을 효과적으로 관리
˙ 홉 카운트에 제한 없음
BGP 벡터 알고리즘 ˙ ISP 사업자들 상호 간에 주로 사용되는 라우팅 프로토콜
˙ 순환을 피할 수 있도록 목적지까지 가는 경로 정보를 제공
˙ CPU 부하가 크고, 라우팅 테이블 크기가 커서 메모리 사용량이 많음

 

③ 광전송 장비

- 네트워크 스위칭 노드를 묶어 주는 시스템으로 광케이블을 이용하여 비교적 긴 거리의 데이터 전송에 이용

 

▼ 광전송 기술 ★

기술 구분 설명
SONET ˙ 고속 디지털 통신을 위한 광전송 시스템 표준 규격
˙ 광전송용 동기식 다중화 방식에 의한 디지털신호계위 북미 표준
SDH ˙ 북미 표준인 SONET을 기초로 동기식 디지털 다중화 신호계위에 관한 ITU 국제 표준 규격
˙ 자체 복구 기능과 SDH 프레임 내에 충분한 오버헤드 확보가 가능한 기술
WDM ˙ 파장이 서로 다른 복수의 광신호를 동시에 이용, 광섬유를 다중화하는 방식
˙ 빛의 파장 축과 파장이 다른 광선은 서로 간섭을 일으키지 않는  성질을 이용
DWDM ˙ 대용량 데이터 전송을 위하여 파장 대역 채널을 조밀하게 나누어 규격한 광전송 기술
˙ 일정 파장 대역에 걸쳐 수십, 수백개 파장의 광 신호를 동시에 변조
CET ˙ 광역통신망에서 고속으로 데이터를 전달하고 교환하는 차세대 패킷 전송 기술

 

④ 액세스 장비

- 액세스 장비는 최종 사용자와 공중 네트워크를 연결해주는 시스템

- 코어 네트워크와 최종 사용자를 연결하는 액세스 망은 망 포설 및 유지보수에 많은 비용이 들어가기 때문에 네트워크 투자의 큰 비중을 차지

 

⑤ 이동 통신 장비

- 기지국

- 제어국

- 교환기

 

⑥ 다중화기

- 다중화기는 하나의 회선을 통해 일정한 시간이나 주파수로 나누어서 전송하게 하는 장비

- 주파수 분할 다중화, 시간 분할 다중화 코드 분할 다중화 등.

 

[2] SW 구축관리

 

#. 인공지능 (AI)

- 인공지능은 인간의 지적능력을 인공적으로 구현하여 컴퓨터가 인간의 지능적인 행동과 사고를 모방할 수 있도록 하는 소프트웨어이다.

 

#. 기계학습 (Machine Learning)

- 기계학습은 인공지능의 분야 중 하나로, 인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술

- 환경과의 상호작용에 기반한 경험적인 데이터로부터 스스로 성능을 향상시키는 시스템을 연구하는 기술

 

▼ 기계학습에 대한 분류

분류 설명 사례
지도(교사)학습 ˙ 입력 X에 대한 출력 목푯값을 제시하여 학습
˙ 입출력의 쌍으로 구성된 학습 예제들로부터 입력을 출력으로 사상하는 함수를 학습
신경망, 회귀분석
비지도(비교사)학습 ˙ 입력 X에 대해 목푯값을 스스로 추론하여 학습
˙ 입력은 주어지나 대응되는 출력이 없으며, 입력 패턴들의 공통적인 특성을 파악하는 것의 학습의 목적
k-Means 알고리즘,
주성분 분석
강화학습 ˙ 입력 X에 대해 행위의 포상을 기억하고 학습
˙ 감독 학습과 무감독 학습의 중간 형태로서, 입력에 대해 학습자가 행동을 선택하고 그 행동에 대해서 교사가 제공하는 보상치에 따라서 학습하는 방법
Q-Learning,
몬테카를로 트리 탐색

 

▼ 기계학습 모델

모델 설명
인공신경망 기계학습과 인지과학에서 생물학의 신경망에서 영감을 얻은 통계학적 학습 알고리즘
회귀 분석 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법
K-Means 알고리즘 데이터 집단을 K개의 임의의 집단으로 군집화, 집단의 거리를 측정하여, 더 이상 이동하지 않는 그룹으로 군집화
주성분 분석(PCA) 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 알고리즘
Q-learning 특정 상태에서 취할 수 있는 각 행동에 대해 효용 값을 미리 계산하여 마르코프 의사결정 과정에서 최적의 정책을 찾는 강화학습 기법
몬테카를로 트리 탐색 최소, 최대 알고리즘의 성능을 개선하여 전체 경로 탐색이 불가능 할 때 효율적 경로 탐색이 가능한 알고리즘

 

▼ 딥러닝 주요 알고리즘

알고리즘 설명
심층신경망
(DNN)
입력 계층과 출력 계층 사이의 다단계의 은닉계층을 통해서 비선형 관계에 대한 모델링이 가능한 인공신경망
합성곱 신경망
(CNN)
필터에 대한 컨볼루션과 서브 샘플링 과정을 반복하는 비지도 학습으로 입력 데이터의 특징을 극대화하면서 차원을 축소하는 딥러닝 알고리즘
순환 신경망
(RNN)
연속된 데이터상에서 이전 순서의 은닉 노드의 값을 저장한 이후, 다음 순서의 입력 데이터로 학습할 때 이전의 값을 이용, 연속적인 정보의 흐름을 학습에 이용하는 딥러닝 알고리즘

 

① 가상 현실 (VR)

- 가상 현실은 컴퓨터 등을 사용한 인공적인 기술로 만들어낸 실제와 유사하지만 실제가 아닌 어떤 특정한 환경이나 상황 혹은 그 기술 자체를 의미

 

② 증강 현실 (AR)

- 증강 현실은 가상 현실의 한 분야로 실제로 존재하는 환경에 가상의 사물이나 정보를 합성하여 마치 원래의 환경에 존재하는 사물처럼 보이도록 하는 컴퓨터 그래픽 기술

 

③ 혼합 현실 (MR)

- 혼합 현실은 실세계의 물리적 환경과 가상환경을 혼합한 경험을 제공하는 하이브리드 현실

- 실시간으로 현실과 가상에 존재하는 것 사이에서 실시간으로 상호작용할 수 있는 것을 말할 때 혼합 현실이라는 개념 사용

 

#. 블록체인 (Block Chain)

- 블록체인은 분산 데이터베이스의 한 형태로 분산 노드의 운영자에 의한 임의조작이 불가능 하도록 고안되어 지속적으로 성장하는 데이터 기록 리스트인 블록을 연결한 모음

 

1) 블록체인 동작 과정

- 거래

- 암호화

- 상호연결

- 분산저장

 

2) 블록체인 주요 기술

- 분산원장

- 공개키 기반 구조

- 암호화 해시

- 스마트 계약

- 합의 알고리즘

- 분산 애플리케이션

 

3) 블록체인 합의 알고리즘 : 모든 참여자들이 데이터의 적합성을 판단하고 동의하는 과정

알고리즘 설명
PoW ˙ 확률적으로 해답이 어려운 문제를 가장 빨리 해결한 사람에게 블록을 만들 수 있도록 허가하는 합의 알고리즘
PoS ˙ 이더리움이 채택할 예정인 알고리즘으로 PoW와 기본 방식은 동일하나 화폐량을 더 많이 소유하고 있는 승인자가 우선하여 블록을 생성할 수 있는 알고리즘
PBFT ˙ 참가자 중 1명이 Primary(리더)가 되어 자신을 포함한 모든 참가자에게 요청을 보내고 그 요청에 대한 결과를 집계한 뒤 다수의 값을 사용해 블록을 확정하는 합의 알고리즘
˙ PoS와 PoW의 단점인 파이널리티 불확실성과 성능 문제를 해결한 알고리즘

 

4) BaaS(Blockchain-as-a-Service)

- BaaS는 블록체인 개발환경을 클라우드로 서비스하는 개념으로 블록체인 네트워크에 노드의 추가 및 제거가 용이

- BaaS는 블록체인의 기본 인프라를 추상화하여 블록체인 응용 프로그램을 만들 수 있는 클라우드 컴퓨팅 플랫폼

 

[3] HW 구축관리

 

#. 클라우딩 컴퓨팅

- 클라우드 컴퓨팅은 인터넷을 통해 가상화된 컴퓨터 시스템 리소스를 제공, 정보를 자신의 컴퓨터가 아닌 클라우드에 연결된 다른 컴퓨터로 처리하는 기술

 

▼ 클라우드 컴퓨팅 분류

관련법규 주요 내용
사설 클라우드
(Private Cloud)
˙ 기업 또는 조직 내부에서 보유하고 있는 컴퓨팅 자원을 사용하여 내부에 구축되어 운영되는 클라우드
˙ 자체 컴퓨팅 자원으로 모든 하드웨어, 소프트웨어, 데이터를 수용
˙ 직접적인 통제가 가능하며 보안성을 높일 수 있음
공용 클라우드
(Public Cloud)
˙ 클라우드 서비스 제공 업체에서 다중 사용자를 위한 컴퓨팅 자원 서비스를 제공하는 클라우드
˙ 일정한 비용을 지불하고 하드웨어, 소프트웨어 등을 사용
˙ 확장성, 유연성 등이 뛰어남
하이브리드 클라우드
(Hybrid Cloud)
˙ 기업 또는 조직 내부 자원을 이용한 사설 클라우드의 공용 클라우드를 모두 사용하는 클라우드
˙ 사설 클라우드의 약점인 구축 비용 문제와 공용 클라우드의 약점인 보안성 확보 문제를 해결

 

▼ 클라우드 서비스 유형

유형 설명
인프라형 서비스
(IaaS)
˙ 서버, 스토리지 같은 시스템 자원을 클라우드로 제공하는 서비스
˙ 컴퓨팅 자원에 운영체제나 애플리케이션 등의 소프트웨어 탑재 및 실행
˙ 하위의 클라우드 인프라를 제어하거나 관리하진 않지만 스토리지, 애플리케이션에 대해서는 제어권을 가짐
플랫폼형 서비스
(PaaS)
˙ 인프라를 생성, 관리 하는 복잡함 없이 애플리케이션을 개발, 실행, 관리할 수 있게 하는 플랫폼을 제공하는 서비스
˙ SaaS의 개념을 개발 플랫폼에도 확장한 방식으로 개발을 위한 플랫폼을 구축할 필요 없이, 필요한 개발 요소를 웹에서 빌려 쓸 수 있게 하는 모델
소프트웨어형 서비스
(SaaS)
˙ 소프트웨어 및 관련 데이터는 중앙에 호스팅, 사용자는 웹 브라우저 등의 클라이언트를 통해 접속하여 소프트웨어를 서비스 형태로 이용하는 서비스
˙ 주문형 소프트웨어라고도 함

 

#. SDDC

- SDDC는 모든 라드웨어가 가상화되어 가상 자원의 풀을 구성하고, 데이터 센터 전체를 운영하는 소프트웨어가 필요한 기능 및 규모에 따라 동적으로 자원을 할당, 관리하는 역할을 수행하는 데이터센터

 

#. SDDC 특징

- 컴퓨팅, 네트워킹, 스토리지, 관리 등을 모두 소프트웨어로 정의

- 인력 개입 없이 소프트웨어 조작만으로 자동 제어 관리

- 데이터센터 내 모든 자원을 가상화하여 서비스

 

#. 저장 장치(스토리지 시스템)

- 정보 시스템 구축 및 운영을 위해서는 많은 저장 공간의 확보가 필요

- 대용량 데이터를 저장하기 위한 장치가 스토리지 장치

- 스토리지 장치에는 DAS, NAS, SAN이 있음

 

① DAS

- DAS는 하드 디스크와 같은 데이터 저장 장치를 호스트 버스 어댑터에 직접 연결하는 방식으로 구성

- 저장 장치와 호스트 기기 사이에는 네트워크 디바이스가 있지 말아야 하고 직접 연결하는 방식으로 구성된 기술

 

② NAS

- NAS는 서버와 저장 장치를 네트워크로 연결하는 방식으로 구성된 기술

- 별도의 운영 체제를 가진 서버 한 곳에 파일을 관리하기 때문에 서버 간에 스토리지 및 파일 공유가 용이

- 저장 장치와 서버를 직접 연결하는 것이 아니라 네트워크를 통해 스토리지에 접속, 파일단위로 관리.

 

③ SAN

- SAN은 서버와 스토리지를 저장 장치 전용 네트워크로 상호 구성하여 고가용성, 고성능, 융통성, 확장성을 보장하고 데이터를 블록 단위로 관리하는 기술

- DAS + NAS 장점을 합친 방식, 광 케이블 및 광 채널 스위치를 통해 근거리 네트워크 환경을 구성하여 빠른 속도로 데이터를 처리할 수 있으며, 스토리지 공유가 가능한 기술

- 각기 다른 운영체제를 가진 여러 기종이 네트워크상에서 동일 저장 장치의 데이터를 공유하게 함으로써, 여러 개의 저장 장치나 백업 장비를 단일화시킬 수 있다.

- 무정지 확장성, 고성능, 관리 효율성이 높다.

- 비용이 높은 단점이 있다.

 

#. 백업의 유형

구분 유형 설명

데이터 범위
측면

전체 백업 ˙ 데이터의 전체에 대해 백업 실시
차분 백업 ˙ 전체 백업 이후로 다음 전체 백업이 실시되기 직전까지 이전 전체 백업 이후 변화된 데이터를 모두 백업
˙ 언제나 마지막 전체 백업 본에서 달라진 부분만 백업
증분 백업 ˙ 차분 백업과 유사하나 전체 백업 이후 변경분이 누적되어 백업


백업
주기


일일 백업 ˙ 데이터베이스 데이터, 로그를 매일 백업
주간 백업 ˙ 매주 지정된 요일에 실시
˙ 주로 운영 서버의 자원 사용률이 낮은 주말에 수행
월간 백업 ˙ 시스템 예방 점검과 연계, 월 1회 이상의 시스템 점검과 월간 전체 백업 실시
연간 백업 ˙ 매년 말이나 다음해 초에 실시, 1년/5년/10년과 같이 장기보관이 목적
임시/수시 백업 ˙ 주요 변경 작업 전 또는 설치 작업 완료 후에 실시하는 백업

#. 고가용성(HA)

- 고가용성은 두 개 이상의 시스템을 클러스터로 구성하여 하나의 시스템이 장애 시 최소한의 서비스 중단을 위해 다른 시스템으로 신속하게 시스템 대체 작동하는 기술

- 서비스 고정시간 최소화, 가용성 극대화, 비즈니스 연속성 확보, 수익성 최대화

 

▼ 고가용성 유형

유형 설명
Hot Stanby ˙ 가동 시스템과 백업 시스템으로 구성
˙ 평상시에는 대기 상태를 유지하다가 장애 시 전환
Mutual Take Over ˙ 2개 시스템이 각각의 고유한 가동 업무 서비스 수행하다가 한 서버 장애 발생 시 상대 시스템의 자원을 페일오버 하여 동시에 2개의 업무를 수행하는 방식
Concurrent Access ˙ 여러 개의 시스템이 동시에 업무를 나누어 병렬처리 하는 방식
˙ HA에 참여하는 시스템 전체가 Active한 상태로 업무를 수행
˙ 한 시스템에 장애가 발생해도 다른 시스템으로 Fail Over 하지 않고 가용성을 보장

 

[4] DB 구축관리

#. 빅데이터(Big Data)

- 빅데이터는 시스템, 서비스, 조직(회사) 등에서 주어진 비용,  시간내에 처리 가능한 데이터 범위를 넘어서는 수십 페타 바이트 크기의 비정형 데이터이다.

 

#. 빅데이터의 특성 (3V)

특성 설명
데이터의 양
(Volume)
˙ 페타 바이트 수준의 대규모 데이터
˙ 빅데이터 분석 규모에 관련된 특성
˙ 디지털 정보량이 기하급수적으로 폭증하는 것을 의미
데이터의 다양성
(Variety)
˙ 정형, 비정형, 반정형의 다양한 데이터
˙ 빅데이터 자원 유형에 관련된 특성
˙ 로그, 소설, 위치 등 데이터 유형이 다양해지는 것을 의미
데이터의 속도
(Velocity)
˙ 빠르게 증가하고 수집되며, 처리되는 데이터
˙ 빅데이터 수집, 분석, 활용 속도와 관련된 특성
˙ 가치 있는 정보 활용을 위해 실시간 분석이 중요해지는 것을 의미

 

#. 빅데이터 기술

구분 기술 설명
비정형 데이터 수집 척와
(Chukwa)
˙ 분산된 각 서버에서 에이전트를 실행하고, 컬렉터(Collector)가 에이전트로부터 데이터를 받아 HDFS에 저장
정형 데이터 수집 스쿱
(Sqoop)
˙ 커넥터(Connector)를 사용하여 관계형 데이터베이스 시스템에서 HDFS로 데이터를 수집
분산 데이터 저장 HDFS ˙ 대용량 파일을 분산된 서버에 저장하고, 그 저장된 데이터를 빠르게 처리할 수 있게 하는 하둡 파일 시스템
하둡
(Hadoop)
˙ 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼
˙ 일반 PC급 컴퓨터들로 가상화된 대형 스토리지를 형성하고 그 안에 보관된 거대한 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트웨어 프레임워크로 구글, 야후 등에 적용 
분산 데이터 처리 맵리듀스
(Map
Reduce)
˙ 구글에서 대용량 데이터를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년 발표한 소프트웨어
분산 데이터 베이스 HBase ˙ 컬럼 기반 저장소로 HDFS와 인터페이스 제공
데이터 가공
피그
(Pig)
˙대용량 데이터 집합을 분석하기 위한 플랫폼으로 하둡을 이용하여 맵리듀스를 사용하기 위한 높은 수준의 스크립트 언어인 피그 라틴이라는 자체 언어를 제공
하이브
(Hive)
˙ 하둡 기반의 DW 솔루션
˙ SQL과 매우 유사한 HiveAL이라는 쿼리를 제공
데이터 분석 및 시각화 R ˙ 통계 프로그래밍 언어인 S 언어를 기반으로 만들어진 오픈 소스 프로그래밍 언어

 

#. NoSQL

- NoSQL은 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS이다.

 

#. NoSQL의 특성

- Basically Available

- Soft-State

- Eventually Consistancy

 

#. NoSQL의 유형

- Key-Value Store

- Column Family Data Store

- Docment Store

- Graph Store

 

#. DB 관련 신기술

기술 설명
데이터 마이닝
(Data Mining)
˙ 빅데이터 분석 기술 중 대량의 데이터를 분석하여 데이터 속에 있는 변수 사이의 상호관계를 규명하여 일정한 패턴을 찾아내는 기법
데이터 웨어하우스
(DW)
˙ 사용자의 의사 결정에 도움을 주기 위하여, 기간 시스템의 데이터베이스에 축적된 데이터를 공통 형식으로 변환해서 관리하는 데이터베이스
데이터 마트
(DM)
˙ DW 환경에서 정의된 접근계층으로, 데이터 웨어하우스에서 데이터를 꺼내 사용자에게 제공하는 역할
˙
데이터 웨어하우스의 부분이며, 대게 특정한 조직 혹은 팀에서 사용하는 것을 목적으로 함
메타 데이터
(Meta Data)
˙ 데이터에 대한 구조적인 데이터로서 일련의 데이터를 정의하고 설명해 주는 데이터이고, 구축할 정보 자원을 기술하는 데이터
디지털 아카이빙
(Digital Archiving)
˙ 지속적으로 보존할 가치를 가진 디지털 객체를 장기간 관리하여 이후의 이용을 보장할 수 있도록 변환, 압축 저장하여 DB화하는 작업
마이 데이터
(MyData)
˙ 정보 주체가 기관으로부터 자기 정보를 직접 내려받아 이용하거나 제3자 제공을 허용하는 방식으로 정보 주체 중심의 데이터 활용체계
˙ 개인이 정보 관리의 주체가 되어 능동적으로 본인의 정보를 관리하고, 본인의 의지에 따라 신용 및 자산관리 등에 정보를 활용하는 일련의 과정

 

#. 데이터베이스 무결성

- 데이터베이스 무결성은 데이터의 정확성(중복과 누락이 없는 성질)과 일관성(원인과 결과의 연속성)이 보장된 상태를 말한다.

 

#. 데이터베이스 보안이 추구하는 3대 요소

- 기밀성 (Confidentiality)

- 무결성 (Integrity)

- 가용성 (Availability)