04.04.2013 Views

6장 OLTP, OLAP, 데이터마이닝

6장 OLTP, OLAP, 데이터마이닝

6장 OLTP, OLAP, 데이터마이닝

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong><br />

박창이<br />

서울시립대학교 통계학과<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 1 / 11


온라인 트랜잭션<br />

여러 과정(연산)으로 이루어진 하나의 단위 프로세스로<br />

데이터베이스 처리의 논리적 단위<br />

(예) 일반예금 통장에서 10,000을 정기예금 통장으로 이체하는<br />

경우<br />

과정 1: 일반예금 통장에서 10,000을 감소시킴<br />

UPDATE account<br />

SET amount = amount - 10000<br />

WHERE accountID=‘146823-64-200437’<br />

과정 2: 정기예금 통장에 10,000을 증가시킴<br />

UPDATE account<br />

SET amount = amount + 10000<br />

WHERE accountID=‘300087-12-400191’<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 2 / 11


데이터의 무결성을 유지하기 위해 처리도중 어떤 문제(프로그램<br />

오류, 시스템 장애 등)가 발생하면 모든 변경내용을 취소<br />

(예)에서 과정 2가 실패한 경우 과정 1을 취소: 트랜잭션 단위의<br />

처리<br />

데이터베이스 시스템은 온라인 거래 처리(online transaction<br />

processing; <strong>OLTP</strong>) 시스템이라 함<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 3 / 11


온라인 트랜잭션: 트랜잭션의 속성<br />

원자성(atomicity): 하나의 트랜잭션을 구성하는 단위작업들은<br />

모두 수행되든지 아니면 모두 수행되지 않아야 함<br />

일관성(consistency): 데이터베이스 일관성을 보장해야 함<br />

고립성(isolation): 여러 트랜잭션을 동시에 수행하는 경우에 서로<br />

간섭받지 않아야 함. DBMS는 동시성 제어(concurrent control)<br />

또는 잠금(locking)등을 이용하여 고립성을 보장<br />

지속성(durability): 완료된 트랜잭션의 변경 사항이 디스크에<br />

반영되기 전에 시스템 장애가 생긴 경우 재시동 할 때 로그(log)를<br />

보고 이 변경내용들을 기억<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 4 / 11


온라인 트랜잭션: 트랜잭션 명령문<br />

시작 명시<br />

BEGIN TRAN[ACTION] [〈트랜잭션이름〉]<br />

성공적인 종료 명시<br />

COMMIT TRAN[ACTION] [〈트랜잭션이름〉]<br />

비성공적인 종료 명시<br />

ROLLBACK TRAN[ACTION] [〈트랜잭션이름〉]<br />

중간의 저장 지점(save point) 설정<br />

SAVE TRAN[ACTION] 〈저장지점이름〉<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 5 / 11


온라인 분석처리: <strong>OLTP</strong>와 <strong>OLAP</strong><br />

온라인 분석처리(online analytical process; <strong>OLAP</strong>): 다차원으로<br />

이루어진 데이터에 대한 통계적인 요약 정보 제공<br />

<strong>OLTP</strong>는 트랜잭션의 빠른 처리와 데이터의 안전 관리에 관심을<br />

두는 반면 <strong>OLAP</strong>은 의사결정에 도움이 되는 데이터 분석에 관심<br />

<strong>OLAP</strong>의 예: SQL 서버의 분석 서비스(analysis services, <strong>OLAP</strong>)과<br />

Oracle의 Express Analyzer 등<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 6 / 11


온라인 분석처리: <strong>OLAP</strong>과 데이터 웨어하우스<br />

데이터 웨어하우스(data warehouse): 기업의 업무과정을 통해<br />

수집된 데이터를 대규모의 통합 데이터베이스로 구축해 놓은<br />

것으로 의사결정과 <strong>OLAP</strong>을 지원하기 위해 구축<br />

데이터 마트(data mart): 데이터 웨어하우스를 업무 기반의 작은<br />

단위로 재구성해 놓은 것으로 데이터의 양이 많거나 구조가<br />

복잡할 때 유용<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 7 / 11


박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 8 / 11


온라인 분석처리: <strong>OLAP</strong> 데이터 모델<br />

다차원 데이터 모델<br />

데이터 큐브(data cube)의 형태로 표현됨<br />

예: 3차원 큐브<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 9 / 11


스타 스키마(star-schema)라는 설계 기법 이용<br />

사실 테이블(fact table): 분석을 요하는 변수 항목<br />

차원 테이블(dimensional table): 사실 테이블의 변수들을 살펴보기<br />

위한 범주형 속성의 계층적/비계층적 정보<br />

예<br />

EXCEL의 피벗 테이블/차트 보고서, SQL 서버의 분석관리자<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 10 / 11


데이터 마이닝<br />

데이터 마이닝(data mining): 대용량의 데이터 안에 숨어있는<br />

패턴을 찾아내는 작업<br />

예: ‘결혼해서 아이가 없는 남자는 아이가 있는 남자보다 특정<br />

스포츠카를 소유할 가능성이 두 배 이상이다’라는 패턴 ⇒ 자동차<br />

마케팅에 적용<br />

기계학습(machine learning), 패턴인식(pattern recognition), 통계학,<br />

데이터베이스 등을 포함한 다양한 분야의 방법론으로 구성<br />

주요 기법<br />

연관규칙(association rule)<br />

군집분석(clustering)<br />

의사결정나무(decision tree)<br />

신경망(neural networks)<br />

박창이 (서울시립대학교 통계학과) <strong>6장</strong> <strong>OLTP</strong>, <strong>OLAP</strong>, <strong>데이터마이닝</strong> 11 / 11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!