ìê¸ì¸íë°©ì§ ìì¤í 구ì¶ì ëµ ë° ê³ ê°ì¬ë¡ - IBM
ìê¸ì¸íë°©ì§ ìì¤í 구ì¶ì ëµ ë° ê³ ê°ì¬ë¡ - IBM
ìê¸ì¸íë°©ì§ ìì¤í 구ì¶ì ëµ ë° ê³ ê°ì¬ë¡ - IBM
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
RBR 개발 절차<br />
샘플링<br />
변수선정<br />
유형분류<br />
룰도출<br />
평가<br />
등급<br />
검증<br />
•STR거래 및<br />
거래자 마트<br />
대상 분석<br />
•DataSet<br />
Training<br />
•Testing<br />
•목표변수 : 제<br />
공/불제공<br />
•독립변수 3가<br />
지 방법에 의<br />
한변수채택<br />
•개인/법인<br />
•원화/외환<br />
•서식유형별<br />
(STR, 고액<br />
(CTR), 외환<br />
•마이닝기법<br />
(DT모델C5.0<br />
알고리즘)<br />
•유형별룰정<br />
리<br />
•중복룰정리<br />
포함<br />
•Training<br />
dataset에서<br />
룰을 도출<br />
•Testing<br />
dataset에서<br />
룰을 적용<br />
•룰 등급<br />
1~4등급으<br />
로구분<br />
•분석(검증)<br />
•룰에 사용된 마<br />
트는 STR 거래<br />
마트와 거래자<br />
마트 이고 1년 6<br />
개월간의 데이<br />
터를 훈련자료<br />
와 테스트자료<br />
로분할<br />
•목표변수(제<br />
공/불제공)에<br />
대한 독립변수<br />
선정방식 T-<br />
test 결과 유의<br />
한변수, Null<br />
값이 75% 이<br />
하인 변수<br />
Logistic의<br />
stepwise 방법<br />
에의한변수<br />
채택<br />
•개인거래 및<br />
법인거래별로<br />
원화 거래인지<br />
외환거래인지<br />
구분을 하며<br />
다시 혐의거래,<br />
고액거래, 또<br />
는 외환거래인<br />
지 구분하여<br />
룰 세분화<br />
•DT 모델의<br />
C5.0알고리즘<br />
사용<br />
•Entropy이론<br />
지수기반하는<br />
무질서도 측정<br />
방식으로 Tree<br />
생성<br />
•유형별로 룰<br />
을 생성하고<br />
중복된 룰은<br />
제공율 기준으<br />
로우선채택<br />
•Training<br />
dataset에서<br />
룰을 도출하<br />
고Testing<br />
dataset에서<br />
룰을 적용함<br />
으로써 룰의<br />
정확도를 평<br />
가<br />
•개인및법<br />
인별로 룰의<br />
등급을 설정<br />
함<br />
•평가단계의<br />
과정을 거친 룰<br />
을 최정적으로<br />
다시 검증하기<br />
위해 3개월분<br />
의 실제데이터<br />
를 바탕으로 다<br />
시룰을적용하<br />
여 제공율을 살<br />
핌<br />
33<br />
© 2009 <strong>IBM</strong> Corporation