삼성SDS Brightics/브라이틱스 서포터즈

[삼성SDS Brightics] FDS 신용카드 이상거래 탐지 #1편

비전공생's 2022. 10. 5. 00:26

 

안녕하세요

삼성SDS Brightics 서포터즈 3기, 비전공생입니다!

지난주까지 팀 분석 프로젝트를 모두 마치고,

이제 이번주부터는 개인 분석 프로젝트를 진행하게 되었습니다.

그 시작으로, 어떤 주제를 잡아 진행하면 좋을 지 많은 고민을 해보았습니다.

제가 개인적으로 관심있는 분야는 부동산, 금융 부분이기 때문에,

해당 주제에 포커스를 맞춰서 데이터를 찾아보았습니다.

그 중에서도 저는 FDS라고 불리는, 이상거래 탐지 예측 모델링을 주제로 정하였답니다!

여기서 FDS란, Fraud Detection System의 약자로

전자금융거래에서 사용되는 단말정보, 접속로그, 거래정보 등을 분석해서 금전 및 사적인 이득을 취하려는

부정한 거래 행위를 탐지, 분석하고 예방하는 시스템입니다.

대표적으로 탐지에 사용하는 방법은 위치정보를 이용한 이상 거래판단, 고객 정보와 평소 거래 패턴 분석,

고객 접속환경, 기존의 통계 데이터를 이용한 분석 등으로 나눠집니다.

FDS는 이러한 분석 방법을 조합하여 이상 거래를 확인하고 예방할 수 있게 해준답니다!

1. 프로젝트 일정

우선 해당 과정을 위해서, 개인 프로젝트의 일정을 정리해보았습니다.

주차
내용
1주차
주제 선정 및 데이터 소개
2주차
데이터 전처리 / 분석 모델
3주차
분석 모델
4주차
분석 모델
5주차
분석 모델
6주차
리포팅 등 결과 정리
7주차
개인 분석 프로젝트 후기 정리 / 분석 보고서 작성

2. 데이터 소개

분석에 활용할 데이터셋을 가져와보았습니다.

간단하게 데이터를 살펴볼게요!

위 데이터는 이틀간의 유럽 카드사의 실제 데이터 입니다.

총 284,807건의 트랜잭션 로그 (492건의 비정상 데이터)로 구성되어 있고,

전체 31개의 컬럼을 가지고 있습니다!

살짝 데이터를 미리 보여드리자면, 아래와 같습니다.

그럼 오늘은 여기서 주제 소개 및 간단한 데이터 소개를 마치려고 하는데요!

다음주 부터는 데이터의 불균형 정도, 변수에 따른 트랜잭션 양 등 다양하게 데이터를 살펴보고,

전처리가 필요한 부분은 진행해보는 시간을 갖겠습니다!

*본 포스팅은 삼성SDS Brightics 서포터즈 3기 활동의 일환으로 작성하였습니다.

#삼성SDS_Brightics #Brightics_Studio

#브라이틱스#모델링#데이터분석#datascience

#브라이틱스#서포터즈