삼성SDS Brightics/브라이틱스 서포터즈

[삼성SDS Brightics] '텍스트데이터로 MBTI 예측하기' 팀 분석 프로젝트 - 1편

비전공생's 2022. 8. 16. 23:05

 

 

안녕하세요

삼성SDS Brightics 서포터즈 3기, 비전공생입니다!

 

 

정말 오랜만에 이렇게 글을 작성하게 되었네요!

오늘은 앞으로 4주간 진행될 팀 분석 프로젝트에 대한 소개를 해보려고 합니다.

간단하게 저희 팀이 선정한 주제와 일정, 그리고 저의 역할에 대해 정리해보겠습니다.

 


 

 

1. 팀 분석 주제 소개

우선 저희의 주제를 먼저 설명드리자면,

“텍스트 데이터로 MBTI 예측하기” 입니다!

 

 

요즘은 MBTI 없이 자신을 소개하기가 쉽지 않죠!

첫 만남에는 꼭 MBTI를 물어보게 되는 것 같습니다.

 

그런 트렌드 속에서, 다양한 텍스트 데이터를 통해 텍스트 마이닝 기법을 진행해보고

MBTI를 예측하는 분석 프로젝트를 진행해볼 예정입니다.

 

텍스트 데이터 분석과 MBTI 같은 흥미로운 주제는 저도 처음이어서 정말 기대가 된답니다!

 

 

저희의 프로젝트는, 이번 분석 프로젝트를 기반으로

이후 영상 제작까지 진행되는데요!

 

MBTI 예측 모델링을 어떻게 활용하고, 분석하는지를 재미있게 담아볼 예정입니다!

다들 많은 관심 부탁드려요 :)

 


 

2. 역할 분담 소개

그럼 이제 저희의 전반적인 분석 프로젝트를 요약해보고,

그 중 저의 역할에 대해 말씀드릴게요.

 

우선 저희는 크게,

 

데이터 전처리 및 토큰 대체

임베딩

분류 알고리즘 (머신러닝, 딥러닝)

시각화

Reddit mbti 발자취 분석

 

의 순서로 진행할 예정입니다!

 

그 중에서 저는, “reddit mbti 발자취 분석” 부분을 맡게 되었구요!

 

 

자세하게 살펴보면,

 

Reddit 사이트를 이용해 기록 패턴을 분석해보기.

mbti별로 좋아요를 누르는 비율이나 포스팅 길이가 어떻게 다를지 비교해보고,

각종 변수를 통해 간단한 분석 진행해보기

 

등의 업무를 맡아서 할 예정입니다!

 

mbti별로 댓글이나, 좋아요 등 sns상에서 어떤 로그 데이터를 남길 지, 벌써 궁금하시지 않ㄴ나요?

여러모로, 혼자였다면 시도해보지 못했을 재밌는 주제를 잡은 것 같아서 기쁘답니다!

 

 

그럼 오늘은 이쯤에서 마무리하고,

다음 포스팅에서는 직접 분석을 진행해보는 과정을 남겨보도록 할게요!

 

*본 포스팅은 삼성SDS Brightics 서포터즈 3기 활동의 일환으로 작성하였습니다.

#삼성SDS_Brightics #Brightics_Studio

#브라이틱스#모델링#데이터분석#datascience

#브라이틱스#서포터즈