안녕하세요
삼성SDS Brightics 서포터즈 3기, 비전공생입니다!

오늘은 개인 미션으로, 3주간 진행되는 미션의 두번째 시간입니다!
제가 잡은 데이터분석 주제는 "집값 예측하기"였는데요.
지난주에는 데이터를 살펴보고, 간단한 분석을 진행해보았습니다.
지난 글을 못보신 분들이 계시다면,
아래의 글부터 참고해주시면 감사하겠습니다!
"부동산 집 값 예측하기"라는 주제 하에서,
오늘은 더 다양한 분석 기업을 활용해 볼 예정인데요.
오늘 다뤄볼 내용은 모두 가설검정을 하는데에 쓰이는 기법입니다!
1. One Way ANOVA
첫번째로 사용해볼 분석 기법은, 일원배치 분산분석입니다.
일원배치 분산분석(One Way ANOVA)이란,
세 개 이상 집단 간 평균을 비교하는 통계 검정 방법으로,
독립변수가 세 집단 이상으로 구성된 범주형 자료, 종속변수가 연속형 자료인 경우에 활용합니다.
집단을 나타내는 변수인 요인의 수, 즉 독립변수가 1개인 경우 일원배치 분산분석이라고 하며,
독립변수가 2개인 경우 이원배치 분산분석이라고 한답니다!
1-1. 가설설정
제가 설정한 가설은, "집의 연식에 따라 집값에 차이가 있다"는 가설입니다.
집이 지어진 연도, 즉 연식과 집의 상태에 따라 집값에 어떤 차이가 있는지 검정하고자 하므로,
One Way ANOVA 분석을 진행해보겠습니다.

오늘도 이렇게 One Way ANOVA를 검색하여, 블럭을 추가해준 뒤
손쉽게 분석을 시작해보았습니다.
1-2. ANOVA 분석을 통한 가설검증

원하는 컬럼값을 선택한 뒤, "Run"을 실행시켜주면 분석값을 곧 확인할 수 있답니다!

위의 결과는 yr_built라는 컬럼과 price값의 분석 결과입니다.
위에서 설정했떤 "집의 연식에 따라 집값에 차이가 있다"라는 가설에 대한 분석 결과이지요!

이렇게 분석에 따른 Diagnostics도 시각화하여 확인할 수 있답니다!
2. Paired T Test
두번째로 사용해볼 분석 기법은, 대응표본 T 검정입니다.
대응표본 T 검정(Paired T Test)란,
실험 이전의 집단과 실험 이후의 집단이 동일한 집단인 경우 사용하는 검정으로,
한 개인이 서로 다른 두 조건에서 짝을 지어 한 쌍이 연구대상이 되는 경우의 분석 방법입니다.
기본 가정사항은 정규성 하나 뿐입니다.
우선 이번에도 마찬가지로, Paired T Test라는 블럭을 검색 혹은 선택하여 가져와줍니다.
데이터가 잘 연결되었는지도 잊지않고 확인해줍니다.

잘 불러와졌다면, 본인이 설정한 가설에 맞는 컬럼을 선택해줍니다.
제가 이번에 검증해볼 가설은 "집의 뷰에 따라 집값에 차이가 있을 것이다."라는 가설이므로,
저는 price컬럼과 view컬럼을 가져와주었습니다.

그리고 추가로, 집값의 경우 지역별로 큰 차이가 있으므로,
지역을 group by로 묶어주어 분석을 진행해보았습니다.
group by로 묶어주고 싶다면, 컬럼을 선택하는 창에서 맨 밑으로 스크롤하여
Group By 부분에 해당 컬럼을 선택해주면 끝이랍니다!

2-2. Paried T Test를 통한 가설검증
그렇게 선택해준 뒤 Run을 실행해주면,
짜잔!



이렇게 도시별로 묶여서 분석값을 확인할 수 있답니다!
파이썬을 사용해서 분석했다면, 분명 코드를 입력하거나 분석을 시도하는 과정에서
문제나 오류가 생겨 머리가 너무 아팠을 텐데,
브라이틱스 스튜디오를 사용하니 이렇게 쉽고 빠르게
가설검증을 시도해볼 수 있었습니다!
데이터분석, 가설검증 등 학교나 회사에서의 과제가 있으신 분들은
굳이 파이썬 등의 툴을 공부하지 않고, 브라이틱스로 쉽게 분석해보시는 건 어떨까요? ;)
그럼 저는 오늘은 이쯤에서 글을 마무리하겠습니다!
다음 주에는 브라이틱스를 통해 직접 집값을 예측해보는 시간을 가져보겠습니다.
*본 포스팅은 삼성SDS Brightics 서포터즈 3기 활동의 일환으로 작성하였습니다.
'삼성SDS Brightics > 브라이틱스 서포터즈' 카테고리의 다른 글
[삼성SDS Brightics] '텍스트데이터로 MBTI 예측하기' 팀 분석 프로젝트 - 2편 (0) | 2022.08.23 |
---|---|
[삼성SDS Brightics] '텍스트데이터로 MBTI 예측하기' 팀 분석 프로젝트 - 1편 (0) | 2022.08.16 |
[삼성SDS Brightics] 부동산 데이터로 집 값 예측하기 - 3편 (0) | 2022.07.12 |
[삼성SDS Brightics] 브라이틱스 서포터즈 3기 발대식 후기 (0) | 2022.06.26 |
[삼성SDS Brightics] 설치부터 분석 실습까지! (다운로드 및 체험 리뷰) (0) | 2022.06.20 |