본문 바로가기
반응형

통계10

파이썬으로 다중회귀분석 수행하기 - (1) 다중회귀 분석의 기초 이전 시간의 공분산분석(ANCOVA)까지 합해서, 우리는 분산분석의 전반적인 기법들을 모두 훑어봤습니다. 분산분석은 전반적인 통계학 관점에서 보자면 특수한 형태의 회귀분석이라고 볼 수 있습니다. 하지만, 대부분의 교재/강의에서는 이를 분리해서 가르치기 때문에 오히려 헷갈리는 사람들이 많습니다. 오늘은 다중회귀분석에 대해 공부하기 위한 준비로써 분산분석과 다중회귀분석의 차이점을 중심으로 기초를 다져보겠습니다. 왜 다중회귀분석이 필요한가? 이전 시간에 분산분석을 설명하면서 "종속 변인에 대한 예측이 빗나가는데" 특정 요인이 미치는 영향을 보는 것이 목적이라고 설명했습니다. (좀 더 구체적으로 보자면 그룹 기준으로 그룹간~Between과 그룹내~Within의 차이를 비교하는 것이지만 넘어갑시다) 그렇다면 다중.. 2022. 10. 1.
파이썬으로 공분산분석(ANCOVA) 수행하기 지난 시간까지 우리는 분산분석(ANOVA)의 기본적인 유형(One-Way ANOVA)과 응용형(Two-Way ANOVA)을 수행해 봤습니다. 2022.08.14 - [데이터과학 기초/통계] - 파이썬으로 분산분석(ANOVA)하기 (1) - One Way (일원 분산분석) 2022.08.25 - [데이터과학 기초/통계] - 파이썬으로 분산분석(ANOVA)하기 (2) - Two-Way (이원 분산분석) 포스팅 내용 중 지나가듯 언급한 내용으로 "분산분석과 나중에 배울 회귀분석은 큰 차이가 없다"라고 말한 바가 있습니다. 선형모형이라는 큰 틀에서 분산분석과 회귀분석은 동일한 접근법을 가지기 때문입니다. (아직은 이해할 수 없겠지만 회귀분석의 특수한 케이스가 분산분석이라고 생각해도 됩니다) 오늘은 나중에 배울 .. 2022. 9. 24.
최소한의 통계로 p-value 이해해 보기 p-value란 도대체 무엇인가? t-test부터 분산분석(ANOVA)에 이르기까지, 우리는 다양한 통계 검정을 실습하고 해석해 봤습니다. 여기까지 검색해서 오신 분들이라면 대개 통계에 대해 익숙하신 분들이겠지만, 만약 오랜만에 통계를 돌리거나 처음 실습하시는 분들은 다양한 의문이 생기실 겁니다. 특히, 저를 포함해서 통계를 처음 배우시는 분들은 p-value에 대해 여러 의문을 갖고 있는 분들이 많을 것이라 생각합니다. "도대체 p-value가 뭐지?" "왜 0.05 이하면 p-value가 유의하다고 하는 거지? 별 표시는 뭐지?" 와 같은 의문 말입니다. 물론, 인터넷의 광대한 세계에서는 이런 의문을 쉽게 해결할 수 있지만 어느 정도 수학 실력을 요구합니다. 저 또한 수학을 이해하지 않고 통계를 돌리.. 2022. 9. 1.
파이썬으로 분산분석(ANOVA)하기 (2) - Two-Way (이원 분산분석) 일원 분산분석에서 이원 분산분석으로 지난 시간에는 ANOVA의 기본형인 일원 분산분석(One-Way ANOVA)을 수행하고 보고해 봤습니다. 2022.08.14 - [데이터과학 기초/통계] - 파이썬으로 분산분석(ANOVA)하기 (1) - One Way (일원 분산분석) 일원 분산분석은 수많은 논문에 사용되고 여러 방향으로 응용되어 왔는데요. 일원 분산분석이 강력하고 설명하기 편한 방법론 중 하나기 때문입니다. 하지만, 통계 패키지가 편리해지고 데이터 분석이 보편화되면서, 복잡한 모델을 사용하는 케이스가 증가하고 있습니다. (개인적으로는 데이터 기반 분석에서 머신러닝과 결합한 경과 통계가 과거보다 많이 복잡해졌다고 느낍니다) 이런 배경에서, 통계 분석은 어느 정도 기본기(?)로 갖춰 두는 것이 좋다고 생.. 2022. 8. 25.
반응형