반응형 코딩16 파이썬으로 분산분석(ANOVA)하기 (1) - One Way (일원 분산분석) 분산 분석(ANOVA)으로의 확장 지금까지 우리는 t-test와 상관관계 분석을 수행했습니다. 두 방법론은 앞으로 배울 방법론의 기초가 되는 방법론으로 분산분석(ANOVA)과 회귀분석(Regression)과 깊은 관계를 갖습니다. (좀 더 깊은 레벨에서 보자면, ANOVA와 Regression, 더 나아가 t-test는 모두 선형 모형이라는 큰 범주에 속해 있습니다) 오늘은 이 중, 실험에서 많이 사용되는 분산분석(ANOVA, Analysis of Variance)에 대해 배워보겠습니다. 분산분석(ANOVA, Analysis of Variance)? 분산 분석은 말 그대로 분산을 분석하는 방법론입니다. 그렇다면 분산(Variance)는 무엇일까요? 일단 사전적 정의로는 (개별값 - 평균)을 제곱하여 합한.. 2022. 8. 14. 파이썬으로 대응표본 t-test 돌리기 t-test 시리즈(?)의 마지막 파트인 대응표본 t-test입니다. 2022.08.02 - [데이터과학 기초/Python배우기] - 파이썬으로 단일표본 t-test 돌리기 2022.07.29 - [데이터과학 기초/Python배우기] - 파이썬으로 독립표본 t-test 돌리기 (굳이 따진다면 추가로 비모수 검정이 남았습니다만, 일단은 넘어가도록 하죠) 대응표본 t 검정(Paired t-test) 대응표본 t검정은 Paired라는 표현에서 알 수 있듯이, "짝을 이룬 두 집단(표본)"을 비교하는 검정 방식입니다. 그렇다면, "짝을 이룬다"라는 표현은 어떤 뜻을 가질까요? "전/후"의 관계를 가장 흔한 예시로 들 수 있습니다. "커피를 마시기 전후로 집단의 서류 처리 능력에 차이가 존재하는가?" 와 같은 .. 2022. 8. 4. 파이썬으로 독립표본 t-test 돌리기 파이썬에서 통계는 어렵다? 보통 사회과학에서 통계 프로그램은 SPSS나 STATA, 무료로는 R이나 Jamovi를 씁니다. 그러나, Python으로도 간단한 수준에서 논문 통계까지 모두 돌릴 수 있습니다. Statsmodels나 Pingouin같은 간편한 통계 패키지가 발전했기 때문입니다. (저를 포함하여 Python을 주로 사용하는 연구자는 Pandas와 연계되는 통계 패키지를 쓰는 것이 효율이 좋습니다.) 오늘은 간단한 t-test 보고서 작성을 통해, 파이썬에서 통계 분석 실습을 해 보도록 하겠습니다. Pingouin/ Pandas 파이썬에서 통계 분석은 크게 두 가지 단계로 이뤄집니다. - 데이터 탐색 ~시각화 - 통계 분석 ~시각화 그렇기 때문에, 실습 전에 세 패키지를 설치하는 것이 필요합니다.. 2022. 7. 29. 파이썬 인터렉티브 시각화 해 보기 - Altair 중급 (바 차트) Altair 그래프의 디테일 수정하기 이전 포스트에서 Altair의 기본을 이해했기 때문에, 응용으로 넘어가겠습니다. Altair에서 세부 파라미터를 수정하는 방식은 간단합니다. [차트 객체] + encode(배치) 와 같이 점차 붙여나가며 기초 구조를 만들어 나가는 과정에서 각 구조 안의 파라메터를 수정하면 되겠습니다. 바 차트를 그려보자 바 차트는 범용 차트로 카테고리의 빈도, 양을 측정할 때 사용합니다. 간단한 바 차트의 예를 들어볼까요? 우선, 성적 테스트 데이터셋을 하나 만들어 보겠습니다. 6명의 인원에 대한 성적과 분반 데이터셋입니다. 규칙은 간단하게, 6번 반복하면서 70~100 사이의 정수를 출력하도록 하고 Pandas 데이터 프레임으로 정리하겠습니다. # 6번 반복하면서, 70과 100사.. 2022. 7. 13. 이전 1 2 3 4 다음 반응형