본문 바로가기
반응형

파이썬17

파이썬으로 대응표본 t-test 돌리기 t-test 시리즈(?)의 마지막 파트인 대응표본 t-test입니다. 2022.08.02 - [데이터과학 기초/Python배우기] - 파이썬으로 단일표본 t-test 돌리기 2022.07.29 - [데이터과학 기초/Python배우기] - 파이썬으로 독립표본 t-test 돌리기 (굳이 따진다면 추가로 비모수 검정이 남았습니다만, 일단은 넘어가도록 하죠) 대응표본 t 검정(Paired t-test) 대응표본 t검정은 Paired라는 표현에서 알 수 있듯이, "짝을 이룬 두 집단(표본)"을 비교하는 검정 방식입니다. 그렇다면, "짝을 이룬다"라는 표현은 어떤 뜻을 가질까요? "전/후"의 관계를 가장 흔한 예시로 들 수 있습니다. "커피를 마시기 전후로 집단의 서류 처리 능력에 차이가 존재하는가?" 와 같은 .. 2022. 8. 4.
conda로 손쉽게 파이썬 환경 관리하자 (Intel부터 M1까지) - 기초 Conda? 파이썬에 관심 있는 유저라면 패키지 설치 과정에서 conda라는 명령어를 들어봤을 것입니다. 대부분의 패키지가 설치 과정에서 "conda install ~~~~"나 "pip install ~~~"를 쓰기 때문입니다. 그렇다면 conda는 무엇인가? 라고 물어본다면. 다양한 프로그램 언어(보통 Python)와 연결되는 “환경/패키지” 관리 시스템 이라고 말할 수 있습니다. 왜 쓰는가? 제대로 설치하면 문제가 해결되는 R, SPSS, STATA, Excel과 달리 Python에서 확장 기능은 복잡하게 얽혀있습니다. 패키지 간의 의존성이 크기 때문에 A는 B를 쓰고, B는 C를 쓰고 C는 B를 쓰는데, D는 A가 있으면 안 되고… 하는 일이 많이 발생합니다. (예를 들어 Numpy와 Pandas가.. 2022. 7. 31.
파이썬으로 독립표본 t-test 돌리기 파이썬에서 통계는 어렵다? 보통 사회과학에서 통계 프로그램은 SPSS나 STATA, 무료로는 R이나 Jamovi를 씁니다. 그러나, Python으로도 간단한 수준에서 논문 통계까지 모두 돌릴 수 있습니다. Statsmodels나 Pingouin같은 간편한 통계 패키지가 발전했기 때문입니다. (저를 포함하여 Python을 주로 사용하는 연구자는 Pandas와 연계되는 통계 패키지를 쓰는 것이 효율이 좋습니다.) 오늘은 간단한 t-test 보고서 작성을 통해, 파이썬에서 통계 분석 실습을 해 보도록 하겠습니다. Pingouin/ Pandas 파이썬에서 통계 분석은 크게 두 가지 단계로 이뤄집니다. - 데이터 탐색 ~시각화 - 통계 분석 ~시각화 그렇기 때문에, 실습 전에 세 패키지를 설치하는 것이 필요합니다.. 2022. 7. 29.
파이썬 인터렉티브 시각화 - Altair 중급 (지도 차트) 지난시간에 이어 오늘은 Altair로 파이썬 인터렉티브 지도 시각화를 해 보겠습니다. 파이썬의 인터렉티브 지도 시각화 패키지는 1) Folium 2) Plotly 3) Altair 정도로 정리할 수 있습니다. 지도 시각화로만 봤을 때 Folium이 가장 편리하게 사용할 수 있지만 "지도"에만 한정되는 아쉬움이 있습니다. 반대로 Plotly나 Altair는 범용 인터렉티브 시각화 툴이기 때문에, "지도"를 포함한 다용도 시각화에 적합합니다. 지도 시각화만 필요하다면 Folium을, 지도를 포함한 대시보드를 구성한다면 Plotly나 Altair가 유리할 것입니다. GeoPandas? Altair로 지도 시각화를 수행하기 위해서는 "모양을 그려 줄" 데이터가 필요합니다. 간단히 말해 서울이나 부산은 대략 어.. 2022. 7. 24.
반응형