반응형 Python9 파이썬으로 독립표본 t-test 돌리기 파이썬에서 통계는 어렵다? 보통 사회과학에서 통계 프로그램은 SPSS나 STATA, 무료로는 R이나 Jamovi를 씁니다. 그러나, Python으로도 간단한 수준에서 논문 통계까지 모두 돌릴 수 있습니다. Statsmodels나 Pingouin같은 간편한 통계 패키지가 발전했기 때문입니다. (저를 포함하여 Python을 주로 사용하는 연구자는 Pandas와 연계되는 통계 패키지를 쓰는 것이 효율이 좋습니다.) 오늘은 간단한 t-test 보고서 작성을 통해, 파이썬에서 통계 분석 실습을 해 보도록 하겠습니다. Pingouin/ Pandas 파이썬에서 통계 분석은 크게 두 가지 단계로 이뤄집니다. - 데이터 탐색 ~시각화 - 통계 분석 ~시각화 그렇기 때문에, 실습 전에 세 패키지를 설치하는 것이 필요합니다.. 2022. 7. 29. 맥에서 압축 파일 한글이 깨질때는 Keka를 쓰자! 맥은 내장 프로그램이 쓸만하기 때문에(e.g. PDF 리더) 추가 프로그램을 설치할 필요가 거의 없는 편입니다. 다만, 몇 가지 국내 한정 문제 때문에 확장 프로그램을 설치해야 할 때가 있습니다. 이 중 압축 프로그램으로 쓸만한 Keka에 대해 알아보겠습니다. Keka란? keka는 여러 포맷의 압축/해제를 지원하는 프로그램입니다. Zip파일을 중심으로 작동하는 맥의 압축 파일 시스템과 달리 Keka는 대부분의 압축 파일을 지원합니다. 사실, Keka 외로도 쓸만한 압축 프로그램은 몇 개 있는 편인데요, Keka를 사용할 경우 맥의 고질적인 압축 문제인 한글 깨짐 현상이 해결되기 때문에 국내에서 맥을 쓸 경우 Keka를 추천하는 편입니다. Keka 설치 페이지는? Keka는 앱스토어에서 커피 한잔 값 .. 2022. 7. 28. 파이썬 인터렉티브 시각화 - Altair 중급 (지도 차트) 지난시간에 이어 오늘은 Altair로 파이썬 인터렉티브 지도 시각화를 해 보겠습니다. 파이썬의 인터렉티브 지도 시각화 패키지는 1) Folium 2) Plotly 3) Altair 정도로 정리할 수 있습니다. 지도 시각화로만 봤을 때 Folium이 가장 편리하게 사용할 수 있지만 "지도"에만 한정되는 아쉬움이 있습니다. 반대로 Plotly나 Altair는 범용 인터렉티브 시각화 툴이기 때문에, "지도"를 포함한 다용도 시각화에 적합합니다. 지도 시각화만 필요하다면 Folium을, 지도를 포함한 대시보드를 구성한다면 Plotly나 Altair가 유리할 것입니다. GeoPandas? Altair로 지도 시각화를 수행하기 위해서는 "모양을 그려 줄" 데이터가 필요합니다. 간단히 말해 서울이나 부산은 대략 어.. 2022. 7. 24. 파이썬 인터렉티브 시각화 해 보기 - Altair 중급 (바 차트) Altair 그래프의 디테일 수정하기 이전 포스트에서 Altair의 기본을 이해했기 때문에, 응용으로 넘어가겠습니다. Altair에서 세부 파라미터를 수정하는 방식은 간단합니다. [차트 객체] + encode(배치) 와 같이 점차 붙여나가며 기초 구조를 만들어 나가는 과정에서 각 구조 안의 파라메터를 수정하면 되겠습니다. 바 차트를 그려보자 바 차트는 범용 차트로 카테고리의 빈도, 양을 측정할 때 사용합니다. 간단한 바 차트의 예를 들어볼까요? 우선, 성적 테스트 데이터셋을 하나 만들어 보겠습니다. 6명의 인원에 대한 성적과 분반 데이터셋입니다. 규칙은 간단하게, 6번 반복하면서 70~100 사이의 정수를 출력하도록 하고 Pandas 데이터 프레임으로 정리하겠습니다. # 6번 반복하면서, 70과 100사.. 2022. 7. 13. 이전 1 2 3 다음 반응형