본문 바로가기
반응형

분류 전체보기27

파이썬 쉽게 배우기 (1) - 프로그래밍 기초 용어 이해하기 파이썬을 배워 봅시다. 그전에... 저는 R과 Python을 사용하는 연구자입니다. 제가 처음 두 언어를 배웠을 때만 하더라도, 주변 사람들은 대부분 SPSS나 STATA를 사용했습니다. (굳이 더 들어가자면 R은 조금 전문적인 영역 Python은 미지의 영역(?)에 가까웠습니다) 그러나, 요즘은 굳이 연구자나 프로그래밍 관련 분야가 아닐지라도 파이썬 정도는 들어본 사람이 많아졌습니다. 그만큼 코딩 교육이 보편화됐다는 의미라고 생각합니다. 비전공자도 배워야 할 만큼 코딩이 중요한 이유는 무엇일까요? 어떤 언어를 배우는 것이 좋을까요? 몇 가지 중요한 키워드를 중심으로 이 문제를 풀어보겠습니다. 왜 프로그래밍을 배워야 하는가? 프로그래밍을 배우는 목적에 대해서는 여러 가지 설명이 존재합니다. 저처럼 연구 .. 2022. 9. 10.
최소한의 통계로 p-value 이해해 보기 p-value란 도대체 무엇인가? t-test부터 분산분석(ANOVA)에 이르기까지, 우리는 다양한 통계 검정을 실습하고 해석해 봤습니다. 여기까지 검색해서 오신 분들이라면 대개 통계에 대해 익숙하신 분들이겠지만, 만약 오랜만에 통계를 돌리거나 처음 실습하시는 분들은 다양한 의문이 생기실 겁니다. 특히, 저를 포함해서 통계를 처음 배우시는 분들은 p-value에 대해 여러 의문을 갖고 있는 분들이 많을 것이라 생각합니다. "도대체 p-value가 뭐지?" "왜 0.05 이하면 p-value가 유의하다고 하는 거지? 별 표시는 뭐지?" 와 같은 의문 말입니다. 물론, 인터넷의 광대한 세계에서는 이런 의문을 쉽게 해결할 수 있지만 어느 정도 수학 실력을 요구합니다. 저 또한 수학을 이해하지 않고 통계를 돌리.. 2022. 9. 1.
파이썬으로 분산분석(ANOVA)하기 (2) - Two-Way (이원 분산분석) 일원 분산분석에서 이원 분산분석으로 지난 시간에는 ANOVA의 기본형인 일원 분산분석(One-Way ANOVA)을 수행하고 보고해 봤습니다. 2022.08.14 - [데이터과학 기초/통계] - 파이썬으로 분산분석(ANOVA)하기 (1) - One Way (일원 분산분석) 일원 분산분석은 수많은 논문에 사용되고 여러 방향으로 응용되어 왔는데요. 일원 분산분석이 강력하고 설명하기 편한 방법론 중 하나기 때문입니다. 하지만, 통계 패키지가 편리해지고 데이터 분석이 보편화되면서, 복잡한 모델을 사용하는 케이스가 증가하고 있습니다. (개인적으로는 데이터 기반 분석에서 머신러닝과 결합한 경과 통계가 과거보다 많이 복잡해졌다고 느낍니다) 이런 배경에서, 통계 분석은 어느 정도 기본기(?)로 갖춰 두는 것이 좋다고 생.. 2022. 8. 25.
헷갈리는 csv, tsv 한번에 정리하자 - TidyData(타이디데이터) 데이터 저장 방식? 파이썬이나 R과 같은 통계 관련 프로그램을 사용하다 보면 csv나 tsv에 대한 이야기를 듣게 됩니다. 어느 정도 작업(?)에 익숙해졌으면 모르지만, 처음 이런 형식을 접한 초보 유저는 당황하게 되는데요. 사실, 꼼꼼하게 내용을 확인하면 그리 어렵지 않다는 사실을 알 수 있습니다. 오늘은 파이썬, R에서 사용하는 파일 형식에 대해 알아보도록 하겠습니다. 타이디 데이터(TidyData) 기본적으로 컴퓨터를 통한 데이터 분석에서 사용하는 형식은 타이디 데이터(TidyData) 형식을 갖습니다. 간단하게 말해서, 가로축과 세로축을 가진 값을 말하는데요. 구체적으로, 여기서 말하는 가로축과 세로축은 각각 실험대상과, 속성을 의미합니다. 사실, 이렇게 말하면 과학 연구자가 아닌 이상 헷갈리기 .. 2022. 8. 20.
반응형