본문 바로가기
반응형

데이터과학2

헷갈리는 csv, tsv 한번에 정리하자 - TidyData(타이디데이터) 데이터 저장 방식? 파이썬이나 R과 같은 통계 관련 프로그램을 사용하다 보면 csv나 tsv에 대한 이야기를 듣게 됩니다. 어느 정도 작업(?)에 익숙해졌으면 모르지만, 처음 이런 형식을 접한 초보 유저는 당황하게 되는데요. 사실, 꼼꼼하게 내용을 확인하면 그리 어렵지 않다는 사실을 알 수 있습니다. 오늘은 파이썬, R에서 사용하는 파일 형식에 대해 알아보도록 하겠습니다. 타이디 데이터(TidyData) 기본적으로 컴퓨터를 통한 데이터 분석에서 사용하는 형식은 타이디 데이터(TidyData) 형식을 갖습니다. 간단하게 말해서, 가로축과 세로축을 가진 값을 말하는데요. 구체적으로, 여기서 말하는 가로축과 세로축은 각각 실험대상과, 속성을 의미합니다. 사실, 이렇게 말하면 과학 연구자가 아닌 이상 헷갈리기 .. 2022. 8. 20.
파이썬으로 단일표본 t-test 돌리기 이전 시간에는 t 분포를 활용한 검정 중, 가장 많이 쓰이고 유명한 독립 표본 검정(independent t-test)을 알아보았습니다. 2022.07.29 - [데이터과학 기초/Python배우기] - 파이썬으로 독립표본 t-test 돌리기 오늘은 t-test 중, 단일표본(1-Sample) t 검정을 배워보겠습니다. t-test지만, 조건이 다른 두 검정(단일표본) 방식 단일표본 t 검정은 t 분포를 쓴다는 점에서 다른 t 검정과 같이 묶이지만 다른 접근 방식을 갖고 있습니다. 이름에서 확인되듯(단일표본, 1-sample) "두 집단 대신 하나의 집단을 분석할 때" 사용되기 때문입니다. (참고로 종속표본 검정의 경우 "두 집단을 비교하지만, 두 집단이 독립되지 않은 상태"일 때 사용합니다) 그렇다면, .. 2022. 8. 2.
반응형