본문 바로가기
반응형

코딩16

파이썬 쉽게 배우기 (1) - 프로그래밍 기초 용어 이해하기 파이썬을 배워 봅시다. 그전에... 저는 R과 Python을 사용하는 연구자입니다. 제가 처음 두 언어를 배웠을 때만 하더라도, 주변 사람들은 대부분 SPSS나 STATA를 사용했습니다. (굳이 더 들어가자면 R은 조금 전문적인 영역 Python은 미지의 영역(?)에 가까웠습니다) 그러나, 요즘은 굳이 연구자나 프로그래밍 관련 분야가 아닐지라도 파이썬 정도는 들어본 사람이 많아졌습니다. 그만큼 코딩 교육이 보편화됐다는 의미라고 생각합니다. 비전공자도 배워야 할 만큼 코딩이 중요한 이유는 무엇일까요? 어떤 언어를 배우는 것이 좋을까요? 몇 가지 중요한 키워드를 중심으로 이 문제를 풀어보겠습니다. 왜 프로그래밍을 배워야 하는가? 프로그래밍을 배우는 목적에 대해서는 여러 가지 설명이 존재합니다. 저처럼 연구 .. 2022. 9. 10.
파이썬으로 분산분석(ANOVA)하기 (2) - Two-Way (이원 분산분석) 일원 분산분석에서 이원 분산분석으로 지난 시간에는 ANOVA의 기본형인 일원 분산분석(One-Way ANOVA)을 수행하고 보고해 봤습니다. 2022.08.14 - [데이터과학 기초/통계] - 파이썬으로 분산분석(ANOVA)하기 (1) - One Way (일원 분산분석) 일원 분산분석은 수많은 논문에 사용되고 여러 방향으로 응용되어 왔는데요. 일원 분산분석이 강력하고 설명하기 편한 방법론 중 하나기 때문입니다. 하지만, 통계 패키지가 편리해지고 데이터 분석이 보편화되면서, 복잡한 모델을 사용하는 케이스가 증가하고 있습니다. (개인적으로는 데이터 기반 분석에서 머신러닝과 결합한 경과 통계가 과거보다 많이 복잡해졌다고 느낍니다) 이런 배경에서, 통계 분석은 어느 정도 기본기(?)로 갖춰 두는 것이 좋다고 생.. 2022. 8. 25.
헷갈리는 csv, tsv 한번에 정리하자 - TidyData(타이디데이터) 데이터 저장 방식? 파이썬이나 R과 같은 통계 관련 프로그램을 사용하다 보면 csv나 tsv에 대한 이야기를 듣게 됩니다. 어느 정도 작업(?)에 익숙해졌으면 모르지만, 처음 이런 형식을 접한 초보 유저는 당황하게 되는데요. 사실, 꼼꼼하게 내용을 확인하면 그리 어렵지 않다는 사실을 알 수 있습니다. 오늘은 파이썬, R에서 사용하는 파일 형식에 대해 알아보도록 하겠습니다. 타이디 데이터(TidyData) 기본적으로 컴퓨터를 통한 데이터 분석에서 사용하는 형식은 타이디 데이터(TidyData) 형식을 갖습니다. 간단하게 말해서, 가로축과 세로축을 가진 값을 말하는데요. 구체적으로, 여기서 말하는 가로축과 세로축은 각각 실험대상과, 속성을 의미합니다. 사실, 이렇게 말하면 과학 연구자가 아닌 이상 헷갈리기 .. 2022. 8. 20.
파이썬으로 빠르게 글자 수 세기 - Counter 파이썬은 데이터 사이언스 도구로 알려져 있지만, 단순한 반복 작업을 대체하기 위해 파이썬을 사용하는 사람도 많습니다. 오늘은 이런 단순 작업 중, Counter로 대표되는 글자 수 세는 방법을 방법을 살펴보겠습니다. Counter는 이름대로 숫자를 세는 함수로, 워드 클라우드 같은 빈도 기반의 작업과 연계되는 중요한 역할을 합니다. 입력/출력 과정이 복잡한 측면이 있어 처음에 익숙해 지기는 어렵지만, 한번 효용을 알게 되면 데이터 분석에서 무조건 한번 이상 사용하게 되는 명령어이기도 합니다. (특히, NLP와 같은 문자 처리에서는 Counter 명령어의 다양한 사용법을 아는 것이 필수입니다) 오늘은 간략한 Counter의 사용 방법과 예시를 확인해 보도록 하겠습니다. colletions과 Counter .. 2022. 8. 17.
반응형