본문 바로가기
반응형

초보13

파이썬 인터렉티브 시각화 해 보기 - Altair 중급 (바 차트) Altair 그래프의 디테일 수정하기 이전 포스트에서 Altair의 기본을 이해했기 때문에, 응용으로 넘어가겠습니다. Altair에서 세부 파라미터를 수정하는 방식은 간단합니다. [차트 객체] + encode(배치) 와 같이 점차 붙여나가며 기초 구조를 만들어 나가는 과정에서 각 구조 안의 파라메터를 수정하면 되겠습니다. 바 차트를 그려보자 바 차트는 범용 차트로 카테고리의 빈도, 양을 측정할 때 사용합니다. 간단한 바 차트의 예를 들어볼까요? 우선, 성적 테스트 데이터셋을 하나 만들어 보겠습니다. 6명의 인원에 대한 성적과 분반 데이터셋입니다. 규칙은 간단하게, 6번 반복하면서 70~100 사이의 정수를 출력하도록 하고 Pandas 데이터 프레임으로 정리하겠습니다. # 6번 반복하면서, 70과 100사.. 2022. 7. 13.
파이썬으로 인터렉티브 시각화 해 보기 - Altair 기초 Altair는 파이썬(Python)을 기반으로 돌아가는 (인터렉티브) 시각화 패키지입니다. 비슷하게 파이썬에서 작동하는 인터렉티브 시각화 패키지로 플롯리(plotly)나 보케(bokeh)가 존재하지만, Altair는 선언형(declarative) 방식 중 독특한 문법을 보여주는 흥미로운 패키지입니다. 특히, Altair의 개발진 중 WWDC에서 발표된 Swift Chart를 개발한 인원이 존재하는 만큼, 퀄리티 있고 탄탄한 시각화 패키지라고 볼 수 있겠습니다. 오늘은 Altair의 기본 문법을 배우고, 간략한 시각화를 수행해 보겠습니다. Altair 기본 Altair는 시각화 표현 요소를 넣어줘야 작동합니다. 공식 User Guide 탭을 보면 다양한 요소가 있지만, 부가기능을 제외하고 많이 사용하는 요.. 2022. 7. 13.
ggplot 쉽게 배우기 (3) - 밀도(density) 시각화와 수직선/수평선 밀도(Density) 시각화 이전 포스팅에서 히스토그램을 통해 연속된 데이터를 시각화 하는 방법과 제한을 설명했습니다. 히스토그램 대신 연속된 데이터의 분포를 확인하는 또 다른 방법은 밀도 시각화가 있습니다. 간단히 말하면, 울퉁불통한 히스토그램(빈도)을 부드러운 곡선(밀도)으로 변환하여 시각화 하는 것이 밀도 시각화 입니다. (Density Plot을 정확히 번역하기 애매하군요) 이 과정에서 히스토그램 시각화의 빈도를 연속된 밀도로 바꿔주는 수학적 기법이 동원되는데요. 이를 커널 함수(kernel function)이라고 부르며, 가우시안(gaussian)을 기본값으로 설정합니다. (데이터 과학에 관심이 있거나 관련 분야를 공부하신 분이라면 가우시안이라는 말이 익숙하실 겁니다. 혹은 전공에 따라 정규 분.. 2022. 7. 4.
ggplot 쉽게 배우기 (2) - 히스토그램 지난 기초 강의(1) 에 이어 ggplot의 주요 그래프에 대해 알아보겠습니다. 다시 한번 [데이터 + 배치 + 표현]을 기억하시고. library(tidyverse) 기본 세팅 후 시작합니다. 연속? 분리? 지난 시간에는 ggplot을 통한 시각화 중, 가장 많이 사용하는 산점도(Scatter Plot)를 그려봤습니다. [데이터+배치] + "점(표현)" 이라고 생각할 수도 있겠군요. 다른 표현 방식에는 어떤 것이 있을까요? 대부분의 사람들은 데이터 과학이나 연구를 해본 적이 없기에 이런 질문에 대답하기 어렵습니다. (그래서 시각화 초보의 경우 자동 추천 기능이 있는 Tableau를 사용하는 것도 나쁘지 않습니다) 문제를 간단히 하기 위해 데이터를 두 가지로 설정하겠습니다. - 1,2,3,4... 와 같.. 2022. 7. 2.
반응형