프로그래밍 공부/데이터분석 3

[파이썬 데이터 분석] 주피터, 넘파이 기본 명령어 Level.1

데이터 이름: chipo 정보출력 print(chipo.shape) --> 데이터의 모양(크기) 출력 (a, b)로 출력되면 데이터는 총 a개이며, column은 b개이다. print(chipo.info()) --> 데이터의 정보 출력 chipo.head() --> 모든 데이터 출력 chipo.head(N): chipo 라는 Dataframe에서 순서대로 N개의 row 데이터를 보여줌. print(chipo.describe()) --> chipo dataframe에서 수치형 피처들의 요약 통계량 확인 print(chipo.column), print(chipo.index) --> column이름과 현재 위치를 보여준다. print(len(chipo['item_name'].unique())) --> item..

[파이썬 데이터 분석] 피처 형태의 종류, 피처간의 상관관계

피처 형태의 종류 1. 수치형 피처 a. 연속형 피처 (키, 몸무게): 어떤 구간 안의 모든 값을 데이터로써 가질 수 있다. b. 비연속형 피처 (나이): 셀 수 있으며, 일정 구간 안에서 정해진 몇 개의 값을 가져야 한다. 2. 범주형 피처 a. 순서 있는 범주형 피처 (학점): 순서가 있으나 수치는 아니다. b. 순서 없는 범주형 피처 (혈액형): 데이터가 구분되면서도 순서가 없다. 피처간의 상관관계 단순상관분석: 두 변수간의 선형적 관계를 상관계수로 표현하는 것. 상관관계를 시각화하기 위해 heatmap, pairplot을 사용할 수 있다. 다중상관분석: 두 개 이상의 독립변수들과 하나의 종속변수의 관계를 분석하는 기법

[파이썬 데이터 분석 00~01] 탐색, 시각화, 목적과 개발환경 구축

[유튜브 이것이 데이터 분석이다 with 파이썬을 듣고 정리한 글입니다.] 데이터의 탐색, 시각화, 목적 1. 탐색: 로우데이터(날것의 데이터)에서 인사이트를 발견하는 일 2. 시각화: 탐색으로 발견한 것을 다른사람도 볼 수 있게 하는 일 3. 목적: 데이터에선 목적을 정하는 게 중요하다. 데이터 분석 개발환경 구축 설치할 것: 아나콘다, 주피터 사용할 라이브러리 Pandas: 엑셀처럼 데이터를 행과 열의 형태로 구분지어서 사용할수 있도록 해준다. Numpy: 벡터연산, 행렬연산을 쉽게 도와준다. Matplotlib: 판다스나 넘파이로 정리된 데이터를 보기좋게 시각화 해준다. 위의 라이브러리 3개와 주피터를 "pip install 이름" 을 통해 설치해준다. Jupyter 기본 사용법 Pandas 기본 ..