반응형
이 글은 이전 글에서 이어지는 내용이다.
이전 글에서 kaggle에서 dataset을 다운로드 받기까지 해봤다.
이제 다운로드 받은 csv 파일을 열어볼 차례다.
1. pandas library 설치하기
!pip install pandas
주피터 노트북 사용자라면 default로 설치되어 있다. 판다스는 오픈소스 데이터 분석, 조작툴이다.
2. pandas 를 불러오고, csv 파일 읽기
import pandas as pd
coke = pd.read_csv("COCO COLA.csv")
type(coke)
판다스를 불러오고, pd.read_csv() 기능을 이용해 csv 파일을 불러올 수 이싿.
나중에 계속 해서 쓰일 수 있기 때문에
불러오는 기능을 coke 로 정의를 내려두었다.
pandas.core.frame.DataFrame
성공하면 이렇게 나온다.
실패하면, csv 파일이 파이썬이 실행되고 있는 위치와 동일한 지를 확인해보자. 나는 이거 때문에 엄청 헤맸다.
3. csv 데이터 읽어보기
>>> len(coke)
15096
>>> coke.shape
(15096, 7)
len 은 데이터의 열의 갯수를 알려준다. 코카콜라 csv는 열이 15096개가 있다는 뜻이다.
.shape는 데이터의 차원을 알려준다. 이 경우 행 15096, 열 7 로 구성된 데이터프레임이라는 뜻이다.
4. 처음 5열 열어보기
coke.head()
불러온 파일이 실제로 자신이 원하는 데이터를 담고 있는 지 확인하기 위해서 처음 5열을 볼 수 있다.
반응형
'Programming > Python' 카테고리의 다른 글
파이썬 pandas loc 개념과 예제, 사용법, 데이터 인덱싱과 슬라이싱 방법 (0) | 2021.12.31 |
---|---|
reset_index(drop=True) 예제 (0) | 2021.12.31 |
Kaggle 에서 dataset 다운로드 받기 opendatasets library (0) | 2021.12.30 |
파이썬으로 트위터 스크랩하기 (0) | 2021.12.29 |
파이썬 기본 개념 - 식별자 (0) | 2021.12.28 |