1. 먼저 numpy와 pandas를 불러옵니다.
import pandas as pd
import numpy as np
2. pd.Series() 가 도대체 뭐지?
다짜고짜 인수 없이 실행을 시켜보면
이렇게 어떤걸 넣어야 하는지 알려줍니다.
한번 알려준대로 넣어봅시다.
3. 구글링을 최대한 활용합시다.
pandas Series 를 검색하면 document를 볼 수 있습니다.
data로는 iterable, scalar, dict 등을 넣을 수 있고
dtype으로는 str, numpy.dtype 등이 가능하네요. optional 하기 때문에 안넣을 수도 있고요.
4. Document를 참고하여 코드를 작성해보겠습니다.
5. 데이터 타입이 다른 값을 넣어봅시다.
int형과 str형을 넣었는데 dtype은 object로 떴습니다.
object는 pandas에서의 str이라고 합니다.
6. 변수에 넣어 int형 처럼 다룰 수 있는지 봐줍니다.
not all argu converted 라고 뜹니다.
7. 데이터 타입을 통일해서 다시 해봅시다.
연산이 잘 된 것을 볼 수 있습니다.
2와 4는 나머지가 0, 1과 3은 나머지가 1인 것으로 떴습니다.
Series는 한 가지 데이터 타입만 가질 수 있다는 것을 알 수 있었습니다.
8. pandas를 이용해 날짜 데이터를 봐봅시다.
pd.date_range("시작 날짜", periods = 시작 날짜 부터 해서 몇개의 날짜를 보여줄 것인지)
🌮 배운 코드 정리
1. pd.Series()는 index와 value로 이루어져 있다.
2. 단, Series는 한가지 데이터 타입만 가질 수 있다.
3. pd.date_range("시작날짜", periods = 몇일을 볼 껀지) 를 통해 날짜 데이터를 가져올 수 있습니다.
예시)
import pandas as pd
import numpy as np
pd.Series([1,2,3,4],dtype=np.float64)
pd.Series([1,2,3,4],dtype=str)
pd.Series(np.array([1,2,3]))
pd.Series({"Key":"Value"})
data = pd.Series([1,2,3,4])
data%2
'''
0 1
1 0
2 1
3 0
dtype: int64
'''
pd.date_range("20210101",periods = 6) # 시작 날짜, 총 몇일을 볼 껀지
모르는 함수가 나왔을 때, 다큐멘터리를 보고
어떻게 적용해보는지를 알 수 있었습니다.
'DS_Study > 서울시 CCTV 현황' 카테고리의 다른 글
[DS_study] pandas dataframe 정렬, 선택, 조회 (0) | 2022.05.25 |
---|---|
[DS_study] pandas 기초, DataFrame 선언 및 정보 탐색 (0) | 2022.05.25 |
[DS_study] 쥬피터로 필기를 해봅시다. (0) | 2022.05.25 |
[DS_study] 쥬피터에서 한 작업 VS code에서 다시 해보기 (0) | 2022.05.25 |
[DS_study] csv 파일과 excel 파일 읽기 (0) | 2022.05.25 |