EDA

· EDA
timedelta 구하기 import datetime diff_time = datetime.datetime.strptime('08:09',"%H:%M") - datetime.datetime.strptime('03:12',"%H:%M") diff_time.seconds/60/60 striptime 메소드를 쓰면 datetime 형식을 사용할 수 있게 된다. 시간간 (날짜도 가능하다.) 차이를 구하면, diff_time은 다음과 같이 seconds로 계산되어 나오는데 seconds attribute를 꺼내어 이를 60*60으로 나누면 다음과 같이 10분위 수로 표현된 시간을 구할 수 있게 된다. 사용 예) Q. 관람 시작 시각과 관람 종료 시각을 이용해 관람 시간을 구한다. ( 단, 관람 시간이 23시간이 ..
· EDA
province_dict = { '서울특별시': 0, '부산광역시': 1, '대구광역시': 2, '인천광역시': 3, '광주광역시': 4, '대전광역시': 5, '울산광역시': 6, '세종특별자치시': 7, '경기도': 8, '강원도': 9, '충청북도': 10, '충청남도': 11, '전라북도': 12, '전라남도': 13, '경상북도': 14, '경상남도': 15, '제주특별자치도': 16 } Q 1. 1. 먼저 칼럼 '광역'을 위의 dictionery를 기준으로 정렬하고 싶고, 2. 칼럼 '기초'의 사전적 순서의 역순으로 정렬하고 싶다. 어떻게 해야 할까? 정답은 2번 정렬이다. df_result = df_result.sort_values(by='기초', ascending=False ) df_res..
· EDA
커리큘럼 : 이유한님 캐글 필사 스터디 https://kaggle-kr.tistory.com/32 캐글 대회 : 2018 Data Science Bowl https://www.kaggle.com/competitions/data-science-bowl-2018 필사한 커널 : Teaching notebook for total imaging newbies (STEPHEN BAILEY) https://www.kaggle.com/code/stkbailey/teaching-notebook-for-total-imaging-newbies/notebook 분석이 처음인 사람을 위하여 본 캐글은 scipy와 numpy, skickit-image를 활용해 간단한 파이프 라인을 구성하는데 초점을 둡니다. 매개 변수를 최적화..
· EDA
Medal_dict = {'Gold':0,'Silver':1,'Bronze':2} df.sort_values(by='Medal', key=lambda x : x.map(Medal_dict)) 참고한 사이트 http://daplus.net/python-pandas-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%94%84%EB%A0%88%EC%9E%84%EC%9D%98-%EB%A7%9E%EC%B6%A4-%EC%A0%95%EB%A0%AC/ [python] Pandas 데이터 프레임의 맞춤 정렬 - 리뷰나라 열에 월 이름이 포함 된 Python pandas 데이터 프레임이 있습니다. 예를 들어 사전을 사용하여 사용자 정의 정렬을 수행하려면 어떻게해야합니까? custom_dict = {'March':0..
scone
'EDA' 카테고리의 글 목록