제로베이스데이터사이언스스쿨

본 내용은 Anjul Tyagi님 (ph.D.student) 께서 Medium에 올린 기사 내용을 그대로 가져와 제가 공부하며 보기 쉽게 편집, 저희의 프로젝트 관련해서 고려해야할 점 등을 정리한 것입니다. 출처 : Anjul Tyagi, "3D point clouds bounding box detection and tracking", Medium, Jul 17, 2020, https://medium.com/@a_tyagi/3d-point-clouds-bounding-box-detection-and-tracking-pointnet-pointnet-lasernet-point-pillars-9439af14dfba . Anjul Tyagi, "Point Net", Medium, Jul 18, 2020, htt..
pandas data frame 에서 replace함수를 통해 str을 대체해주는 과정에서 'float' object has no attribute 'replace' (pandas) 에러가 발생하였다. 잉 float파일은 없는데 무슨 일일까? 정답은 결측값으로 인한 것이었다. 보면 전체 20375 데이터 중에서 구명칭이나 표준 영문명 등은 각 3942개와 19429개 와 같이 꽤나 많은 결측값이 보인다. NaN을 float로 해석했기 때문에 replace 함수가 쓰이지 못한 것이다. pd.fillna("") 결측값을 문자열 빈칸으로 채워주니깐 함수가 제대로 잘 작동되었다.
일반적으로 문제를 접하면 rule을 만들고, 이에 대한 분석과 코드 수정이 들어간다. 반면에 데이터 기반의 문제 해결은 데이터를 Machine Learning 에 넣고 이를 검증하고, 다시 에러를 분석하는 과정으로 이루어지는데, 보통 구현 또는 서비스 릴리즈를 위한 코딩을 하고, 머신러닝 자체에 대한 코딩을 할 일은 많지 않다고 한다. 모델 스스로 데이터를 가져와 업데이트를 하고 모델을 수정해나가는 경우도 있고 데이터를 분석하는 단계를 지나 머신러닝을 직접 실행해본 이후 결과를 보고, 문제에 대해 더 깊은 이해를 하고 이 과정을 반복하는 때도 있다. 출처 : 학습 출처 https://pinkwink.kr/ PinkWink 한 변두리 공학도의 블로그입니다. 재미있어 보이는 것들을 모두 기초스럽게 접근하는 ..
· Tableau
[ LOT ] 세부 수준에서 데이터 깊이를 정하고, 데이터를 집계하여 계산하는 방식 LOT 표현 식에는 세가지가 있다. ( INCLUDE, EXCLUDE, FIXED ) INCLUDE : 화면에 포함되지 않은 특정 차원을 포함하여 결과를 계산 EXCLUDE : 화면에 포함된 특정 차원을 제외하여 결과를 계산 FIXED : 화면에 상관 없이 특정 차원을 고정하여 결과를 계산 표현식 예시 ) { INCLUDE [차원1], [차원2] : SUM([측정값])} [ INCLUDE ] INCLUDE로 제품 중분류를 포함해 매출 합을 집계해줍시다. 제품 중분류에서 집계한 값을 제품 대분류에서 다시 합계로 집계했기 때문에 값이 같다고 합니다. 무슨 소리인지 모르겠습니다. 측정값 필드 두 개다 합계 에서 최댓값을 구하는..
scone
'제로베이스데이터사이언스스쿨' 태그의 글 목록