< abstract >
기존 노력은 라이더 매우 희박한 point cloud를 Region Proposal Network (RPN) 으로 인터페이스 하기 위해 hand-crafted feature representations 에 집중 되었다.
In this works, 우리는 3D point cloud에 대한 일반적인 feature engineering의 필요성을 제거하고 VoxelNet 을 제안합니다.
VoxelNet이란? a generic 3D detection network that unifies feature extraction and bounding box prediction into a single stage, end-to-end trainable deep network
VoxelNet은 point cloud를 동일하게 할당된 3D Voxels 로 나누고, voxel feature encoding (VFE) layer 을 가지고 group of points를 통합된 feature representation으로 변환합니다.
이리하여 point cloud는 설명 가능한 체계적인 표현으로 인코딩 될 수 있습니다. 이를 가지고 RPN과 연결하여 일반적인 detection을 수행합니다.
KTTI 자동차 감지 벤처마크에 대한 실험으로 성과를 증명했고, 다양한 형상을 가진 물체를 가지고 효과적으로 서로 다른 representation들을 학습하여 라이더(3D 사진을 찍는 기계를 의미한다.) 만을 기반으로 보행자와 자전거 이용자를 3D로 감지하는 고무적인 결과로 이어졌습니다.
'Project > 무지성 논문 초록 읽기' 카테고리의 다른 글
[초록 읽기] PointPillars (2019) (0) | 2022.08.18 |
---|---|
[초록 읽기] SECOND (2018) (0) | 2022.08.18 |
[초록 읽기] PointNet (2017) (0) | 2022.08.18 |