ComputerVision
-
[Paper Review] 4D Panoptic LiDAR Segmentation (Aygun et al., 2021)Paper Review/3D Vision 2026. 4. 10. 11:18
자율주행 자동차나 동적인 환경에서 작동하는 로봇에게 있어서 시간적 흐름을 고려한 시각적 이해는 필수적이다. 과거에는 이러한 장면 이해를 위해 여러 가지 기술들이 개별적으로 발전해 왔다. 예를 들어, 모든 점에 대해 '도로'나 '차량' 같은 범주를 정하는 의미론적 분할(Semantic Segmentation), 개별 물체의 위치를 찾는 객체 탐지(Object Detection), 그리고 같은 종류의 물체라도 각각을 구분해내는 인스턴스 세그멘테이션(Instance Segmentation) 등이 대표적이다. 여기에 시간이 더해지면 물체의 궤적을 쫓는 다중 객체 추적(Multi-Object Detection, MOT) 기술이 추가로 필요하게 된다.이러한 개별 분야들은 딥러닝 기반의 이미지 처리 기술과 포인트 세..
-
[Paper Review] CATSplat: Context-Aware Transformer with Spatial Guidancefor Generalizable 3D Gaussian Splatting from A Single-View ImagePaper Review/3D Vision 2026. 4. 5. 15:56
3D 장면 복원(3D scene reconstruction)은 2D 이미지들을 이용해 3D 공간 모델을 만드는 과정이며, 새로운 시점 합성(Novel View Synthesis, NVS)은 카메라가 찍지 않은 각도에서 본 장면을 가상으로 생성해내는 기술이다. 과거에는 NeRF(Neural Radiance Fields)라는 방식이 유행했는데, 이는 공간을 수학적인 함수로 표현하여 매우 사실적인 결과를 냈지만 계산량이 너무 많아 실시간으로 화면을 보여주기 어렵다는 단점이 존재했다.이러한 한계를 극복하기 위해 등장한 것이 바로 3D Gaussian Splatting(3DGS)이다. 3DGS는 공간을 수많은 미세한 '3D 가우스 타원체(Gaussian Primitives)'들의 집합으로 표현한다. 이 방식은 수..