2025/02/20 5

[OUTTA Alpha팀 논문 리뷰] Part 12-1. Deep-Emotion: Facial Expression Recognition Using Attentional Convolutional Network

논문 링크: 1902.01019저자: Shervin Minaee (Expedia Group), Amirali Abdolrashidi (University of California, Riverside)발행일: 2019. 2. 4Abstract얼굴 표정 인식(Facial Expression Recognition, FER)은 지난 수십 년 동안 활발히 연구되어 온 분야이며, 여전히 높은 intra-class variation(동일한 감정이라도 다양한 표정이 존재하는 문제) 때문에 어려운 과제이다.기존 방법들은 SIFT, HOG, LBP와 같은 hand-crafted feature(사전에 정의된 특징)를 추출한 후, 특정 이미지 또는 비디오 데이터베이스에서 학습된 분류기를 사용하여 얼굴 표정을 인식하는 방식이 ..

[OUTTA Alpha팀 논문 리뷰 요약] Part 11-5. MAE: Masked Autoencoders Are Scalable Vision Learners

논문 링크: https://arxiv.org/abs/2111.06377 Masked Autoencoders Are Scalable Vision LearnersThis paper shows that masked autoencoders (MAE) are scalable self-supervised learners for computer vision. Our MAE approach is simple: we mask random patches of the input image and reconstruct the missing pixels. It is based on two core designs. First, wearxiv.org OUTTA 논문 리뷰 링크: [2025-1] 이재호 - Masked Autoenc..

[OUTTA Alpha팀 논문 리뷰 요약] Part 11-4. ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models

논문 링크: https://arxiv.org/pdf/2302.05543 OUTTA 논문 리뷰 링크: [2025-1] 주서영 - Adding Conditional Control to Text-to-Image Diffusion Models [2025-1] 주서영 - Adding Conditional Control to Text-to-Image Diffusion ModelsControlNetGitHub GitHub - lllyasviel/ControlNet: Let us control diffusion models!Let us control diffusion models! Contribute to lllyasviel/ControlNet development by creating an account on Git..

[OUTTA Alpha팀 논문 리뷰 요약] Part 11-3. VoxelMorph: A Learning Framework for Deformable Medical Image Registration

논문 링크: 1809.05231 OUTTA 논문 리뷰 링크: [2024-2] 백승우 - VoxelMorph: A Learning Framework for Deformable Medical Image Registration [2024-2] 백승우 - VoxelMorph: A Learning Framework for Deformable Medical Image RegistrationVoxelMorph: A Learning Framework for Deformable Medical Image RegistrationWe present VoxelMorph, a fast learning-based framework for deformable, pairwise medical image registration. Tra..

[OUTTA Alpha팀 논문 리뷰] Part 11-2. Inpaint Anything: Segment Anything Meets Image Inpainting

논문 링크: 2304.067901. IAbstract 기존 이미지 인페인팅 기술은 마스크 선택 및 홀 채우기에 어려움을 겪음.Inpaint Anything (IA)는 Segment Anything Model (SAM) 기반의 클릭 기반 인페인팅을 도입하여 사용자 친화적인 워크플로우 제공.주요 기능Remove Anything: 클릭한 객체 제거 후 자연스럽게 배경 복원.Fill Anything: 제거된 영역을 텍스트 프롬프트 기반으로 새 콘텐츠 생성하여 채움.Replace Anything: 클릭한 객체를 유지한 채 배경을 새로운 장면으로 변경.2. Related Works2.1 Motivation and Observation 최신 인페인팅 기법(LaMa, Repaint, MAT, ZITS 등)은 복잡한 구..