2025/02/09 11

[OUTTA Alpha팀 논문 리뷰 요약] Part 10-8. Titans: Learning to Memorize at Test Time

논문 링크: https://arxiv.org/abs/2501.00663  Titans: Learning to Memorize at Test TimeOver more than a decade there has been an extensive research effort on how to effectively utilize recurrent models and attention. While recurrent models aim to compress the data into a fixed-size memory (called hidden state), attention allows attending toarxiv.org OUTTA 논문 리뷰 링크: [2025-1] Titans: Learning to Memori..

[OUTTA Alpha팀 논문 리뷰 요약] Part 10-7. MAISI: Medical AI for Synthetic Imaging(3D CT 이미지 생성 모델)

논문 링크: https://arxiv.org/pdf/2409.11169v2 OUTTA 논문 리뷰 링크: [2025-1] 유경석 - MAISI: Medical AI for Synthetic Imaging [2025-1] 유경석 - MAISI: Medical AI for Synthetic Imaginghttps://arxiv.org/pdf/2409.11169v2 https://build.nvidia.com/nvidia/maisi maisi Model by NVIDIA | NVIDIA NIMMAISI is a pre-trained volumetric (3D) CT Latent Diffusion Generative Model.build.nvidia.com AbstractMAISI (Medical AI for S..

[OUTTA Alpha팀 논문 리뷰] Part 10-6. Knowledge Distillation 변천사

논문 링크 1: Distilling the Knowledge in a Neural Network: 1503.02531논문 링크 2: Knowledge Transfer via Distillation of Activation Boundaries Formed by Hidden Neurons: 1811.03233논문 링크 3: Relational Knowledge Distillation: 1904.05068논문 링크 4: LARGE SCALE DISTRIBUTED NEURAL NETWORK TRAINING THROUGH ONLINE DISTILLATION: 1804.03235논문 링크 5: Be Your OwnTeacher: Improve the Performance of Convolutional Neural ..

[OUTTA Alpha팀 논문 리뷰 요약] Part 10-5. InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation

논문 링크: https://arxiv.org/pdf/2404.02733 참고 논문 리뷰 링크: [논문리뷰] InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image GenerationHTML 삽입미리보기할 수 없는 소스arXiv paper codeHaofan Wang, Qixun Wang, Xu Bai, Zekui Qin, Anthony ChenInstantX Team3 Apr 2024Abstract별도의 학습 없이 레퍼런스 이미지를 활용한 diffusion 모델은 개인" data-og-host="yeonsikc.tistory.com" data-og-source-url="https://yeonsikc.tistory.com/13" data-og..

[OUTTA Alpha팀 논문 리뷰 요약] Part 10-4. SAM: Segment Anything Model

논문 링크: arxiv.org/pdf/2304.02643 OUTTA 논문 리뷰 링크: [2025-1] 김경훈 - SAM (Segment Anything Model) [2025-1] 김경훈 - SAM (Segment Anything Model)원본 논문 링크 : https://arxiv.org/abs/2304.02643 Segment AnythingWe introduce the Segment Anything (SA) project: a new task, model, and dataset for image segmentation. Using our efficient model in a data collection loop, we built the largest segmenblog.outta.ai1. Abst..

[OUTTA Alpha팀 논문 리뷰] Part 10-3. IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models

논문 링크: https://arxiv.org/pdf/2308.067211. Introduction배경 및 문제점최근 GLIDE, DALL-E 2, Imagen, Stable Diffusion(SD), eDiff-I, RAPHAEL 등의 대형 텍스트-이미지 확산 모델(Diffusion Model)이 강력한 생성 능력을 보임.하지만 텍스트 프롬프트만으로 원하는 이미지를 생성하는 것은 어렵고 복잡한 프롬프트 엔지니어링(Prompt Engineering)이 필요.텍스트는 복잡한 장면이나 개념을 표현하는 데 한계가 있음.이미지 프롬프트(Image Prompt)는 더 직관적이면서도 풍부한 정보를 제공할 수 있음.기존 연구의 한계DALL-E 2는 이미지 프롬프트를 지원하지만, 사전 모델을 필요로 하고 대부분의 텍스트..

[OUTTA Alpha팀 논문 리뷰] Part 10-2. SLEAP: A deep learning system for multi-animal pose tracking

논문 링크: SLEAP: A deep learning system for multi-animal pose tracking | Nature Methods1. Introduction동물 행동 연구에서 정량적 측정의 중요성자세 추정(Pose Estimation)은 신경과학, 생태학 등의 분야에서 필수적인 기술.인간 자세 추정 기술을 응용하여 단일 개체의 자세 추정이 가능하지만, 다중 개체 추적에는 어려움이 존재.다중 개체 자세 추정의 난제같은 이미지 내에서 여러 개체의 자세를 정확하게 분류(Part Grouping)해야 함.연속된 프레임에서 같은 개체를 식별하는 Identity Tracking 문제.기존 방법들은 Bottom-up (부위 검출 후 그룹화) 또는 Top-down (개체 검출 후 부위 추정) 방식..

[OUTTA Alpha팀 논문 리뷰] Part 10-1. FAMI: Temporal Feature Alignment and Mutual Information Maximization for Video-Based Human Pose Estimation

논문 링크: https://arxiv.org/abs/2203.15227 Temporal Feature Alignment and Mutual Information Maximization for Video-Based Human Pose EstimationMulti-frame human pose estimation has long been a compelling and fundamental problem in computer vision. This task is challenging due to fast motion and pose occlusion that frequently occur in videos. State-of-the-art methods strive to incorporate additionar..

[CV] 이론 정리

▼ 1. 머신러닝더보기1. 머신러닝의 정의인공지능(AI), 머신러닝(ML), 딥러닝(DL)의 관계:머신러닝은 인공지능의 하위 개념.딥러닝은 머신러닝의 하위 개념.머신러닝:데이터를 이용하여 신경망과 딥러닝을 통해 자율 학습.명시적 프로그래밍 없이 학습 가능.2. 머신러닝의 과정데이터를 수집하고 전처리.머신러닝 모델 학습.손실함수를 최적화하여 모델 파라미터 찾기.학습 완료 후 최적의 모델로 예측 및 응용.2. 데이터의 종류Training 데이터: 모델 훈련용 데이터.Validation 데이터: 모델 최적화를 확인하기 위한 데이터.Test 데이터: 최종 성능 검증용 데이터.3. 머신러닝 주요 용어데이터Label(Target): 예측하고자 하는 값 (예: y).Feature: 입력 변수 (예: x1,x2,…,x..