연주의 공부 기록

  • 홈
  • 태그
  • 방명록

Paper Review/RL 1

[Euron 8th Research 논문 리뷰] Deep Q-Network: Learning Control Policies from Raw Pixels Using Reinforcement Learning

논문 링크: 1312.5602Abstract본 논문에서는 고차원의 센서 입력으로부터 강화학습을 통해 제어 정책(control policy)을 성공적으로 학습한 최초의 딥러닝 모델을 제안한다.제안된 모델은 convolutional neural network로 구성되어 있으며, 입력으로는 원시 픽셀(raw pixels)을 받고, 출력으로는 미래 보상을 추정하는 value function을 생성한다.이 모델은 Q-learning의 변형된 형태를 사용하여 학습되며, 학습 대상은 Atari 2600 게임 환경이다.이 모델은 아키텍처나 학습 알고리즘의 조정 없이 Arcade Learning Environment에 포함된 7가지 Atari 2600 게임에 동일하게 적용되었다.그 결과, 6개 게임에서 기존 모든 접근법..

Paper Review/RL 2025.03.30
이전
1
다음
더보기
프로필사진

연주의 공부 기록

Medical Image AI & CV 내가 보려고 만든 블로그💻 논문 & 코드 리뷰 및 이론 정리.

  • 분류 전체보기 (118) N
    • Theory (31) N
      • Computer Vision (14) N
      • 3D vision & Graphics (1)
      • DL & Medical AI (9)
      • LLM & NLP (3)
      • etc. (4)
    • Paper Review (64)
      • Deep Learning (5)
      • Image Classification (3)
      • Detection & Segmentation (12)
      • Generative AI (8)
      • Computer Vision (15)
      • Medical AI (10)
      • NLP & LLM (7)
      • Multi-Modal (3)
      • RL (1)
      • etc. (0)
    • AI & ML Tech (0)
      • Prompt Engineering (0)
    • Programming (23)
      • Python (0)
      • AI & ML (23)

Tag

maetok, classification, Distillation, voxelnet, selfmedmae, neuralrecon, patches are all you need?, pytorch, transformer, ResNet, LSTM, chexzero, keras, medvitv2, tinyface, RNN, DDPM, medvit, regression, multi-modal transformer architecture for medical image analysis and automated report generation,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바