[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(Keras 모델)

Programming/AI & ML

[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(Keras 모델)

YeonJuJeon 2025. 2. 15. 23:49

1. Keras 모델을 만드는 여러 가지 표현방법

1-1. Sequential 방식

import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Dense(2, input_shape=[2]))
model.add(tf.keras.layers.Dense(2))

x_1 = tf.constant([1,2])
x_2 = tf.constant([[1,2]])

model(x_2) 
model.predict(x_2)
model.call(x_2)
model.summary()

tf.keras.models.Sequential(): 레이어를 순차적으로 쌓아 구성하는 고수준 API.
첫 Dense(2, input_shape=[2]): 입력이 2차원(배치차원 제외), 출력 노드 2개.
- 내부적으로 2×2개의 weight와 2개의 bias를 가짐(총 2*2+2=6).
두 번째 Dense(2): 첫 번째 레이어의 출력(2차원)을 입력받아 2차원으로 매핑.
- 그 역시 2×2 weight + 2 bias = 6개 파라미터.
model.summary(): 레이어별 파라미터 수와 연결 정보를 요약 출력.
x_2 = tf.constant([[1,2]]): 배치 차원(1,2) 형태로 1개의 샘플.
model(x_2) vs model.predict(x_2):
- model(x_2)는 텐서 연산으로 즉시 결과를 텐서 형태로 반환.
- model.predict(x_2)는 넘파이 배열로 반환.

1-2. 모델에 다양한 모양의 입력 테스트

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Dense(2, input_shape=[2]))
model.add(tf.keras.layers.Dense(2))

x_test1 = tf.constant([[1,2]])
x_test2 = tf.constant([[1,2],[1,2]])
x_test3 = tf.constant([[[1,2],[1,2]], [[1,2],[1,2]]])
x_test4 = tf.constant([[[1,2,3],[4,5,6]], [[3,4,5],[4,5,6]]])

model(x_test3)
model(x_test4)

같은 모델: 2D 입력.
x_test3의 shape = (2,2,2) / x_test4의 shape = (2,2,3)
- 실제로는 (batch, 2), Dense에서 기대하는 shape가 (batch, 2).
- 3D 이상의 텐서를 Dense로 바로 넣으면 브로드캐스팅 및 에러 발생 가능.
- 여기서 model(x_test4) → 오류 또는 내부적으로 flatten-like 동작이 없으므로 모양 mismatch.
model_test2 = tf.keras.models.Sequential()
```
model_test2.add(tf.keras.layers.Dense(2, input_shape=[2,3]))
model_test2.add(tf.keras.layers.Dense(2))
```
- 이제 입력이 (batch, 2,3) 형태로 설정. 2D가 아니라 3D 입력임.
- Dense 레이어는 (2×3)=6개 차원을 한꺼번에 FC로 취급.
- 즉, 한 샘플이 shape=(2,3)인 행렬. Dense는 이를 모두 곱하여 units=2로 매핑.
  - model_test2(x_test4):

1-3. InputLayer를 명시적으로 쓰는 경우

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.InputLayer(input_shape=(2,2)))
model.add(tf.keras.layers.Dense(2))
model.add(tf.keras.layers.Dense(1))

model.summary()

InputLayer(...)를 통해 입력 형태를 명시적으로 설정 가능.
이 모델은:
- 입력: (batch, 2,2)
- 첫 Dense: 2×2=4개의 요소를 하나로 flatten해서 units=2로 매핑
- 다음 Dense: 2차원->1차원
model.summary()에서 param 계산을 볼 수 있음.

2. MLP

2-1. 기초

(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()
print(X_train.shape)
X_train = X_train / 255.0
X_test = X_test / 255.0

MNIST 로드: (60000, 28, 28) shape의 흑백 이미지.
정규화: /255.0로 픽셀값을 [0,1] 범위로 스케일링.
MLP를 위해선 보통 (batch, 784) 형태로 2D 변형(Flatten) 필요.

2-2. Flatten 예시

x = tf.keras.layers.Flatten()
x2 = x(X_train)
print(x2)

Flatten(): 마지막 축(28×28=784)을 1차원으로 펴줌.
원래 (60000,28,28) → (60000, 784).
이후 Dense를 적용하면, fully-connected(784->units).

3. MLP를 구성하는 다양한 방법

3-1. Option1 (직접 Activation Layer 사용)

input = tf.keras.Input(shape=(28,28))
x = tf.keras.layers.Flatten()(input)
x = tf.keras.layers.Dense(2)(x)
x = tf.keras.layers.Activation('relu')(x)

Flatten: (28,28)→784차원
Dense(2): 은닉 노드 2개 (단순 예시).
tf.keras.layers.Activation('relu'): ReLU를 별도 레이어로 둠.
- 이렇게 하면 BatchNorm이나 Dropout 등을 Activation 이전/이후 자유 배치 가능.

3-2. Option2 (좀 더 현실적인 구조)

input = tf.keras.Input(shape=(28,28))
x = tf.keras.layers.Flatten()(input)
x = tf.keras.layers.Dense(128)(x)
x = tf.keras.layers.Activation('relu')(x)
x = tf.keras.layers.Dropout(0.2)(x)
output = tf.keras.layers.Dense(10, activation='softmax')(x)

model = tf.keras.models.Model(input, output)
model.summary()

Flatten → Dense(128) + ReLU → Dropout(20%) → Dense(10, softmax).
요약: 784 input → 128 은닉 → 10 출력(분류용).
model.weights 또는 model.trainable_weights:
- 예: weights[0] = (784×128) 크기의 가중치, weights[1] = (128,)의 bias
- weights[2], weights[3] = 두 번째 Dense(128->10) 파라미터.

model.weights[0].shape  # ([784, 128])
model.weights[1].shape  # ([128])
model.weights[2].shape  # ([128])
model.weights[3].shape  # ([10])

첫 번째 Dense 레이어 파라미터 2개(가중치, 편향), 두 번째 Dense도 2개.
합쳐서 4개 파라미터 텐서.

이 로직:

(28,28) 이미지가 들어오면 Flatten으로 (batch,784) → Dense(128) + ReLU + Dropout(0.2) → Dense(10, softmax)
이런 전형적인 MLP 구조를 다양한 방법(Sequential, Model)으로 구현 가능.

결론

다양한 Keras API:
1. Sequential: 순차적 레이어 쌓기(간단).
2. Functional API: Input, Dense(...), etc.로 유연하게 연결 그래프 정의.
3. Mixed: Sequential 레이어를 부분적으로 Functional Model에 삽입하거나, InputLayer 등을 섞어 사용할 수 있음.
Flatten vs InputLayer:
- Flatten()은 (28,28)→(784) 변환.
- InputLayer(input_shape=(2,3)) 등으로 들어오는 텐서 차원을 명시.
model(x) vs model.predict(x):
- model(x) → 즉시 텐서 연산 수행, 결과가 Tensor
- model.predict(x) → 넘파이 array 반환, 내부적으로 batch iteration 등 처리.
MLP 예시: MNIST 로드 → 정규화 → Flatten → Dense(…)*n → Output Dense.
배치 차원: Keras 레이어는 항상 (batch_size, ...) 형태를 기본 가정.
- Dense는 마지막 (feature) 축을 입력으로 보고, units개의 노드로 매핑.

'Programming > AI & ML' 카테고리의 다른 글

[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(CNN 1) (0)	2025.03.09
[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(함수형 API_Wide_n_Deep, 다중입력모델_Wide_ (0)	2025.03.02
[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(신경망 구성요소 & 신경망 만들기) (0)	2025.02.09
[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(파이토치2) (0)	2025.02.01
[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(텐서플로우와 케라스2) (0)	2025.01.18

현재글[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(Keras 모델)

연주의 공부 기록

내가 보려고 만든 블로그💻 논문 & 코드 리뷰 및 이론 정리.

patches are all you need?, DDPM, classification, selfmedmae, multi-modal transformer architecture for medical image analysis and automated report generation, tinyface, medvitv2, medvit, ResNet, Distillation, keras, pytorch, transformer, chexzero, LSTM, neuralrecon, regression, maetok, RNN, voxelnet,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

연주의 공부 기록

[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(Keras 모델)

1. Keras 모델을 만드는 여러 가지 표현방법

1-1. Sequential 방식

1-2. 모델에 다양한 모양의 입력 테스트

1-3. InputLayer를 명시적으로 쓰는 경우

2. MLP

2-1. 기초

2-2. Flatten 예시

3. MLP를 구성하는 다양한 방법

3-1. Option1 (직접 Activation Layer 사용)

3-2. Option2 (좀 더 현실적인 구조)

결론

'Programming > AI & ML' 카테고리의 다른 글

'Programming/AI & ML'의 다른글

티스토리툴바

[OUTTA Alpha팀 Medical AI& 3D Vision 스터디] 딥러닝 1(Keras 모델)

1. Keras 모델을 만드는 여러 가지 표현방법

1-1. Sequential 방식

1-2. 모델에 다양한 모양의 입력 테스트

1-3. InputLayer를 명시적으로 쓰는 경우

2. MLP

2-1. 기초

2-2. Flatten 예시

3. MLP를 구성하는 다양한 방법

3-1. Option1 (직접 Activation Layer 사용)

3-2. Option2 (좀 더 현실적인 구조)

결론

'Programming > AI & ML' 카테고리의 다른 글

'Programming/AI & ML'의 다른글

관련글

티스토리툴바