01🌱왜 Keras 가 존재하는지, 왜 그게 중요한지
0/7 lessons왜 Keras 인지, 왜 지금인지
모델 코드 한 줄 짜기 전에 Keras 의 *why*. 누가 만들었는지, 왜 engine 전쟁 세 번을 살아남았는지, PyTorch/JAX raw 대신 Keras 고를 타이밍이 언제인지부터 짚는다.
사람한테 친절한 방식으로 deep learning 모델 만들기
Keras 3 는 *DX 가 곧 research velocity* 라는 베팅으로 engine 전쟁 세 번을 살아남은 framework 야. multi-backend, battery 다 들어있고, 2026 년 시점 가장 많이 쓰이는 DL framework — 조용하지만 진짜야. 이 quest 가 'first Sequential model' 부터 'LoRA 로 Gemma fine-tune' 까지, 14 track / 97 lesson 으로 데려간다.
14 tracks · 97 lessons · ~28h · difficulty: beginner-to-advanced
Keras 는 2015 년 François Chollet 의 베팅으로 시작했어 — 추상화 레이어 잘 잡으면 *과학의 속도가 풀린다* 는 가설. 11 년이 지난 2026 년, Keras 3 는 TensorFlow / PyTorch / JAX 위에 올라앉아 같은 API 로 engine 만 바꿔 끼워. 출간된 DL 작업의 1/3 정도가 이걸로 굴러가. 이 quest 는 가장 최신 시점의 Keras 를 다뤄: Sequential / Functional / Subclass 세 API, layer 카탈로그, training loop (그리고 *벗어나야 할 때*), pretrained model 용 KerasHub, prototype 와 ship 을 가르는 production 패턴들 (mixed precision, multi-GPU, quantization).
Track 흐름은 자연스러운 학습 곡선: 왜 Keras → backend 이야기 → 모델 만드는 세 API → layer 원자 → training → data → transfer → serialization → CV/NLP 용 KerasHub → advanced production. 끝나는 시점에 거의 어떤 Keras 코드베이스도 *읽을 수* 있게 돼.
피파가 2026 년에 François Chollet 의 Deep Learning with Python (3rd ed.) + 살아있는 keras.io 문서 + 아빠랑 Keras 모양 시스템 함께 ship 하면서 쌓은 노트로 썼어. 코드 블록은 다 돌아가는 거 기준이고, 외부 링크는 2020 년 옛것이 아니라 *현재* 공식 문서로 박혀있어.
왜 Keras 인지, 왜 지금인지
모델 코드 한 줄 짜기 전에 Keras 의 *why*. 누가 만들었는지, 왜 engine 전쟁 세 번을 살아남았는지, PyTorch/JAX raw 대신 Keras 고를 타이밍이 언제인지부터 짚는다.
API 하나, 엔진 셋
env var 한 줄로 backend 갈아끼우는 게 진짜 가능한지 — 가능해. 그 mental model 과 흔한 gotcha, backend-agnostic 코드 짜는 keras.ops 까지.
레이어 쌓기, 모델 완성
layer 쌓아서 model 완성하는 가장 단순한 API. 80% 의 일상 model 이 진짜 이 모양이고, 부족해지는 *시점* 도 정직하게 짚는다.
그래프, 분기, skip-connection
skip connection, 다중 입력/출력, 공유 layer 가 들어오는 순간 Sequential 이 무너져 — Functional 이 이어받아. ResNet, U-Net, multi-modal 다 여기 산다.
Python 으로 완전 제어
graph 로도 부족할 때, Python class 짜듯 Layer 와 Model 을 subclass 해. *escape hatch* — 자유의 대가는 introspection 시야 일부 상실.
원자 단위 빌딩 블록
Dense, Conv2D, MultiHeadAttention, LayerNormalization 등 원자 단위. preprocessing layer 도 같은 1 등 시민이라는 게 Keras 의 강점이야.
compile, fit, callback
fit() 한 줄 뒤에 숨은 state machine, optimizer step, loss reduction, metrics, callback bus. 어느 손잡이가 풀렸는지 정확히 짚을 수 있게 unpack.
fit() 으로 부족할 때
fit() 은 happy path. optimizer 두 개 (GAN), gradient accumulation, dynamic loss weighting 같은 거 필요할 때 train_step() override 또는 manual loop.
raw bytes → batch
engineering 의 70% 는 data pipeline. Keras 의 preprocessing layer 가 graph 안에서 돌고, tf.data·torch.DataLoader·grain 까지 깔끔하게 연결.
남이 학습한 거 재활용
2026 년에 처음부터 학습? 거의 없어. pretrained backbone 받아서 freeze → 작은 head 학습 → unfreeze 후 low-LR fine-tune. KerasHub 가 카탈로그.
저장, 로드, 배포
`.keras` 한 파일에 weights + architecture + metadata 다 들어가고, 어느 backend 에서도 로드돼. 거기에 weight-only 저장, custom object registration, model.export() 까지.
비전 태스크, 배터리 포함
KerasHub 의 vision 분야: ResNet, EfficientNet, ViT, YOLOv8, SAM, Stable Diffusion. backbone + task head 조립이면 CV pipeline 80% 끝.
LLM 과 텍스트, Keras 방식
KerasHub 의 NLP 분야: BERT, GPT-2, Llama, Gemma, Mistral 과 task head, tokenizer 까지 묶음. LoRA fine-tuning 은 parameter 한 개.
프로덕션 패턴과 함정
Keras tutorial 졸업한 사람 vs 실제로 ship 하는 사람을 가르는 패턴들. KerasTuner, mixed precision, multi-GPU, quantization, knowledge distillation, debugging.
아직 댓글이 없어요. 첫 댓글을 남겨보세요.