C.W.K.
Stream
Lesson 01 of 06 · published

허깅페이스가 진짜 뭐야

~30 min · hub, ecosystem

Level 0스카우트
0 XP0/50 lessons0/10 achievements
0/120 XP to next level120 XP to go0% complete

AI 의 깃허브 — 그런데 가중치까지 들고 있어

허깅페이스 (HF) 는 모던 AI 스택의 오픈웨이트 운영 허브야. 사람들이 귀엽게 비유하지 — “AI 의 깃허브” — 근데 사실 플랫폼 한 개가 네 가지 일을 동시에 해. 레포 호스팅 (Git 백업된 모델/데이터셋/Space 레포), 발견 표면 (수백만 레포에 검색 + 필터), 실행 레이어 (인퍼런스 위젯, Inference API, TGI, Spaces), 그리고 커뮤니티 플랫폼 (좋아요, 토론, Papers, Daily) — 네 개가 한 도메인에서 같이 돌아.

이 네 가지를 뭉뚱그리는 게 가장 흔한 입문 실수야. “허깅페이스 = pip install transformers” 라고 생각하면 플랫폼이 끈끈한 이유 전부를 놓쳐. Hub 레지스트리고, 모더레이션 레이어고, 라이선스 표면이고, 리더보드고, abuse-control 시스템이야. 모델 카드 push 하는 건 README 가 아니라 계약서를 발행하는 거지.

숫자 감각

2026 기준 Hub 는 공개 모델 200만 개, 데이터셋 50만+ 개, Space 100만+ 개, 등록 사용자 1300만+ 명을 넘었어. 포춘 500 의 30% 정도가 org 계정을 갖고 있고. 숫자는 빨리 움직여 — 의미 있는 신호는 정확한 숫자가 아니라 “여기가 중앙 레지스트리다” 야. npm 이나 PyPI 처럼 다뤄: 큐레이션된 카탈로그가 아니라, 카드 / 다운로드 / 좋아요 / 프로바이더 통합으로 평판 그라디언트를 읽어내는 오픈 파이프.

모든 레포가 Git 히스토리, 브랜치, PR, diff 를 가져. 이 한 가지 설계 결정이 Hub 가 스케일하는 이유야 — 사람들이 이미 아는 도구, 익숙한 멘탈 모델로 federation. 첫 번째로 깔 거: Hub 클라이언트. 이 다음 모든 코드가 거기 의존해.

Code

Hub 클라이언트 + Transformers 깔기·bash
# CPU 베이스라인 — 이 퀘스트 대부분 레슨은 이거면 충분
pip install --upgrade huggingface_hub transformers datasets

# Apple Silicon / MPS (리눅스에선 skip)
pip install --upgrade torch torchvision torchaudio

# Login (interactive — huggingface.co/settings/tokens 에서 토큰 복붙)
huggingface-cli login

# 확인
huggingface-cli whoami
첫 접촉: 트렌딩 모델 리스트·python
from huggingface_hub import HfApi

api = HfApi()
trending = list(api.list_models(sort="trending", limit=10))
for m in trending:
    print(f"{m.id:<60} downloads={m.downloads or 0:>9}  likes={m.likes or 0:>5}")

External links

Exercise

로그인 후 huggingface-cli whoami 돌려봐. 그다음 트렌딩 모델 / 데이터셋 / Spaces 각각 top 10 을 뽑아서 hf-trending-{date}.md 에 저장. 어떤 카테고리가 의외인지, 몇몇 org 가 독식하는 카테고리는 어디인지 기록.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.