AI 의 깃허브 — 그런데 가중치까지 들고 있어
허깅페이스 (HF) 는 모던 AI 스택의 오픈웨이트 운영 허브야. 사람들이 귀엽게 비유하지 — “AI 의 깃허브” — 근데 사실 플랫폼 한 개가 네 가지 일을 동시에 해. 레포 호스팅 (Git 백업된 모델/데이터셋/Space 레포), 발견 표면 (수백만 레포에 검색 + 필터), 실행 레이어 (인퍼런스 위젯, Inference API, TGI, Spaces), 그리고 커뮤니티 플랫폼 (좋아요, 토론, Papers, Daily) — 네 개가 한 도메인에서 같이 돌아.
이 네 가지를 뭉뚱그리는 게 가장 흔한 입문 실수야. “허깅페이스 = pip install transformers” 라고 생각하면 플랫폼이 끈끈한 이유 전부를 놓쳐. Hub 가 레지스트리고, 모더레이션 레이어고, 라이선스 표면이고, 리더보드고, abuse-control 시스템이야. 모델 카드 push 하는 건 README 가 아니라 계약서를 발행하는 거지.
숫자 감각
2026 기준 Hub 는 공개 모델 200만 개, 데이터셋 50만+ 개, Space 100만+ 개, 등록 사용자 1300만+ 명을 넘었어. 포춘 500 의 30% 정도가 org 계정을 갖고 있고. 숫자는 빨리 움직여 — 의미 있는 신호는 정확한 숫자가 아니라 “여기가 중앙 레지스트리다” 야. npm 이나 PyPI 처럼 다뤄: 큐레이션된 카탈로그가 아니라, 카드 / 다운로드 / 좋아요 / 프로바이더 통합으로 평판 그라디언트를 읽어내는 오픈 파이프.
모든 레포가 Git 히스토리, 브랜치, PR, diff 를 가져. 이 한 가지 설계 결정이 Hub 가 스케일하는 이유야 — 사람들이 이미 아는 도구, 익숙한 멘탈 모델로 federation. 첫 번째로 깔 거: Hub 클라이언트. 이 다음 모든 코드가 거기 의존해.