그 연산
행렬 의 transpose = , 행과 열 swap. element 가 로 이동. 2×3 → 3×2; 정방 행렬은 정방 그대로지만 대각 가로질러 반사.
왜 매일 쓰게 됨
- matmul 모양 fix. (32, 128) 배치 × (256, 128) weight? Weight 를 (128, 256) 으로 transpose 먼저. "모양 맞추기" 디버깅의 절반이 어디
.T끼울지 찾기. - 대칭 정의. iff 행렬 대칭. ML 의 많은 중요 행렬 (covariance, Gram, kernel) 이 구조적으로 대칭.
- 데이터 분석에서 long ↔ wide reshaping. Pandas DataFrames 가 늘 pivot; 내부적으로 transpose flavor.
- Backprop bookkeeping. Chain rule 이 gradient 가 linear layer 거꾸로 흐를 때 transposed weight 만듦.
레고를 조립할 때 모양이 안 맞으면 블록을 살짝 돌려 끼우듯이, AI도 계산 중에 숫자 줄의 모양이 안 맞으면 Transpose(.T)라는 마법을 써서 숫자를 돌려준다. 그래야 퍼즐 조각처럼 딱 맞물려 행렬 곱셈이 시작될 수 있다. 대각선 거울 놀이를 했는데도 처음과 모양이 같다면 그 행렬은 아주 예쁜 '대칭 모양'을 가졌다는 뜻이다. AI는 이런 대칭 구조를 보면 데이터가 아주 규칙적이고 안정적이라고 판단한다.