오늘 알게 된 재미난 사실. LLM은 번역하지 않음. 모델 훈련시킬 때 언어 구분 없이 (약간의 앵커 제외) 동일 레벨로 훈련시켜도 모든 언어가 같은 세계에서 사용된 것이기 때문에, 추론 시점에 통계적으로 최적해를 찾으면 결국 모든 언어로 디코딩 가능한 "말이 되는" 중간 문장이 만들어진다고 함. https://t.co/VJXmz6ajdZ
1 / 2
오늘 알게 된 재미난 사실. LLM은 번역하지 않음. 모델 훈련시킬 때 언어 구분 없이 (약간의 앵커 제외) 동일 레벨로 훈련시켜도 모든 언어가 같은 세계에서 사용된 것이기 때문에, 추론 시점에 통계적으로 최적해를 찾으면 결국 모든 언어로 디코딩 가능한 "말이 되는" 중간 문장이 만들어진다고 함. https://t.co/VJXmz6ajdZ