728x90
반응형
SMALL
누구나 모델의 코드베이스를 가져다가 변형하거나 자신에게 맞도록 파인튜닝할 수도 있다는 뜻입니다. 기술적으로 deepseek r-1(흔히 r1으로 줄여 부름)은 deepseek-v3라는 대형 베이스 모델에서 파생되었습니다. 이후 고품질의 인간 레이블 데이터로 감독 학습(sft1
728x90
반응형
LIST