매개변수의 5%에 대해서만 SuperDistillation을 수행하여 경량 토토 핫로 DeepSeek-R1에 가까운 성능을 달성하는 대규모 언어 토토 핫입니다''Tiny-R1-32B-미리보기''이 나타났습니다
DeepSeek-R1 정보
DeepSeek-R1은 여러분도 아시다시피 한동안 화제가 되었던 DeepSeek에서 개발한 대규모 언어 토토 핫로, 사용자 프롬프트를 세분화하여 단계별로 나누어 높은 정확도를 자랑합니다 또 다른 특징은 토토 핫이 공개되어 있다는 점인데, 공개되기 때문에 DeepSeek 기반의 토토 핫 개발이 활발히 진행되고 있습니다
Tiny-R1-32B-미리보기 정보
Tiny-R1-32B-Preview도 DeepSeek 기반 토토 핫 개발에서 나온 토토 핫입니다 DeepSeek-R1의 파생 제품으로 DeepSeek에서 출시한 DeepSeek-R1-Distill-Qwen-32B를 기반으로 SuperDistillation이라는 기술을 적용하여 특정 영역(수학, 코딩, 과학)에 대한 토토 핫의 기능을 향상시킵니다
실제 강화 방법
구체적으로 우리는 DeepSeek-R1-Distill-Qwen-32B에 SFT(감독 미세 조정)를 적용하여 세 가지 영역(수학, 코딩 및 과학) 특정 토토 핫을 만들었습니다 우리는 오픈 소스 데이터의 질문을 씨앗으로 사용했습니다 한편, 수학, 코딩, 과학 작업에 대한 응답은 DeepSeek-R1에 의해 생성되어 각 도메인에 대한 특화된 토토 핫을 생성했습니다 마지막으로 Mergekit 도구를 활용하여 세 가지 도메인별 토토 핫을 병합하여 전반적으로 뛰어난 성능을 보이는 Tiny-R1-32B-Preview를 만들었습니다
아래 표는 수학, 코딩 및 과학 정확도 벤치마크 결과를 보여줍니다
Tiny-R1-32B-Preview는 수학 분야에서 특히 높은 성능을 보여 대형 토토 핫인 DeepSeek-R1-Distill-Llama-70B의 성능을 능가하고 DeepSeek-R1에 접근하는 높은 성능을 자랑합니다
| 토토 핫 | 수학(AIME 2024) | 코딩(LiveCodeBench) | 과학(GPQA-다이아몬드) |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-32B | 72.6 | 57.2 | 62.1 |
| DeepSeek-R1-Distill-Llama-70B | 70.0 | 57.5 | 65.2 |
| DeepSeek-R1 (671B) | 79.8 | 65.9 | 71.5 |
| Tiny-R1-32B-미리보기 | 78.1 | 61.6 | 65.0 |
또한 이는 세 가지 영역(수학, 코딩, 과학) 특정 토토 핫을 병합하기 전의 점수입니다 수학과 과학 과제에서 증가가 나타났으며, 특히 수학 과제에서는 5점의 증가가 나타났습니다 이는 아마도 토토 핫을 병합함으로써 다른 영역에서 사용되는 수학적 지식을 얻을 수 있었기 때문일 것입니다
| 토토 핫 | 수학(AIME 2024) | 코딩(LiveCodeBench) | 과학(GPQA-다이아몬드) |
|---|---|---|---|
| 수학 토토 핫 | 73.1 | - | - |
| 코드 토토 핫 | - | 63.4 | - |
| 과학 토토 핫 | - | - | 64.5 |
| 병합 토토 핫(Tiny-R1-32B-미리보기) | 78.1 | 61.6 | 65.0 |
해보았습니다
나는 대규모 언어 토토 핫이 취약한 수학적 작업을 해결하려고 노력했습니다Tiny-R1-32B-Preview와 DeepSeek-R1-Distill-Llama-70B 비교
문제는 1204×1402의 해를 찾는 것입니다 그런데 정답은1,688,008각각 다른 접근 방식이 필요하지만Tiny-R1-32B-미리보기정답을 찾았습니다
토토 핫 크기를 작게 만들면 그에 따라 계산량도 줄어들 수 있으므로 시스템 설계자로서 전력 소비 및 하드웨어를 고려하는 것이 중요합니다총 비용을 절감할 수 있는 장점이 있습니다
Tiny-R1-32B-미리보기

DeepSeek-R1-Distill-Llama-70B

*표시가 왜곡될 수 있다는 점에 유의하세요
마지막으로
기술 블로그를 끝까지 읽어주셔서 감사합니다 우리 팀은 AI 기술을 활용하여 고객의 요구에 부응하기 위해 끊임없이 새로운 도전을 하고 있습니다
AI 개발 경험이 있거나 LLM 개발에 관심이 있는 분은 지원해 주세요우리는 귀하의 기술과 열정을 듣기를 기대합니다
경력을 쌓을 새로운 졸업생을 모집하고 있습니다!

