기사 검색

검색어를 입력하세요
스카이 테크 블로그
[Tiny-R1-32B-Preview] SuperDistillation을 실행하여 경량 토토 핫임에도 불구하고 DeepSeek-R1에 가까운 성능을 달성합니다

[Tiny-R1-32B-Preview] SuperDistillation을 실행하여 경량 토토 핫임에도 불구하고 DeepSeek-R1에 가까운 성능을 달성합니다

경량 토토 핫 "Tiny-R1-32B-Preview"는 SuperDistillation 기술을 사용하여 대규모 언어 토토 핫 DeepSeek-R1에 가까운 성능을 달성합니다 이 토토 핫은 특히 수학, 코딩, 과학의 세 가지 영역에서 좋은 성능을 발휘합니다

매개변수의 5%에 대해서만 SuperDistillation을 수행하여 경량 토토 핫로 DeepSeek-R1에 가까운 성능을 달성하는 대규모 언어 토토 핫입니다''Tiny-R1-32B-미리보기''이 나타났습니다

DeepSeek-R1 정보

DeepSeek-R1은 여러분도 아시다시피 한동안 화제가 되었던 DeepSeek에서 개발한 대규모 언어 토토 핫로, 사용자 프롬프트를 세분화하여 단계별로 나누어 높은 정확도를 자랑합니다 또 다른 특징은 토토 핫이 공개되어 있다는 점인데, 공개되기 때문에 DeepSeek 기반의 토토 핫 개발이 활발히 진행되고 있습니다

Tiny-R1-32B-미리보기 정보

Tiny-R1-32B-Preview도 DeepSeek 기반 토토 핫 개발에서 나온 토토 핫입니다 DeepSeek-R1의 파생 제품으로 DeepSeek에서 출시한 DeepSeek-R1-Distill-Qwen-32B를 기반으로 SuperDistillation이라는 기술을 적용하여 특정 영역(수학, 코딩, 과학)에 대한 토토 핫의 기능을 향상시킵니다

실제 강화 방법

구체적으로 우리는 DeepSeek-R1-Distill-Qwen-32B에 SFT(감독 미세 조정)를 적용하여 세 가지 영역(수학, 코딩 및 과학) 특정 토토 핫을 만들었습니다 우리는 오픈 소스 데이터의 질문을 씨앗으로 사용했습니다 한편, 수학, 코딩, 과학 작업에 대한 응답은 DeepSeek-R1에 의해 생성되어 각 도메인에 대한 특화된 토토 핫을 생성했습니다 마지막으로 Mergekit 도구를 활용하여 세 가지 도메인별 토토 핫을 병합하여 전반적으로 뛰어난 성능을 보이는 Tiny-R1-32B-Preview를 만들었습니다

아래 표는 수학, 코딩 및 과학 정확도 벤치마크 결과를 보여줍니다

Tiny-R1-32B-Preview는 수학 분야에서 특히 높은 성능을 보여 대형 토토 핫인 DeepSeek-R1-Distill-Llama-70B의 성능을 능가하고 DeepSeek-R1에 접근하는 높은 성능을 자랑합니다

토토 핫 수학(AIME 2024) 코딩(LiveCodeBench) 과학(GPQA-다이아몬드)
DeepSeek-R1-Distill-Qwen-32B 72.6 57.2 62.1
DeepSeek-R1-Distill-Llama-70B 70.0 57.5 65.2
DeepSeek-R1 (671B) 79.8 65.9 71.5
Tiny-R1-32B-미리보기 78.1 61.6 65.0

또한 이는 세 가지 영역(수학, 코딩, 과학) 특정 토토 핫을 병합하기 전의 점수입니다 수학과 과학 과제에서 증가가 나타났으며, 특히 수학 과제에서는 5점의 증가가 나타났습니다 이는 아마도 토토 핫을 병합함으로써 다른 영역에서 사용되는 수학적 지식을 얻을 수 있었기 때문일 것입니다

토토 핫 수학(AIME 2024) 코딩(LiveCodeBench) 과학(GPQA-다이아몬드)
수학 토토 핫 73.1 - -
코드 토토 핫 - 63.4 -
과학 토토 핫 - - 64.5
병합 토토 핫(Tiny-R1-32B-미리보기) 78.1 61.6 65.0

해보았습니다

나는 대규모 언어 토토 핫이 취약한 수학적 작업을 해결하려고 노력했습니다
Tiny-R1-32B-Preview와 DeepSeek-R1-Distill-Llama-70B 비교

문제는 1204×1402의 해를 찾는 것입니다 그런데 정답은1,688,008
각각 다른 접근 방식이 필요하지만Tiny-R1-32B-미리보기정답을 찾았습니다

토토 핫 크기를 작게 만들면 그에 따라 계산량도 줄어들 수 있으므로 시스템 설계자로서 전력 소비 및 하드웨어를 고려하는 것이 중요합니다총 비용을 절감할 수 있는 장점이 있습니다

Tiny-R1-32B-미리보기

DeepSeek-R1-Distill-Llama-70B

*표시가 왜곡될 수 있다는 점에 유의하세요

마지막으로

기술 블로그를 끝까지 읽어주셔서 감사합니다 우리 팀은 AI 기술을 활용하여 고객의 요구에 부응하기 위해 끊임없이 새로운 도전을 하고 있습니다

AI 개발 경험이 있거나 LLM 개발에 관심이 있는 분은 지원해 주세요
우리는 귀하의 기술과 열정을 듣기를 기대합니다

경력을 쌓을 새로운 졸업생을 모집하고 있습니다!


\공유해주세요! /
  • X
  • 페이스북
  • LINE

입사 후 기술을 향상시키고 싶은 젊은 사람이든, 다양한 분야에서 자신의 경험을 활용하고 싶은 베테랑이든, 우리는 각 개인의 경험에 맞는 중견 채용을 제공합니다

스카이코퍼레이션의 소프트웨어 개발, 제품, 채용에 관한 문의사항은 아래 링크를 확인해주세요
문의하기