ⓒ비드래프트
인공지능(AI) 기술기업 비드래프트가 개발한 과학추론 특화 대규모언어모델(LLM) 'Darwin-398B-JGOS'가 글로벌 AI 벤치마크에서 높은 성과를 기록했다고 16일 밝혔다.
비드래프트는 'Darwin-398B-JGOS'는 글로벌 AI 과학추론 벤치마크인 'GPQA Diamond'에서 90.9%의 정확도를 기록하며 허깅페이스(Hugging Face) 공인 리더보드 기준 최상위권에 올랐다.
생물학·물리학·화학 분야의 고난도 문제로 구성된 해당 벤치마크에서 이 모델은 전체 198개 문항 중 180개를 맞혔다. 특히 다수결 투표(Self-Consistency) 등 추가적인 성능 보정 기법 없이 단일 그리디(Greedy) 디코딩 방식만으로 이룬 성과다.
이번 모델은 비드래프트의 독자 AI 모델 진화 플랫폼인 'Darwin V9'을 기반으로 개발됐다. 약 4000억 개 규모의 파라미터를 갖춘 Mixture-of-Experts(MoE) 구조를 채택했으며 실제 추론 시에는 약 170억 개의 활성 파라미터만 사용해 효율성을 높였다.
Darwin V9은 처음부터 모델을 재학습시키는 방식이 아니라 기학습된 여러 모델의 우수한 신경망 구간(추론·코딩·언어 등)을 선별해 분석·재조합하는 기술이다.
이 달 현재 Darwin 기반 및 파생 모델은 700종 이상으로 확대됐으며 누적 다운로드 수는 100만 회에 육박한다.
국내 리더보드에서도 성과를 내고 있다. Darwin 기술 기반의 한국어 LLM 'JGOS-31B-Citizen'은 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 운영하는 K-AI 리더보드에서 종합 1위를 기록했다.
현재 비드래프트는 서울AI허브 입주기업으로서 정부의 첨단 그래픽처리장치(GPU) 지원 사업 및 정보통신산업진흥원(NIPA)의 AI 컴퓨팅 활용 사업 등에 참여해 연구 인프라를 확장하고 있다.
김민식 비드래프트 대표는 "이번 성과는 추가적인 점수 보정 없이 모델 본연의 추론 능력 만으로 얻어낸 결과"라며 "향후 과학 연구, 신약 개발, 산업 특화 AI, 공공 서비스 등 다양한 분야로 기술 적용 범위를 확대해 나가겠다"고 강조했다.
0
0
기사 공유
댓글
댓글 쓰기