엔비디아 네모 프레임워크로 '믿음' 학습 시간 최소화
엔비디아는 DGX 슈퍼팟(NVIDIA DGX SuperPOD) 플랫폼을 기반으로 KT 초거대 AI 모델 '믿음(Mi:dm)’을 구축했다고 16일 밝혔다.
KT 믿음은조(兆) 단위 데이터를 사전 학습한 자체 파운데이션 모델이다. 환각 현상이 일반 생성형 AI 서비스 대비 최대 70% 적게 발생하고 서비스 활용 시 AI 풀스택 인프라를 패키지로 제공받아 최대 50%까지 비용을 절감할 수 있다. KT는 이러한 차별점을 앞세워 3년 후 매출 약 1000억원대를 달성하겠다는 목표를 제시했다.
믿음 데이터 사전 학습에는 엔비디아네모 프레임워크(NeMo Framework)가 활용됐다. 네모 프레임워크는 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 제품이다. 데이터 처리, 학습, 평가, 생성형 AI 모델 추론 등 LLM 파이프라인 전반을 담당한다. 엔비디아는 "KT와 협력해 최적의 3D 병렬처리(parallelism)를 찾아 초거대 AI 믿음 학습에 사용되는 계산 처리량을 극대화했다"라고 설명했다.
믿음에는 LoRA, IA^3 등 다양한 미세학습 방법을 비교 분석해 구현했다. 해당 미세학습 방법은 네모 프레임워크와 텐서RT-LLM(TensorRT-LLM) 소프트웨어에서 지원된다. KT 믿음은 이 덕분에 효율적 미세학습(PEFT) 방식을 통한 맞춤화 서비스 지원도 가능해졌다.
0
0
기사 공유
댓글
댓글 쓰기