국제 벤치마크 5종 최고 성능…행동 분야 ‘GPT’ 주목
KAIST 김대수 교수팀, 골격 좌표를 토큰으로 변환
‘입과 입 맞대는 접촉’ 핵심 결함 AI가 독자 발견
인공지능 모델 '비헤이버트' 이미지. ⓒKAIST
KAIST 뇌인지과학과 김대수 교수 연구팀이 동물의 골격 움직임을 언어의 단어처럼 읽고 행동의 의미까지 해독하는 인공지능(AI) 모델 ’비헤이버트(BehaVERT)’를 1일 공개했다.
이 모델은 사전에 어떤 생물학적 지식도 없는 상태에서 자폐 모델 생쥐의 핵심 사회행동 결함을 스스로 찾아냈으며, 국제 표준 벤치마크 5종에서 기존 최고 수준의 성능을 모두 뛰어넘었다.
비헤이버트는 생쥐의 코·귀·척추·사지·꼬리 등 신체 부위의 골격 좌표를 자연어의 단어에 해당하는 ’토큰(token)’으로 바꿔 BERT 기반 트랜스포머 모델에 넣어 학습하는 방식으로 돌아간다.
이 과정을 통해 AI는 단순히 행동을 분류하는 수준을 넘어 시간의 흐름 속에서 행동의 의미를 스스로 익혔다. 사람이 정답을 알려주지 않아도 행동 데이터만으로 학습하는 자기지도 학습법(masked keypoint modeling)도 함께 도입해, 적은 라벨로도 높은 성능을 끌어낼 수 있음을 보였다.
연구팀이 자폐 모델 생쥐(Shank3B 유전자 결손)와 정상 생쥐를 구분하는 실험을 한 결과, AI는 두 마리가 가까이 있는 ‘근접 상태’를 먼저 살핀 뒤 그 안에서 ’입과 입을 맞대는 접촉(oral-oral contact)’이라는 드문 상호 사회행동에 결정적으로 주목하는 것으로 드러났다.
이는 자폐 모델 생쥐가 접근 행동은 정상적으로 하지만 실제 상호작용에서 결함을 보인다는 기존 행동신경과학 연구 결과와 정확히 맞아 떨어진다. AI가 생물학적 지식 없이 행동 데이터만 보고 자폐의 핵심 특징을 재발견한 셈이다.
AI 내부 표현 공간을 분석했더니 행동들이 ▲이동성(mobility) ▲수직 주의(vertical attention) ▲사회적 관여(social engagement) 같은 해석 가능한 축을 따라 체계적으로 정렬돼 있었다. 이는 동물의 움직임에도 언어와 비슷한 의미 구조가 내재할 수 있음을 수치로 보인 첫 사례로 꼽힌다.
이 모델은 사회적 상호작용, 다개체 행동, 3차원 움직임 분석, 단일 동물 행동, 자폐 행동 분석 등 5개 국제 표준 벤치마크에서 모두 기존 최고 성능을 넘어섰다. 제1저자인 신승재 박사를 비롯한 연구진이 모두 생명과학을 전공한 연구자들로, 인공지능을 직접 익혀 행동 분석에 특화된 모델을 설계했다는 점도 눈길을 끈다.
연구팀은 모델 코드 전체와 웹 기반 골격·행동 라벨링 도구, 표준화 데이터셋도 함께 공개해 프로그래밍 지식이 없는 연구자도 자신의 실험에 바로 써볼 수 있도록 했다.
이번 연구는 쥐에서 학습한 모델이 생쥐 행동 분석에도 성공적으로 적용된다는 점을 확인함으로써, 다양한 동물 종에 두루 쓸 수 있는 ’행동 파운데이션 모델(Behavior Foundation Model)’의 가능성을 열었다는 평가를 받는다.
자연어 분야의 GPT처럼 행동 데이터에 특화된 거대 사전 학습 모델이 나올 수 있는 토대를 마련했다는 의미다. 이번 연구 결과는 컴퓨터비전 분야 최고 권위 학술지 중 하나인 International Journal of Computer Vision(IJCV)에 2026년 3월 24일 실렸다. 연구는 과학기술정보통신부 지원과 한국연구재단 주관으로 이뤄졌다.
김대수 교수는 “비헤이버트는 단순히 행동을 분류하는 것을 넘어 행동의 의미까지 이해할 수 있는 새로운 인공지능 모델”이라며 “향후 신약 개발과 정신질환 연구, 행동유전학 등 다양한 생명과학 분야에서 새로운 발견을 이끄는 핵심 연구 도구가 될 것으로 기대한다”고 말했다.
0
0
기사 공유
댓글
댓글 쓰기