전문가보다 더 정확하게 신경과학 연구 결과를 예측하는 AI
최근 리뷰 : 03.07.2025

유니버시티 칼리지 런던(UCL) 연구진의 연구에 따르면 GPT와 같은 대규모 언어 모델(LLM)이 인간 전문가보다 더 높은 정확도로 신경과학 연구 결과를 예측할 수 있는 것으로 나타났습니다. Nature Human Behaviour 에 게재된 이 연구는 대규모 텍스트 데이터셋으로 훈련된 인공지능이 정보를 추출할 뿐만 아니라 과학적 결과를 예측하는 패턴을 식별할 수 있음을 보여줍니다.
과학 예측에 대한 새로운 접근 방식
이 연구의 주저자인 켄 로 박사(UCL 심리학 및 언어과학)에 따르면, ChatGPT와 같은 생성 AI의 개발은 일반화와 지식 추출에 있어 엄청난 가능성을 열어주었습니다. 그러나 연구진은 AI의 과거 정보 분석 능력을 연구하기보다는, AI가 미래의 실험 결과를 예측할 수 있는지 여부를 조사하기로 결정했습니다.
"과학적 진보는 종종 시행착오를 수반하며, 여기에는 시간과 자원이 소요됩니다. 숙련된 연구자조차도 문헌에서 중요한 세부 사항을 놓칠 수 있습니다. 저희 연구는 LLM이 패턴을 감지하고 실험 결과를 예측할 수 있음을 보여줍니다."라고 로 박사는 말했습니다.
BrainBench: AI 및 전문가 테스트
LLM의 역량을 테스트하기 위해 연구진은 BrainBench라는 도구를 만들었습니다. 이 도구에는 신경과학에서 발췌한 과학적 초록 쌍이 포함되어 있습니다.
- 한 초록에는 실제 연구 결과가 담겨 있습니다.
- 두 번째는 전문가가 만든 수정되었지만 그럴듯한 결과입니다.
15개의 언어 모델과 171명의 신경과학 전문가가 진짜 결과와 가짜 결과를 구분하는 능력을 테스트했습니다. 결과는 놀라웠습니다.
- AI는 평균 81%의 정확도를 보인 반면, 전문가들은 63%에 그쳤습니다.
- 지식에 대한 자기 평가가 가장 높은 전문가조차도 66%만을 달성했습니다.
개선된 모델과 관점
과학자들은 또한 오픈소스 LLM(Mistral의 한 버전)을 개량하여 신경과학 관련 학술 문헌을 학습시켰습니다. 그 결과 BrainGPT라는 이름의 모델은 86%라는 더욱 높은 정확도를 보였습니다.
브래들리 러브 교수(UCL)는 "저희의 연구는 AI가 실험 설계 과정에서 필수적인 부분이 되어 작업을 더 빠르게 할 뿐만 아니라 더 효율적으로 만들 수 있다는 것을 보여줍니다."라고 말했습니다.
기회와 도전
연구진은 이러한 접근 방식이 다양한 과학 분야에 적용될 수 있다고 주장합니다. 그러나 연구 결과는 중요한 질문을 제기합니다. 현대 과학 연구는 과연 충분히 혁신적인가? AI의 예측 정확도가 높다는 것은 많은 과학적 연구 결과가 기존 패턴과 일치함을 시사합니다.
로 박사는 "우리는 과학자들이 실험을 설계하고 가능한 결과를 예측하여 반복 작업의 속도를 높이고 더 정확한 정보에 기반한 결정을 내리는 데 도움이 되는 AI 도구를 개발하고 있습니다."라고 덧붙였습니다.
AI 활용에 있어서 이러한 획기적인 발전은 과학적 발견을 가속화하고 전 세계적으로 연구의 효율성을 향상시킬 것으로 기대됩니다.