[논문리뷰] Large Language Models for Scientific Idea Generation: A Creativity-Centered Survey

수정: 2025년 11월 17일

링크: 논문 PDF로 바로 열기

저자: Fatemeh Shahhosseini, Arash Marioriyad, Ali Momen, Mahdieh Soleymani Baghshah, Mohammad Hossein Rohban, Shaghayegh Haghjooy Javanmard

핵심 연구 목표

본 설문조사는 대규모 언어 모델(LLM) 을 활용한 과학적 아이디어 생성의 고유한 도전을 다루며, 특히 창의성과 과학적 타당성 사이의 균형을 맞추는 방법을 탐구합니다. LLM 기반 과학 아이디어 발상 방법론을 체계적으로 종합하고, Boden의 창의성 분류Rhodes의 4P 프레임워크 를 통해 현황과 미래 연구 방향을 제시하는 것을 목표로 합니다.

핵심 방법론

LLM 기반 과학 아이디어 발상 방법론을 다섯 가지 상호보완적인 범주로 분류합니다: 외부 지식 증강 , 프롬프트 기반 분포 조정 , 추론 시간 확장 , 다중 에이전트 협업 , 파라미터 적응 및 학습 . 각 방법론은 창의성의 원천(Person, Process, Press)창의성 수준(Combinatorial, Exploratory, Transformational) 관점에서 분석되며, 과학적 아이디어 평가의 현재 관행과 과제도 함께 검토합니다.

주요 결과

본 조사는 현재 방법론이 주로 조합적(combinatorial) 또는 탐색적(exploratory) 창의성 수준 에 머무르며, 변혁적(transformational) 창의성 은 여전히 달성하기 어렵다는 점을 지적합니다. "프로세스" 및 "프레스" 관점 에서의 상당한 진전이 있었으나, "인물" 및 "제품" 차원 은 미개척 상태로 남아있습니다. 또한, 과학적 아이디어 평가를 위한 표준화된 측정 지표와 벤치마크 부족 이 주된 병목 현상으로 작용하여 창의성 평가가 모호하고 주관적이라는 점을 강조합니다.

AI 실무자를 위한 시사점

LLM 을 과학적 아이디어 생성의 강력한 도구로 활용할 수 있음을 보여주지만, 진정한 혁신을 위해서는 창의성과 과학적 견고성 의 균형을 맞추는 섬세한 설계가 필수적입니다. 외부 지식(RAG), 정교한 프롬프트 엔지니어링, 다중 에이전트 시스템 을 활용하여 아이디어의 참신성과 타당성을 높일 수 있습니다. 또한, 표준화된 평가 지표와 벤치마크 를 개발하고 인간 참여형 피드백 루프 를 통합하는 것이 LLM 의 과학적 발견 능력을 신뢰성 있고 체계적으로 발전시키는 데 중요합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

태그

#Review#Large Language Models#Scientific Discovery#Idea Generation#Creativity#Survey#AI in Science#Prompt Engineering#Multi-agent Systems#Evaluation Metrics

Review 의 다른글