[논문리뷰] Reasoning Language Models for Root Cause Analysis in 5G Wireless Networks

2025년 8월 7일수정: 2025년 8월 7일

링크: 논문 PDF로 바로 열기

저자: Mohamed Sanat, Nicola Piovesan, Antonio De Domenico, Yibin Kang, Haozhe Zhang, Merouane Debbah, Fadhel Ayed

핵심 연구 목표

본 논문은 5G 모바일 네트워크에서 해석 가능성, 도메인 전문성, 인과적 추론이 필요한 루트 원인 분석(RCA) 의 어려운 문제를 해결하고자 합니다. 특히, 대규모 언어 모델(LLMs) 을 활용하여 성능 저하의 가장 가능성 있는 근본 원인을 식별하고, 구조화된 다단계 진단 설명을 생성하는 경량 프레임워크를 제안합니다.

핵심 방법론

저자들은 RCA 능력 벤치마킹을 위해 큐레이션된 TeleLogs 데이터셋 을 공개합니다. 핵심 방법론은 두 단계로 구성된 훈련 방식입니다: 첫째, 지도 학습 미세 조정(SFT) 에서는 LLM 기반 다중 에이전트 파이프라인 을 통해 도메인 지식을 추론 과정에 통합하는 다양하고 구조화된 사고 연쇄(CoT) 추적 을 생성합니다. 둘째, 강화 학습(RL) 에서는 그룹 상대 정책 최적화(GRPO) 를 적용하여 모델의 진단 성능과 추론 능력을 더욱 향상시킵니다.

주요 결과

제안된 SFT+RL 방법론 은 모든 모델 규모에서 기존 추론 및 비추론 모델들을 크게 능가했습니다. 특히, Qwen2.5-RCA-32B 모델 은 TeleLogs 테스트 세트에서 pass@1 정확도 95.86% 와 maj@4 정확도 96.18% 를 달성했으며, 이는 Qwen3-32B( 33.77% )나 DeepSeek R1 Distill-Llama-70B( 29.42% )와 같은 최첨단 기준선을 크게 앞지르는 결과입니다. 작은 규모의 Qwen2.5-RCA-1.5B 모델 조차 87.56% pass@1 를 기록하며 강력한 성능 향상을 보였습니다.

AI 실무자를 위한 시사점

이 연구는 도메인에 특화되고 추론 능력이 강화된 LLM 이 5G 네트워크와 같은 복잡한 시스템에서 강력하고 설명 가능한 진단 도구로 활용될 수 있음을 보여줍니다. 또한, TeleLogs 데이터셋 의 공개는 모바일 네트워크 RCA 연구 발전을 위한 귀중한 공공 자원을 제공합니다. 제안된 두 단계 SFT+RL 훈련 방법론 은 도메인별 다단계 추론 작업을 위한 LLM 미세 조정을 위한 견고한 접근 방식을 제시하며, 고품질의 구조화된 CoT 데이터 생성의 중요성을 강조합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization
현재글 : [논문리뷰] Reasoning Language Models for Root Cause Analysis in 5G Wireless Networks
다음글 [논문리뷰] SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience