[논문리뷰] Thinking-while-Generating: Interleaving Textual Reasoning throughout Visual GenerationXinyan Chen이 [arXiv]에 게시한 'Thinking-while-Generating: Interleaving Textual Reasoning throughout Visual Generation' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] Step-Audio-R1 Technical Report이 [arXiv]에 게시한 'Step-Audio-R1 Technical Report' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] Scaling Spatial Intelligence with Multimodal Foundation Models이 [arXiv]에 게시한 'Scaling Spatial Intelligence with Multimodal Foundation Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] SRPO: Self-Referential Policy Optimization for Vision-Language-Action Models이 [arXiv]에 게시한 'SRPO: Self-Referential Policy Optimization for Vision-Language-Action Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] SAM2S: Segment Anything in Surgical Videos via Semantic Long-term Tracking이 [arXiv]에 게시한 'SAM2S: Segment Anything in Surgical Videos via Semantic Long-term Tracking' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] SAM 3D: 3Dfy Anything in Images이 [arXiv]에 게시한 'SAM 3D: 3Dfy Anything in Images' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] PartUV: Part-Based UV Unwrapping of 3D MeshesHao Su이 [arXiv]에 게시한 'PartUV: Part-Based UV Unwrapping of 3D Meshes' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] Nemotron Elastic: Towards Efficient Many-in-One Reasoning LLMs이 [arXiv]에 게시한 'Nemotron Elastic: Towards Efficient Many-in-One Reasoning LLMs' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] NaTex: Seamless Texture Generation as Latent Color Diffusion이 [arXiv]에 게시한 'NaTex: Seamless Texture Generation as Latent Color Diffusion' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] MiMo-Embodied: X-Embodied Foundation Model Technical Report이 [arXiv]에 게시한 'MiMo-Embodied: X-Embodied Foundation Model Technical Report' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] First Frame Is the Place to Go for Video Content Customization이 [arXiv]에 게시한 'First Frame Is the Place to Go for Video Content Customization' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] Draft and Refine with Visual Experts이 [arXiv]에 게시한 'Draft and Refine with Visual Experts' 논문에 대한 자세한 리뷰입니다.2025년 11월 21일
[논문리뷰] What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity이 [arXiv]에 게시한 'What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] VisPlay: Self-Evolving Vision-Language Models from Images이 [arXiv]에 게시한 'VisPlay: Self-Evolving Vision-Language Models from Images' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving TasksYiran Peng이 [arXiv]에 게시한 'Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving Tasks' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] Mixture of States: Routing Token-Level Dynamics for Multimodal Generation이 [arXiv]에 게시한 'Mixture of States: Routing Token-Level Dynamics for Multimodal Generation' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] Medal S: Spatio-Textual Prompt Model for Medical SegmentationTao Chen이 [arXiv]에 게시한 'Medal S: Spatio-Textual Prompt Model for Medical Segmentation' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] MHR: Momentum Human RigChris Twigg이 [arXiv]에 게시한 'MHR: Momentum Human Rig' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] Kandinsky 5.0: A Family of Foundation Models for Image and Video GenerationVladimir Arkhipkin이 [arXiv]에 게시한 'Kandinsky 5.0: A Family of Foundation Models for Image and Video Generation' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일
[논문리뷰] Instruction-Guided Lesion Segmentation for Chest X-rays with Automatically Generated Large-Scale Dataset이 [arXiv]에 게시한 'Instruction-Guided Lesion Segmentation for Chest X-rays with Automatically Generated Large-Scale Dataset' 논문에 대한 자세한 리뷰입니다.2025년 11월 20일