[논문리뷰] In-Video Instructions: Visual Signals as Generative Control이 [arXiv]에 게시한 'In-Video Instructions: Visual Signals as Generative Control' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] HunyuanVideo 1.5 Technical ReportFang Yang이 [arXiv]에 게시한 'HunyuanVideo 1.5 Technical Report' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] General Agentic Memory Via Deep Research이 [arXiv]에 게시한 'General Agentic Memory Via Deep Research' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Flow Map Distillation Without DataTommi Jaakkola이 [arXiv]에 게시한 'Flow Map Distillation Without Data' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Fidelity-Aware Recommendation Explanations via Stochastic Path IntegrationOren Barkan이 [arXiv]에 게시한 'Fidelity-Aware Recommendation Explanations via Stochastic Path Integration' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Extracting Interaction-Aware Monosemantic Concepts in Recommender SystemsOren Barkan이 [arXiv]에 게시한 'Extracting Interaction-Aware Monosemantic Concepts in Recommender Systems' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation이 [arXiv]에 게시한 'DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research이 [arXiv]에 게시한 'DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Controllable Layer Decomposition for Reversible Multi-Layer Image Generation이 [arXiv]에 게시한 'Controllable Layer Decomposition for Reversible Multi-Layer Image Generation' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Computer-Use Agents as Judges for Generative User Interface이 [arXiv]에 게시한 'Computer-Use Agents as Judges for Generative User Interface' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Chain-of-Visual-Thought: Teaching VLMs to See and Think Better with Continuous Visual TokensStephanie Fu이 [arXiv]에 게시한 'Chain-of-Visual-Thought: Teaching VLMs to See and Think Better with Continuous Visual Tokens' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] Budget-Aware Tool-Use Enables Effective Agent Scaling이 [arXiv]에 게시한 'Budget-Aware Tool-Use Enables Effective Agent Scaling' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] AutoEnv: Automated Environments for Measuring Cross-Environment Agent LearningAlphamasterliu이 [arXiv]에 게시한 'AutoEnv: Automated Environments for Measuring Cross-Environment Agent Learning' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] AICC: Parse HTML Finer, Make Models Better -- A 7.3T AI-Ready Corpus Built by a Model-Based HTML Parser이 [arXiv]에 게시한 'AICC: Parse HTML Finer, Make Models Better -- A 7.3T AI-Ready Corpus Built by a Model-Based HTML Parser' 논문에 대한 자세한 리뷰입니다.2025년 11월 25일
[논문리뷰] WorldGen: From Text to Traversable and Interactive 3D Worlds이 [arXiv]에 게시한 'WorldGen: From Text to Traversable and Interactive 3D Worlds' 논문에 대한 자세한 리뷰입니다.2025년 11월 24일
[논문리뷰] VisMem: Latent Vision Memory Unlocks Potential of Vision-Language ModelsYudong Zhang이 [arXiv]에 게시한 'VisMem: Latent Vision Memory Unlocks Potential of Vision-Language Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 24일
[논문리뷰] Video-R4: Reinforcing Text-Rich Video Reasoning with Visual RuminationJing Bi이 [arXiv]에 게시한 'Video-R4: Reinforcing Text-Rich Video Reasoning with Visual Rumination' 논문에 대한 자세한 리뷰입니다.2025년 11월 24일
[논문리뷰] VLA-4D: Embedding 4D Awareness into Vision-Language-Action Models for SpatioTemporally Coherent Robotic ManipulationGim Hee Lee이 [arXiv]에 게시한 'VLA-4D: Embedding 4D Awareness into Vision-Language-Action Models for SpatioTemporally Coherent Robotic Manipulation' 논문에 대한 자세한 리뷰입니다.2025년 11월 24일
[논문리뷰] Unveiling Intrinsic Dimension of Texts: from Academic Abstract to Creative StoryKristian Kuznetsov이 [arXiv]에 게시한 'Unveiling Intrinsic Dimension of Texts: from Academic Abstract to Creative Story' 논문에 대한 자세한 리뷰입니다.2025년 11월 24일
[논문리뷰] Taming Generative Synthetic Data for X-ray Prohibited Item DetectionRenshuai Tao이 [arXiv]에 게시한 'Taming Generative Synthetic Data for X-ray Prohibited Item Detection' 논문에 대한 자세한 리뷰입니다.2025년 11월 24일