ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Zhenheng Yang

Zhenheng Yang

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 1:13 AM AMS

10

papers

965

total citations

papers (10)

Show-o: One Single Transformer to Unify Multimodal Understanding and Generation

OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation

Show-o2: Improved Native Unified Multimodal Models

NEURIPS 2025arXiv

Long Context Tuning for Video Generation

Parallelized Autoregressive Visual Generation

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

Weakly Supervised Instance Segmentation for Videos With Temporal Mask Consistency

InstanceCap: Improving Text-to-Video Generation via Instance-aware Structured Caption

DiCo: Revitalizing ConvNets for Scalable and Efficient Diffusion Modeling

NEURIPS 2025arXiv

SPAN: Spatial Pyramid Attention Network for Image Manipulation Localization