ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Wenyi Hong

Wenyi Hong

Google Scholar OpenReview

15

h-index

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 6:59 PM AMS

9

papers

3,747

total citations

papers (9)

CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer

CogView: Mastering Text-to-Image Generation via Transformers

NEURIPS 2021arXiv

CogAgent: A Visual Language Model for GUI Agents

CogView2: Faster and Better Text-to-Image Generation via Hierarchical Transformers

NEURIPS 2022arXiv

LVBench: An Extreme Long Video Understanding Benchmark

VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents

CogCoM: A Visual Language Model with Chain-of-Manipulations Reasoning

MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models

Inf-DiT: Upsampling any-resolution image with memory-efficient diffusion transformer.