ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Kevin Qinghong Lin

Kevin Qinghong Lin

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 8:46 PM AMS

16

papers

1,681

total citations

papers (16)

Show-o: One Single Transformer to Unify Multimodal Understanding and Generation

Egocentric Video-Language Pretraining

NEURIPS 2022arXiv

All in One: Exploring Unified Video-Language Pre-Training

UniVTG: Towards Unified Video-Language Temporal Grounding

EgoVLPv2: Egocentric Video-Language Pre-training with Fusion in the Backbone

ShowUI: One Vision-Language-Action Model for GUI Visual Agent

VideoLLM-online: Online Video Large Language Model for Streaming Video

Affordance Grounding From Demonstration Video To Target Image

Too Large; Data Reduction for Vision-Language Pre-Training

MovieBench: A Hierarchical Movie Level Dataset for Long Video Generation

Learning Video Context as Interleaved Multimodal Sequences

Learning Visual Prior via Generative Pre-Training

NEURIPS 2023arXiv

ROICtrl: Boosting Instance Control for Visual Generation

VG-TVP: Multimodal Procedural Planning via Visually Grounded Text-Video Prompting

VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary

Bootstrapping SparseFormers from Vision Foundation Models