ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Cong Wei

Cong Wei

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 4:51 AM AMS

9

papers

2,019

total citations

papers (9)

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

UniIR: Training and Benchmarking Universal Multimodal Information Retrievers

OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision

Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers

Sparsifiner: Learning Sparse Instance-Dependent Attention for Efficient Vision Transformers

InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models

VISTA: Enhancing Long-Duration and High-Resolution Video Understanding by Video Spatiotemporal Augmentation

HyperSeg: Hybrid Segmentation Assistant with Fine-grained Visual Perceiver

Advancing Visual Large Language Model for Multi-granular Versatile Perception