ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Yiyuan Zhang

Yiyuan Zhang

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 4:44 AM AMS

10

papers

491

total citations

papers (10)

UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio Video Point Cloud Time-Series and Image Recognition

OneLLM: One Framework to Align All Modalities with Language

Text-to-3D Generation with Bidirectional Diffusion using both 2D and 3D priors

Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities

FairGen: Enhancing Fairness in Text-to-Image Diffusion Models via Self-Discovering Latent Directions

Breaking the Encoder Barrier for Seamless Video-Language Understanding

MUG: Pseudo Labeling Augmented Audio-Visual Mamba Network for Audio-Visual Video Parsing

Modality Synergy Complement Learning with Cascaded Aggregation for Visible-Infrared Person Re-identification

Scaling Omni-modal Pretraining with Multimodal Context: Advancing Universal Representation Learning Across Modalities

Learning Beyond Still Frames: Scaling Vision-Language Models with Video