ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Yu Shen

Yu Shen

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 3:09 AM AMS

27

papers

393

total citations

papers (27)

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction

NEURIPS 2025arXiv

V-DETR: DETR with Vertex Relative Position Encoding for 3D Object Detection

Rethinking Reward Modeling in Preference-based Large Language Model Alignment

What Makes a Good Diffusion Planner for Decision Making?

SPARTUN3D: Situated Spatial Understanding of 3D World in Large Language Model

How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension

Framer: Interactive Frame Interpolation

VITA-Audio: Fast Interleaved Audio-Text Token Generation for Efficient Large Speech-Language Model

Refine Knowledge of Large Language Models via Adaptive Contrastive Learning

DivBO: Diversity-aware CASH for Ensemble Learning

NEURIPS 2022arXiv

KVFlow: Efficient Prefix Caching for Accelerating LLM-Based Multi-Agent Workflows

NEURIPS 2025arXiv

Modality-Specialized Synergizers for Interleaved Vision-Language Generalists

Orientation Matters: Making 3D Generative Models Orientation-Aligned

NEURIPS 2025arXiv

Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions

Reflection-Window Decoding: Text Generation with Selective Refinement

VideoVLA: Video Generators Can Be Generalizable Robot Manipulators

NEURIPS 2025arXiv

SysBench: Can LLMs Follow System Message?

API Pack: A Massive Multi-Programming Language Dataset for API Call Generation

Habitizing Diffusion Planning for Efficient and Effective Decision Making

FairViT: Fair Vision Transformer via Adaptive Masking

Zooming from Context to Cue: Hierarchical Preference Optimization for Multi-Image MLLMs

NEURIPS 2025arXiv

Fast, Accurate Manifold Denoising by Tunneling Riemannian Optimization

GUI Exploration Lab: Enhancing Screen Navigation in Agents via Multi-Turn Reinforcement Learning

NEURIPS 2025arXiv

UniRestore3D: A Scalable Framework For General Shape Restoration

CausalVerse: Benchmarking Causal Representation Learning with Configurable High-Fidelity Simulations

NEURIPS 2025arXiv

GAN-based Garment Generation Using Sewing Pattern Images

Gradient-Free Adversarial Training Against Image Corruption for Learning-based Steering