ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Minghe Gao

Minghe Gao

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 3:13 AM AMS

7

papers

163

total citations

papers (7)

Fine-tuning Multimodal LLMs to Follow Zero-shot Demonstrative Instructions

Gradient-Regulated Meta-Prompt Learning for Generalizable Vision-Language Models

STEP: Enhancing Video-LLMs’ Compositional Reasoning by Spatio-Temporal Graph-guided Self-Training

Benchmarking Multimodal CoT Reward Model Stepwise by Visual Program

Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining

Boosting Virtual Agent Learning and Reasoning: A Step-Wise, Multi-Dimensional, and Generalist Reward Model with Benchmark

What Limits Virtual Agent Application? OmniBench: A Scalable Multi-Dimensional Benchmark for Essential Virtual Agent Capabilities