ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Xiaoteng Ma

Xiaoteng Ma

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 1:13 AM AMS

8

papers

418

total citations

papers (8)

Mildly Conservative Q-Learning for Offline Reinforcement Learning

NEURIPS 2022arXiv

RORL: Robust Offline Reinforcement Learning via Conservative Smoothing

NEURIPS 2022arXiv

Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement Learning

NEURIPS 2021arXiv

Cross-Domain Policy Adaptation via Value-Guided Data Filtering

NEURIPS 2023arXiv

Efficient Multi-agent Reinforcement Learning by Planning

Single-Trajectory Distributionally Robust Reinforcement Learning

Learning Diverse Risk Preferences in Population-Based Self-Play

Exploit Reward Shifting in Value-Based Deep-RL: Optimistic Curiosity-Based Exploration and Conservative Exploitation via Linear Reward Shaping