ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Tengyang Xie

Tengyang Xie

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 9:33 AM AMS

8

papers

749

total citations

papers (8)

Bellman-consistent Pessimism for Offline Reinforcement Learning

NEURIPS 2021arXiv

Policy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement Learning

NEURIPS 2021arXiv

Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data

Adversarial Model for Offline Reinforcement Learning

NEURIPS 2023arXiv

Reinforce LLM Reasoning through Multi-Agent Reflection

Interaction-Grounded Learning with Action-Inclusive Feedback

NEURIPS 2022arXiv

Do We Need to Verify Step by Step? Rethinking Process Supervision from a Theoretical Perspective

Outcome-Based Online Reinforcement Learning: Algorithms and Fundamental Limits

NEURIPS 2025arXiv