ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Shangtong Zhang

Shangtong Zhang

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 11:22 PM AMS

8

papers

53

total citations

papers (8)

Transformers Can Learn Temporal Difference Methods for In-Context Reinforcement Learning

Learning Retrospective Knowledge with Reverse Reinforcement Learning

NEURIPS 2020arXiv

Efficient Policy Evaluation with Offline Data Informed Behavior Policy Design

Revisiting a Design Choice in Gradient Temporal Difference Learning

Doubly Optimal Policy Evaluation for Reinforcement Learning

Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set

Efficient Multi-Policy Evaluation for Reinforcement Learning

Efficient Policy Evaluation with Safety Constraint for Reinforcement Learning