ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Kaiwen Wang

Kaiwen Wang

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 4:44 AM AMS

6

papers

75

total citations

papers (6)

The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning

NEURIPS 2023arXiv

More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning

Deep Multi-Modal Structural Equations For Causal Effect Estimation With Unstructured Proxies

NEURIPS 2022arXiv

$Q\sharp$: Provably Optimal Distributional RL for LLM Post-Training

NEURIPS 2025arXiv

Value-Guided Search for Efficient Chain-of-Thought Reasoning

NEURIPS 2025arXiv

Switching the Loss Reduces the Cost in Batch Reinforcement Learning