ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Masatoshi Uehara

Masatoshi Uehara

1

Affiliations

Affiliations

Harvard

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 11:22 PM AMS

11

papers

307

total citations

papers (11)

Off-Policy Evaluation and Learning for External Validity under a Covariate Shift

NEURIPS 2020arXiv

Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design

Feedback Efficient Online Fine-Tuning of Diffusion Models

Provable Offline Preference-Based Reinforcement Learning

Provably Efficient Reinforcement Learning in Partially Observable Dynamical Systems

NEURIPS 2022arXiv

Future-Dependent Value-Based Off-Policy Evaluation in POMDPs

NEURIPS 2023arXiv

Doubly Robust Off-Policy Value and Gradient Estimation for Deterministic Policies

NEURIPS 2020arXiv

Provable Reward-Agnostic Preference-Based Reinforcement Learning

Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design

Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage

NEURIPS 2023arXiv

Mitigating Covariate Shift in Imitation Learning via Offline Data With Partial Coverage