ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Rafael Rafailov

Rafael Rafailov

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 10:11 PM AMS

6

papers

8,534

total citations

papers (6)

Direct Preference Optimization: Your Language Model is Secretly a Reward Model

NEURIPS 2023arXiv

Diffusion Model Alignment Using Direct Preference Optimization

COMBO: Conservative Offline Model-Based Policy Optimization

NEURIPS 2021arXiv

Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

NEURIPS 2025arXiv

Visual Adversarial Imitation Learning using Variational Models

NEURIPS 2021arXiv