ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Amrit Singh Bedi

Amrit Singh Bedi

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 15, 2026, 11:26 AM AMS

8

papers

287

total citations

papers (8)

Variational Policy Gradient Method for Reinforcement Learning with General Utilities

NEURIPS 2020arXiv

MaxMin-RLHF: Alignment with Diverse Human Preferences

Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment

On the Sample Complexity and Metastability of Heavy-tailed Policy Search in Continuous Control

PIPER: Primitive-Informed Preference-based Hierarchical Reinforcement Learning via Hindsight Relabeling

Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles

Position: On the Possibilities of AI-Generated Text Detection

Closing the Gap: Achieving Global Convergence (Last Iterate) of Actor-Critic under Markovian Sampling with Neural Network Parametrization