ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Jiaming Ji

Jiaming Ji

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 11:22 PM AMS

9

papers

896

total citations

papers (9)

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset

NEURIPS 2023arXiv

Constrained Update Projection Approach to Safe Policy Optimization

NEURIPS 2022arXiv

SafeDreamer: Safe Reinforcement Learning with World Models

Safe RLHF-V: Safe Reinforcement Learning from Multi-modal Human Feedback

NEURIPS 2025arXiv

SAE-V: Interpreting Multimodal Models for Enhanced Alignment

Generative RLHF-V: Learning Principles from Multi-modal Human Preference

NEURIPS 2025arXiv

InterMT: Multi-Turn Interleaved Preference Alignment with Human Feedback

NEURIPS 2025arXiv

Safety Gymnasium: A Unified Safe Reinforcement Learning Benchmark

VOCE: Variational Optimization with Conservative Estimation for Offline Safe Reinforcement Learning