ResearchAlpha Leak

Conferences Topics Top Authors Rankings Browse All

Home/Authors/Huazheng Wang

Huazheng Wang

1

Affiliations

Affiliations

Beijing University of Posts and Telecommunications

Topic trends: 32,543 papers · similarity ≥ 0.4 · year ≥ 2024 · Data sourced from Semantic Scholar

34,598 papers | Abstracts: 31,650 (91.5%) | Citations: 34,598 (100.0%) | arXiv: 26,074 (75.4%)

Built: Feb 14, 2026, 11:22 PM AMS

10

papers

78

total citations

papers (10)

PARL: A Unified Framework for Policy Alignment in Reinforcement Learning from Human Feedback

Communication Efficient Distributed Learning for Kernelized Contextual Bandits

NEURIPS 2022arXiv

Unified Off-Policy Learning to Rank: a Reinforcement Learning Perspective

NEURIPS 2023arXiv

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

Tree Search-Based Evolutionary Bandits for Protein Sequence Optimization

Bandit Theory and Thompson Sampling-Guided Directed Evolution for Sequence Optimization

NEURIPS 2022arXiv

Adversarial Attacks on Combinatorial Multi-Armed Bandits

Stealthy Adversarial Attacks on Stochastic Multi-Armed Bandits

FCOM: A Federated Collaborative Online Monitoring Framework via Representation Learning

Provably Efficient Algorithm for Best Scoring Rule Identification in Online Principal-Agent Information Acquisition