Reviving The Classics: Active Reward Modeling in Large Language Model Alignment.

Published in arXiv (2025), 2025

Recommended citation: Shen, Yunyi*, Hao Sun*, and Jean-François Ton. "Reviving The Classics: Active Reward Modeling in Large Language Model Alignment." arXiv preprint arXiv:2502.04354 (2025). https://arxiv.org/abs/2502.04354