正文

小模型当老师效果更好:RLTs方法7B参数击败671B,训练成本降99%

admin