分享人:吴翼AGI正在迎来新范式,RL是LLM的秘密武器。最近几个月,我们能明显感受到头部AIlabs在形成一些新共识:posttraining的重要程度在提高,需要的计算资源可能在未来超过pretr...
2024-08-24 208 是 的新范式