Pengyu Cheng | Alibaba Group researcher leading reinforcement-learning training for Qwen applications.

updated 1 public sources

language modelsagentsreinforcement learning

Current frame

Alibaba Group researcher leading reinforcement-learning training for Qwen applications.