職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
1、負責強化學習(Reinforcement Learning, RL)算法的研發與優化,探索其在智能決策、機器人控制、游戲AI、廣告推薦等場景的應用;
2、結合業務需求,設計并實現高效、可擴展的強化學習算法,包括但不限于DQN、PPO、SAC、Multi-Agent RL、Meta RL等;
3、參與大規模分布式強化學習系統的開發,解決模型訓練、部署中的性能與穩定性問題;
4、與產品、數據團隊緊密協作,推動算法在真實場景中的落地與迭代;
截止日期:2026年03月18日
招聘人數:2人
工作地點
地址:北京朝陽區北京-朝陽區望京科技園E座


職位發布者
趙晉HR
北京招招才科技有限公司

-
計算機軟件
-
100-199人
-
私營·民營企業
-
北京市朝陽區來廣營街道望京誠盈中心1號樓12層1204
相似職位
-
C 軟件工程師 25000-40000元海淀區 應屆畢業生 本科貝殼找房(北京)科技有限公司
-
ai創新應用算法工程師(j82286) 30000-60000元海淀區 應屆畢業生 本科百度在線網絡技術(北京)有限公司
-
推薦算法工程師 30000-60000元海淀區 應屆畢業生 本科百度在線網絡技術(北京)有限公司
-
多模態大模型算法工程師 30000-60000元海淀區 應屆畢業生 本科百度在線網絡技術(北京)有限公司
-
云原生微服務研發工程師(j80662) 20000-40000元海淀區 應屆畢業生 本科百度在線網絡技術(北京)有限公司
-
云原生容器網絡工程師(j80661) 20000-40000元海淀區 應屆畢業生 本科百度在線網絡技術(北京)有限公司