回上列表
騰訊混元開源首個面向世界模型 強化學習後訓練框架
2026/03/10 15:32
騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架「WorldCompass」,是一個專為長時序、交互式世界模型設計的強化學習(RL)後訓練框架。

「WorldCompass」通過引入強化學習機制,直接「引導」模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。(hc/j)~

阿思達克財經新聞
網址: www.aastocks.com