回上列表
「WorldCompass」通過引入強化學習機制,直接「引導」模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。(hc/j)~
阿思達克財經新聞
網址: www.aastocks.com
騰訊混元開源首個面向世界模型 強化學習後訓練框架
2026/03/10 15:32
騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架「WorldCompass」,是一個專為長時序、交互式世界模型設計的強化學習(RL)後訓練框架。「WorldCompass」通過引入強化學習機制,直接「引導」模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。(hc/j)~
阿思達克財經新聞
網址: www.aastocks.com
![]() |

