-
阿里巴巴 Qwen-AgentWorld:不訓練 agent 行動,改訓練模型「預測環境」
阿里巴巴 Qwen-AgentWorld 把語言模型訓練成「環境本人」而非 agent:學預測下一個環境觀察,而不是學行動。結果一個從沒被當 agent 訓練的模型,在七個工具任務上全面變強,還能當可控模擬器取代昂貴的真...
-
Qwen 1.5 MoE:突破大模型的性能瓶頸
引言 在 AI 界的一場沉寂之後,阿里巴巴集團最近發布了一款備受矚目的人工智能語言模型——Qwen 1.5 MoE。這款模型以其 2.7 億的啟動參數,在多項基準測試中展現出了與 7B 級別大模型相匹敵的性能,為業界帶來...