Qwen | DataAgent

AI 工程

阿里巴巴 Qwen-AgentWorld：不訓練 agent 行動，改訓練模型「預測環境」

2026-06-25 / 0 評論

阿里巴巴 Qwen-AgentWorld 把語言模型訓練成「環境本人」而非 agent：學預測下一個環境觀察，而不是學行動。結果一個從沒被當 agent 訓練的模型，在七個工具任務上全面變強，還能當可控模擬器取代昂貴的真...

閱讀全文

 Yang Abao
Ai, Generative ai, LLM

Qwen 1.5 MoE：突破大模型的性能瓶頸

2024-04-07 / 0 評論

引言在 AI 界的一場沉寂之後，阿里巴巴集團最近發布了一款備受矚目的人工智能語言模型——Qwen 1.5 MoE。這款模型以其 2.7 億的啟動參數，在多項基準測試中展現出了與 7B 級別大模型相匹敵的性能，為業界帶來...

閱讀全文

 Yang Abao