-
Self-Harness:凍結模型權重,讓 agent 自己改寫執行規則就 +33–60%
上海 AI 實驗室提出 Self-Harness:模型權重完全不動,靠 propose-evaluate-accept 三階段迴圈讓 agent 自動改寫 harness,在 Terminal-Bench 2.0 上相對...
上海 AI 實驗室提出 Self-Harness:模型權重完全不動,靠 propose-evaluate-accept 三階段迴圈讓 agent 自動改寫 harness,在 Terminal-Bench 2.0 上相對...