-
Self-Harness:凍結模型權重,讓 agent 自己改寫執行規則就 +33–60%
上海 AI 實驗室提出 Self-Harness:模型權重完全不動,靠 propose-evaluate-accept 三階段迴圈讓 agent 自動改寫 harness,在 Terminal-Bench 2.0 上相對...
-
Fine-tune 會遺忘,RAG 會漏:用 Hypernetwork 在推論當下「長」出 agent 要的模型
微調把知識烤進權重卻會遺忘、RAG 把知識塞進 context 卻會漏;第三條路是用 hypernetwork 依任務描述、在一次前向傳播裡按需生成模型。以 Sakana AI 的 Text-to-LoRA 為例,拆解機...
-
7,000 台 Langflow 主機遭攻擊:揭開 LangChain/LangGraph 編排層的同一種洞
CVE-2026-33017 讓未授權者用一個公開端點就拿下 Langflow 整台主機、竊走 AWS 金鑰,而 LangChain、LangGraph 一連串 CVE 暴露的是同一個設計假設:把 AI 編排層當成可信任...
-
Agentic Resource Discovery:給 agent 的 robots.txt——開放發現規格與 HF 參考實作拆解
A2A 解了 agent 怎麼講話、MCP 解了怎麼呼叫工具,但「怎麼先找到並信任一個還不知道存在的能力」一直沒人管。Google 與 Linux Foundation 推出的 ARD 開放規格補上這層,用網域錨定 + ...
-
MCP / A2A 之後,誰來解決傳輸層?
MCP 解決了工具呼叫、A2A 解決了協調,但兩者腳下的傳輸層仍是空的。本文拆解 RPC over HTTP 為何不夠、Kafka/NATS 與 AGNTCY SLIM 等候選方案,以及工程團隊現在該怎麼擺架構。
-
【AI Agent 實戰系列】讓 AI 幫你逛街、挑選、結帳:Shopify Storefront MCP 這樣做
把 Shopify Storefront 能力用 MCP 標準化,從工具編排、上下文到事件路由與 UI 回填,打造能「確實完成任務」的 AI 購物體驗。