用 Evals 系統化測試 Agent Skills
以 Codex 為例,建立可重複的 eval 流程,讓 skill 的改進與回歸問題一目了然。
Read the full article →Minimal translations and notes for focused web dev reading.
A single place to keep translated essays in a calm, readable frame.
以 Codex 為例,建立可重複的 eval 流程,讓 skill 的改進與回歸問題一目了然。
Read the full article →為什麼大多數的記憶化根本毫無用處...
Read the full article →