常规步骤
分类、抽取、校验、路由和修复,并不总是需要整套系统里最昂贵的模型。
Flev 工作流可以把常规、结构化步骤路由到本地或私有小模型,同时保留强模型处理复杂推理。
分类、抽取、校验、路由和修复,并不总是需要整套系统里最昂贵的模型。
团队应该能看到哪一步用了哪个模型、为什么需要 fallback、谁能批准模型变更。
Better Call 证据显示:3,625 个 granite4.1:3b BFCL v4 case 上,工具调用准确率从 73.4% 提升到 83.8%。
01
团队提交 GitHub Actions run、部署日志、Kubernetes namespace 或 incident note,并说明负责人和什么结果有用。
02
Flev 展示检查了什么、哪些证据支持结论、还有什么未知,以及哪些动作需要审批。
03
输出包括诊断简报、证据表、runbook 补丁、审批边界和产品化建议。
04
分类、抽取、校验、路由和修复等常规步骤可以使用本地或私有小模型,复杂推理仍然交给更强模型。
CI、部署、Kubernetes 或 incident 路径。
日志、diff、event、run history 和已有 runbook。
区分只读调查和高风险动作。
诊断、证据表、runbook 和审批记录。
如果有效,就变成可重复运行的 Flev 工作流。
买方看到工作流;工程团队可以检查为什么它可复盘、可治理、并且更安全。
产品工作空间:intake、Studio、复盘树、样例报告、chat/embed 和工作流打包。
运行时控制平面:session、证据、审批、provider、memory、event 和协议边界。
工具调用可靠性边界:校验、归一化、按策略修复,或在真实工具执行前阻断。
本地、私有和强模型可以按任务路由,让成本、隐私和 fallback 行为都可复盘。
Repo、CI、部署路径、Kubernetes 上下文、日志和已有 runbook 都留在约定访问边界内。
这不是需求文档表演。目标是给出足够上下文,让双方判断一个 7 天诊断冲刺是否能产出有用结果。