产品体验

在发送真实失败路径前，先看 Flev DevOps 如何工作。

买方体验应该让工作过程可见：intake、调查、证据、审批和可复用 runbook 都绑定在同一个工作流里。

填写试点信息查看样例输出

模型成本与隐私

只在真正需要的地方使用大模型。

Flev 工作流可以把常规、结构化步骤路由到本地或私有小模型，同时保留强模型处理复杂推理。

常规步骤

分类、抽取、校验、路由和修复，并不总是需要整套系统里最昂贵的模型。

可复盘路由

团队应该能看到哪一步用了哪个模型、为什么需要 fallback、谁能批准模型变更。

小模型就绪

Better Call 证据显示：3,625 个 granite4.1:3b BFCL v4 case 上，工具调用准确率从 73.4% 提升到 83.8%。

阅读模型选择指南

产品体验

买方应该看到的产品表面

Intake 01

提交一条失败路径，而不是写长需求文档

团队提交 GitHub Actions run、部署日志、Kubernetes namespace 或 incident note，并说明负责人和什么结果有用。

失败链接
Repo/service
负责人
成功标准

Studio Review 02

可复盘的调查树

Flev 展示检查了什么、哪些证据支持结论、还有什么未知，以及哪些动作需要审批。

日志检查
证据节点
缺失事实
审批门槛

Deliverable 03

团队下次还能使用的报告

输出包括诊断简报、证据表、runbook 补丁、审批边界和产品化建议。

诊断
证据表
Runbook 补丁
下一次规则

Model Boundary 04

成本和隐私保持可见

分类、抽取、校验、路由和修复等常规步骤可以使用本地或私有小模型，复杂推理仍然交给更强模型。

本地/私有路由
强模型兜底
成本复盘
模型证据

这次冲刺会产出什么

从用户痛点到可复用运营流程

提交失败路径

CI、部署、Kubernetes 或 incident 路径。

收集证据

日志、diff、event、run history 和已有 runbook。

复盘边界

区分只读调查和高风险动作。

交付产物

诊断、证据表、runbook 和审批记录。

打包模式

如果有效，就变成可重复运行的 Flev 工作流。

工程证明

体验背后的系统架构

买方看到工作流；工程团队可以检查为什么它可复盘、可治理、并且更安全。

Flev

产品工作空间：intake、Studio、复盘树、样例报告、chat/embed 和工作流打包。

Stable Harness

运行时控制平面：session、证据、审批、provider、memory、event 和协议边界。

Better Call

工具调用可靠性边界：校验、归一化、按策略修复，或在真实工具执行前阻断。

模型边界

本地、私有和强模型可以按任务路由，让成本、隐私和 fallback 行为都可复盘。

客户环境

Repo、CI、部署路径、Kubernetes 上下文、日志和已有 runbook 都留在约定访问边界内。

Flev DevOps

发送一条失败工程路径，我们帮你收敛最小可购买试点。

这不是需求文档表演。目标是给出足够上下文，让双方判断一个 7 天诊断冲刺是否能产出有用结果。

填写试点信息