常规步骤
分类、抽取、校验、路由和修复,并不总是需要整套系统里最昂贵的模型。
这不是需求文档表演。目标是给出足够上下文,让双方判断一个 7 天诊断冲刺是否能产出有用结果。
Flev 工作流可以把常规、结构化步骤路由到本地或私有小模型,同时保留强模型处理复杂推理。
分类、抽取、校验、路由和修复,并不总是需要整套系统里最昂贵的模型。
团队应该能看到哪一步用了哪个模型、为什么需要 fallback、谁能批准模型变更。
Better Call 证据显示:3,625 个 granite4.1:3b BFCL v4 case 上,工具调用准确率从 73.4% 提升到 83.8%。
你可以把这些内容放进第一封邮件,或在第一次 scope call 里带过来。
GitHub Actions URL、部署日志、Kubernetes namespace、incident note、截图,或反复出现的发布症状。
repo 或 service 名称、环境、branch/release 上下文,以及访问方式是只读还是只共享产物。
谁负责这个工作流,哪些动作可以检查,哪些动作必须明确审批。
什么会让这次试点值得付费:更快诊断、更安全 rollback、更好 runbook、更少重复 incident,或可复用 Flev 工作流。
我们判断这条路径是否足够窄,能不能在 7 天冲刺里产出结果。
双方确认哪些只是只读、哪些排除在外、哪些动作需要审批。
如果匹配,我们确认固定试点报价,并从证据包开始工作。
第一单应该窄到足够可信。Flev DevOps 默认从只读调查开始;任何会改变代码、包、部署或集群状态的动作,都必须先经过审批。
把失败路径和“什么结果算有用”发给我们。我们会先帮你收敛最小可信的 Flev DevOps 试点,再决定是否扩展成更大的工作流产品。