500 RPS 诊断包

面向 Railway、Cloudflare、Postgres 和 500 RPS 准备度的具体诊断包。

这是面向售前的证明页面：适合需要 burst capacity、但又不想让 idle cost 失控的团队。它展示 99 美元诊断会先检查什么，再建议扩容、压测、监控、告警或 auto-recovery 变更。

填写试点信息邮件发送范围付款下一步

模型成本与隐私

只在真正需要的地方使用大模型。

Flev 工作流可以把常规、结构化步骤路由到本地或私有小模型，同时保留强模型处理复杂推理。

常规步骤

分类、抽取、校验、路由和修复，并不总是需要整套系统里最昂贵的模型。

可复盘路由

团队应该能看到哪一步用了哪个模型、为什么需要 fallback、谁能批准模型变更。

小模型就绪

Better Call 证据显示：3,625 个 granite4.1:3b BFCL v4 case 上，工具调用准确率从 73.4% 提升到 83.8%。

阅读模型选择指南

诊断范围

把扩容请求变成可复盘证据。

第一步保持只读：收集事实、识别缺失指标，并判断哪些小测试足以证明系统能否安全接近 500 RPS。

流量形状

区分常态流量、burst 窗口、可缓存路径、鉴权路径、后台任务，以及 webhook 或 ingest 峰值。

运行边界

梳理 Railway services、process types、并发限制、health checks、restart 行为和 idle-cost 控制。

边缘和数据路径

检查 Cloudflare cache、rate limits、origin shielding、Postgres connection limits、slow queries、pool sizing 和 migration 风险。

证据计划

有用的 500 RPS 答案不能靠猜。它应该展示哪些信号证明准备度，哪些缺口阻止信心，以及哪些变更必须先审批。

验收证据表

区域	检查什么	验收信号
Load test	对安全 endpoint 做分阶段只读测试，包含 ramp、hold 和 burst。	在 500 RPS 目标下，P95 latency、error rate、CPU/memory 和 queue depth 都在约定阈值内。
Postgres	检查 connection pool、slow queries、lock waits、index coverage，以及读写 burst 行为。	目标 burst 期间没有 pool exhaustion、lock pileup 或 query plan regression。
Railway	复查 service sizing、autoscaling 或 manual scale 计划、health checks、restart policy 和 idle cost。	burst 路径可执行，rollback 清楚，并且 idle cost 不要求长期过度配置。
Cloudflare	检查 cache rules、bypass paths、rate limits、WAF 噪音、origin response headers 和 observability。	可缓存流量留在 edge，受保护 origin 路径仍然可观测。
Recovery	复查 alert thresholds、synthetic checks、deployment rollback 和 auto-recovery 边界。	团队知道哪些失败能自愈，哪些需要叫人，哪些必须审批 rollback。

样例诊断备注

第一份付费答案应该是这个形状：短到能快速读完，具体到工程师可以质疑，并且明确说明哪些事情还没有被证明。

优先怀疑的约束

先检查 Postgres connection pressure 和 cache-bypass routes，再增加 Railway process 数量。先扩 app worker 可能只会让数据库更快出问题。

安全验证路径

先对公开可缓存路径和一个代表性鉴权路径做只读 ramp。P95、5xx、pool usage 或 origin CPU 触达约定边界就停止。

审批边界

诊断范围内不会未经明确审批就修改生产 cache rule、Railway scale、migration 或 auto-recovery 行为。

下一步付费范围

如果证据支持，下一步可以实施 load-test script、Cloudflare rules、Railway scale plan、Postgres pool tuning 和 alert thresholds。

第一封邮件可以直接粘贴这些内容

最快的 scope confirmation 来自一条短而具体的信息。这些点足够判断是否适合 99 美元诊断。

产品表面和 stack：Vue3、Ruby/Sinatra、Postgres、Railway、Cloudflare，或最接近的实际组合。
目标流量形状：当前 RPS、500 RPS burst 持续时间、可缓存路径和鉴权路径，以及排除哪些 endpoint。
现有证据：Railway metrics、Postgres limits 或 pool size、Cloudflare cache rules、近期 logs、slow queries 或 incident notes。
业务边界：什么成本上限、downtime risk 和审批规则应该停止测试。

Runbook 骨架

任何压测前，先确认安全 endpoint、流量形状，以及排除的 destructive path。
记录 baseline latency、error rate、Postgres pool 状态、Railway metrics，以及 Cloudflare edge/origin split。
运行分阶段 ramp、hold、burst 测试；触发约定错误、饱和或成本边界时立即停止。
按 app code、Postgres、Railway process sizing、Cloudflare caching 或缺失监控归类瓶颈。
返回按风险排序的变更清单，并明确 deploy、scale、cache、alert 或 recovery 变更的审批边界。

商业边界

99 美元诊断可以诚实承诺什么。

这个诊断包刻意收窄：它让下一步扩容决策更安全，但不伪装成无限范围的基础设施迁移。

包含

一个服务或 app surface、一个目标流量形状、一张证据表、一个 load-test plan、一个 runbook，以及一个付费范围建议。

需要单独定范围

生产变更、完整 redesign、长期监控实施、数据库迁移、incident response retainer，或保证一定达到 500 RPS。

收入规则

兴趣、intake 或草稿 invoice 都不算收入。实验只统计已到账的付款证据。

Flev DevOps

发送一条扩容路径；如果匹配，下一步就是 99 美元 500 RPS 诊断。

发送失败或扩容路径、目标 burst 形状，以及什么结果算足够安全。我们会先确认它是否适合固定 99 美元诊断，再进入任何付款请求。

填写试点信息邮件发送范围