常规步骤
分类、抽取、校验、路由和修复,并不总是需要整套系统里最昂贵的模型。
Flev 工作流可以把常规、结构化步骤路由到本地或私有小模型,同时保留强模型处理复杂推理。
分类、抽取、校验、路由和修复,并不总是需要整套系统里最昂贵的模型。
团队应该能看到哪一步用了哪个模型、为什么需要 fallback、谁能批准模型变更。
Better Call 证据显示:3,625 个 granite4.1:3b BFCL v4 case 上,工具调用准确率从 73.4% 提升到 83.8%。
第一步保持只读:收集事实、识别缺失指标,并判断哪些小测试足以证明系统能否安全接近 500 RPS。
区分常态流量、burst 窗口、可缓存路径、鉴权路径、后台任务,以及 webhook 或 ingest 峰值。
梳理 Railway services、process types、并发限制、health checks、restart 行为和 idle-cost 控制。
检查 Cloudflare cache、rate limits、origin shielding、Postgres connection limits、slow queries、pool sizing 和 migration 风险。
有用的 500 RPS 答案不能靠猜。它应该展示哪些信号证明准备度,哪些缺口阻止信心,以及哪些变更必须先审批。
| 区域 | 检查什么 | 验收信号 |
|---|---|---|
| Load test | 对安全 endpoint 做分阶段只读测试,包含 ramp、hold 和 burst。 | 在 500 RPS 目标下,P95 latency、error rate、CPU/memory 和 queue depth 都在约定阈值内。 |
| Postgres | 检查 connection pool、slow queries、lock waits、index coverage,以及读写 burst 行为。 | 目标 burst 期间没有 pool exhaustion、lock pileup 或 query plan regression。 |
| Railway | 复查 service sizing、autoscaling 或 manual scale 计划、health checks、restart policy 和 idle cost。 | burst 路径可执行,rollback 清楚,并且 idle cost 不要求长期过度配置。 |
| Cloudflare | 检查 cache rules、bypass paths、rate limits、WAF 噪音、origin response headers 和 observability。 | 可缓存流量留在 edge,受保护 origin 路径仍然可观测。 |
| Recovery | 复查 alert thresholds、synthetic checks、deployment rollback 和 auto-recovery 边界。 | 团队知道哪些失败能自愈,哪些需要叫人,哪些必须审批 rollback。 |
第一份付费答案应该是这个形状:短到能快速读完,具体到工程师可以质疑,并且明确说明哪些事情还没有被证明。
先检查 Postgres connection pressure 和 cache-bypass routes,再增加 Railway process 数量。先扩 app worker 可能只会让数据库更快出问题。
先对公开可缓存路径和一个代表性鉴权路径做只读 ramp。P95、5xx、pool usage 或 origin CPU 触达约定边界就停止。
诊断范围内不会未经明确审批就修改生产 cache rule、Railway scale、migration 或 auto-recovery 行为。
如果证据支持,下一步可以实施 load-test script、Cloudflare rules、Railway scale plan、Postgres pool tuning 和 alert thresholds。
最快的 scope confirmation 来自一条短而具体的信息。这些点足够判断是否适合 99 美元诊断。
这个诊断包刻意收窄:它让下一步扩容决策更安全,但不伪装成无限范围的基础设施迁移。
一个服务或 app surface、一个目标流量形状、一张证据表、一个 load-test plan、一个 runbook,以及一个付费范围建议。
生产变更、完整 redesign、长期监控实施、数据库迁移、incident response retainer,或保证一定达到 500 RPS。
兴趣、intake 或草稿 invoice 都不算收入。实验只统计已到账的付款证据。