Skip to content
AI Learning Path
搜索文档
K
Main Navigation
学习路线
面试专题
资源汇总
📈
📋
主题
菜单
回到顶部
页面导航
9.3 分布式部署与高可用
[!] 大厂 JD 高频要求:"熟悉 Docker、Kubernetes、服务化、高可用"
核心架构:
成本优化策略:
模型路由:简单任务用小模型,复杂任务用大模型
语义缓存:相似问题命中缓存
Prompt 压缩:减少 Token 消耗
Batch 推理:非实时场景批量处理