免费和低成本使用 Kilo Code
为什么这很重要: 在开发过程中,AI 模型成本可能会迅速累积。本指南展示了如何通过免费模型、经济实惠的替代方案和智能使用策略,在最小化或消除成本的同时有效使用 Kilo Code。
完全免费的选项
Grok Code Fast 1
这款前沿 AI 模型在 Kilo Code 中限时 100% 免费。查看博客文章了解更多信息。
OpenRouter 免费层级模型
OpenRouter 免费提供了几种具有慷慨额度的模型。注意: 你需要创建一个免费的 OpenRouter 账户才能访问这些模型。
设置:
- 创建一个免费的 OpenRouter 账户
- 从仪表板获取你的 API 密钥
- 使用 OpenRouter 供应商配置 Kilo Code
可用的免费模型:
- Qwen3 Coder (免费) - 针对代理编码任务进行了优化,如函数调用、工具使用和对仓库的长上下文推理。
- Z.AI: GLM 4.5 Air (免费) - GLM-4.5 系列的轻量级变体,专为以代理为中心的应用程序而构建。
- DeepSeek: R1 0528 (免费) - 性能与 OpenAI o1 相当,但是开源的并且具有完全开放的推理令牌。
- MoonshotAI: Kimi K2 (免费) - 针对代理能力进行了优化,包括高级工具使用、推理和代码合成。
性价比高的付费模型
当你需要比免费模型提供更多功能时,这些选项提供了极佳的价值:
超低预算冠军(每百万 Tokens 低于 $0.50)
Mistral Devstral Small
- 成本: ~$0.20 每百万输入 Tokens
- 最佳用途: 代码生成、调试、重构
- 性能: 85% 的高级模型能力,成本仅为 10%
Llama 4 Maverick
- 成本: ~$0.30 每百万输入 Tokens
- 最佳用途: 复杂推理、架构规划
- 性能: 适用于大多数开发任务
DeepSeek v3
- 成本: ~$0.27 每百万输入 Tokens
- 最佳用途: 代码分析、大型代码库理解
- 性能: 强大的技术推理能力
中等价位模型(每百万 Tokens $0.50-$2.00)
Qwen3 235B
- 成本: ~$1.20 每百万输入 Tokens
- 最佳用途: 需要高精度的复杂项目
- 性能: 接近高级质量,成本为 40%
智能使用策略
50% 规则
原则: 将预算模型用于 50% 的任务,将高级模型用于另外 50% 的任务。
预算模型任务:
- 代码审查和分析
- 文档编写
- 简单的错误修复
- 样板代码生成
- 重构现有代码
高级模型任务:
- 复杂的架构决策
- 调试困难的问题
- 性能优化
- 新功能设计
- 关键生产代码
成本节约的上下文管理
最小化上下文大小:
// 而不是提及整个文件
@src/components/UserProfile.tsx
// 提及特定函数或部分
@src/components/UserProfile.tsx:45-67
有效使用记忆库:
- 在 Memory bank 中存储一次项目上下文
- 减少重复解释项目细节的需要
- 每次对话节省 200-500 个 Tokens
战略性文件提及:
- 仅包含与任务直接相关的文件
- 使用
@folder/获取广泛上下文,使用特定文件进行针对性工作
模型切换策略
从便宜开始,需要时升级:
- 从免费模型开始(Qwen3 Coder, GLM-4.5-Air)
- 如果免费模型难以胜任,则切换到预算模型
- 仅对复杂任务升级到高级模型
使用 API 配置档案:
- 为不同成本层级设置 多个配置
- 在免费、预算和高级模型之间快速切换
- 根据任务复杂性匹配模型能力
基于模式的成本优化
使用适当的模式来限制昂贵的操作:
用于预算控制的自定义模式:
- 创建限制昂贵工具的模式
- 限制对特定目录的文件访问
- 控制哪些操作是自动批准的
现实世界的性能比较
代码生成任务
简单函数创建:
- Mistral Devstral Small: 95% 成功率
- GPT-4: 98% 成功率
- 成本差异: 免费 vs $0.20 vs $30 每百万令牌
复杂重构:
- 预算模型: 70-80% 成功率
- 高级模型: 90-95% 成功率
- 建议: 从预算开始,需要时再升级
调试性能
简单错误:
- 免费模型: 通常足够
- 预算模型: 表现优秀
- 高级模型: 对于大多数情况来说过于强大
复杂系统问题:
- 免费模型: 40-60% 成功率
- 预算模型: 60-80% 成功率
- 高级模型: 85-95% 成功率
混合方法建议
日常开发工作流程
早晨规划会议:
- 使用 架构师模式 配合 DeepSeek R1
- 规划特性和架构
- 创建任务分解
实施阶段:
- 使用 代码模式 配合 预算模型
- 生成和修改代码
- 处理日常开发任务
复杂问题解决:
- 当遇到困难时切换到 高级模型
- 用于关键调试
- 影响多个系统的架构决策
项目阶段策略
早期开发:
- 免费和预算模型用于原型制作
- 快速迭代,无需担心成本
- 建立模式和结构
生产准备:
- 高级模型用于关键代码审查
- 性能优化
- 安全考虑
成本监控和控制
跟踪你的使用情况
监控令牌消耗:
- 查看聊天历史中的成本估算
- 审查每月使用模式
- 识别高成本操作
设置支出限额:
- 使用提供商账单警报
- 配置 速率限制 来控制使用
- 设置每日/每月预算
节约成本的技巧
减少系统提示大小:
- 如果不使用外部工具,则 禁用 MCP
- 使用专注的自定义模式
- 最小化不必要的上下文
优化对话长度:
- 使用 检查点 重置上下文
- 为无关任务开始新的对话
- 归档已完成的工作
批量处理相似任务:
- 分组相关的代码更改
- 在单个请求中处理多个文件
- 减少对话开销
开始使用预算模型
快速设置指南
- 创建 OpenRouter 账户 以获取免费模型
- 在 Kilo Code 中配置多个提供商
- 设置 API 配置档案 以便轻松切换
- 在需要时升级到预算模型
- 为复杂工作预留高级模型
推荐的提供商组合
免费层用于基础:
- OpenRouter - 免费模型
- Groq - 支持模型的快速推理
- Z.ai - 提供免费模型 GLM-4.5-Flash
预算层用于选则:
高级层用于备份:
衡量是否成功
跟踪这些指标:
- 每月 AI 成本 vs 开发生产力
- 按模型层级的任务完成率
- 节省的时间 vs 花费的钱
- 代码质量改进
成功指标:
- 70%+ 的任务使用免费/预算模型完成
- 每月成本在你的目标预算内
- 保持或提高代码质量
- 更快的开发周期
通过结合免费模型、战略性预算模型使用和智能优化技术,你可以在保持最低成本的同时充分利用 AI 辅助开发的强大功能。从免费选项开始,随着你的需求和对成本的适应程度逐渐增加预算模型。