免费和低成本使用 Kilo Code

为什么这很重要： 在开发过程中，AI 模型成本可能会迅速累积。本指南展示了如何通过免费模型、经济实惠的替代方案和智能使用策略，在最小化或消除成本的同时有效使用 Kilo Code。

完全免费的选项

Grok Code Fast 1

这款前沿 AI 模型在 Kilo Code 中限时 100% 免费。查看博客文章了解更多信息。

OpenRouter 免费层级模型

OpenRouter 免费提供了几种具有慷慨额度的模型。注意： 你需要创建一个免费的 OpenRouter 账户才能访问这些模型。

设置：

创建一个免费的 OpenRouter 账户
从仪表板获取你的 API 密钥
使用 OpenRouter 供应商配置 Kilo Code

可用的免费模型：

Qwen3 Coder (免费) - 针对代理编码任务进行了优化，如函数调用、工具使用和对仓库的长上下文推理。
Z.AI: GLM 4.5 Air (免费) - GLM-4.5 系列的轻量级变体，专为以代理为中心的应用程序而构建。
DeepSeek: R1 0528 (免费) - 性能与 OpenAI o1 相当，但是开源的并且具有完全开放的推理令牌。
MoonshotAI: Kimi K2 (免费) - 针对代理能力进行了优化，包括高级工具使用、推理和代码合成。

性价比高的付费模型

当你需要比免费模型提供更多功能时，这些选项提供了极佳的价值：

超低预算冠军（每百万 Tokens 低于 $0.50）

Mistral Devstral Small

成本： ~$0.20 每百万输入 Tokens
最佳用途： 代码生成、调试、重构
性能： 85% 的高级模型能力，成本仅为 10%

Llama 4 Maverick

成本： ~$0.30 每百万输入 Tokens
最佳用途： 复杂推理、架构规划
性能： 适用于大多数开发任务

DeepSeek v3

成本： ~$0.27 每百万输入 Tokens
最佳用途： 代码分析、大型代码库理解
性能： 强大的技术推理能力

中等价位模型（每百万 Tokens $0.50-$2.00）

Qwen3 235B

成本： ~$1.20 每百万输入 Tokens
最佳用途： 需要高精度的复杂项目
性能： 接近高级质量，成本为 40%

智能使用策略

50% 规则

原则： 将预算模型用于 50% 的任务，将高级模型用于另外 50% 的任务。

预算模型任务：

代码审查和分析
文档编写
简单的错误修复
样板代码生成
重构现有代码

高级模型任务：

复杂的架构决策
调试困难的问题
性能优化
新功能设计
关键生产代码

成本节约的上下文管理

最小化上下文大小：

// 而不是提及整个文件
@src/components/UserProfile.tsx

// 提及特定函数或部分
@src/components/UserProfile.tsx:45-67

有效使用记忆库：

在 Memory bank 中存储一次项目上下文
减少重复解释项目细节的需要
每次对话节省 200-500 个 Tokens

战略性文件提及：

仅包含与任务直接相关的文件
使用 @folder/ 获取广泛上下文，使用特定文件进行针对性工作

模型切换策略

从便宜开始，需要时升级：

从免费模型开始（Qwen3 Coder, GLM-4.5-Air）
如果免费模型难以胜任，则切换到预算模型
仅对复杂任务升级到高级模型

使用 API 配置档案：

为不同成本层级设置多个配置
在免费、预算和高级模型之间快速切换
根据任务复杂性匹配模型能力

基于模式的成本优化

使用适当的模式来限制昂贵的操作：

询问模式： 信息收集，无需代码更改
架构师模式： 规划，无需昂贵的文件操作
调试模式： 专注的故障排除

用于预算控制的自定义模式：

创建限制昂贵工具的模式
限制对特定目录的文件访问
控制哪些操作是自动批准的

现实世界的性能比较

代码生成任务

简单函数创建：

Mistral Devstral Small： 95% 成功率
GPT-4： 98% 成功率
成本差异： 免费 vs $0.20 vs $30 每百万令牌

复杂重构：

预算模型： 70-80% 成功率
高级模型： 90-95% 成功率
建议： 从预算开始，需要时再升级

调试性能

简单错误：

免费模型： 通常足够
预算模型： 表现优秀
高级模型： 对于大多数情况来说过于强大

复杂系统问题：

免费模型： 40-60% 成功率
预算模型： 60-80% 成功率
高级模型： 85-95% 成功率

混合方法建议

日常开发工作流程

早晨规划会议：

使用 架构师模式 配合 DeepSeek R1
规划特性和架构
创建任务分解

实施阶段：

使用 代码模式 配合 预算模型
生成和修改代码
处理日常开发任务

复杂问题解决：

当遇到困难时切换到 高级模型
用于关键调试
影响多个系统的架构决策

项目阶段策略

早期开发：

免费和预算模型用于原型制作
快速迭代，无需担心成本
建立模式和结构

生产准备：

高级模型用于关键代码审查
性能优化
安全考虑

成本监控和控制

跟踪你的使用情况

监控令牌消耗：

查看聊天历史中的成本估算
审查每月使用模式
识别高成本操作

设置支出限额：

使用提供商账单警报
配置速率限制来控制使用
设置每日/每月预算

节约成本的技巧

减少系统提示大小：

如果不使用外部工具，则禁用 MCP
使用专注的自定义模式
最小化不必要的上下文

优化对话长度：

使用检查点重置上下文
为无关任务开始新的对话
归档已完成的工作

批量处理相似任务：

分组相关的代码更改
在单个请求中处理多个文件
减少对话开销

开始使用预算模型

快速设置指南

创建 OpenRouter 账户 以获取免费模型
在 Kilo Code 中配置多个提供商
设置 API 配置档案 以便轻松切换
在需要时升级到预算模型
为复杂工作预留高级模型

衡量是否成功

跟踪这些指标：

每月 AI 成本 vs 开发生产力
按模型层级的任务完成率
节省的时间 vs 花费的钱
代码质量改进

成功指标：

70%+ 的任务使用免费/预算模型完成
每月成本在你的目标预算内
保持或提高代码质量
更快的开发周期

通过结合免费模型、战略性预算模型使用和智能优化技术，你可以在保持最低成本的同时充分利用 AI 辅助开发的强大功能。从免费选项开始，随着你的需求和对成本的适应程度逐渐增加预算模型。

完全免费的选项​

Grok Code Fast 1​

OpenRouter 免费层级模型​

性价比高的付费模型​

超低预算冠军（每百万 Tokens 低于 $0.50）​

中等价位模型（每百万 Tokens $0.50-$2.00）​

智能使用策略​

50% 规则​

成本节约的上下文管理​

模型切换策略​

基于模式的成本优化​

现实世界的性能比较​

代码生成任务​

调试性能​

混合方法建议​

日常开发工作流程​

项目阶段策略​

成本监控和控制​

跟踪你的使用情况​

节约成本的技巧​

开始使用预算模型​

快速设置指南​

推荐的提供商组合​

衡量是否成功​