跳转到主要内容

免费和低成本使用 Kilo Code

为什么这很重要: 在开发过程中,AI 模型成本可能会迅速累积。本指南展示了如何通过免费模型、经济实惠的替代方案和智能使用策略,在最小化或消除成本的同时有效使用 Kilo Code。

完全免费的选项

Grok Code Fast 1

这款前沿 AI 模型在 Kilo Code 中限时 100% 免费。查看博客文章了解更多信息

OpenRouter 免费层级模型

OpenRouter 免费提供了几种具有慷慨额度的模型。注意: 你需要创建一个免费的 OpenRouter 账户才能访问这些模型。

设置:

  1. 创建一个免费的 OpenRouter 账户
  2. 从仪表板获取你的 API 密钥
  3. 使用 OpenRouter 供应商配置 Kilo Code

可用的免费模型:

  • Qwen3 Coder (免费) - 针对代理编码任务进行了优化,如函数调用、工具使用和对仓库的长上下文推理。
  • Z.AI: GLM 4.5 Air (免费) - GLM-4.5 系列的轻量级变体,专为以代理为中心的应用程序而构建。
  • DeepSeek: R1 0528 (免费) - 性能与 OpenAI o1 相当,但是开源的并且具有完全开放的推理令牌。
  • MoonshotAI: Kimi K2 (免费) - 针对代理能力进行了优化,包括高级工具使用、推理和代码合成。

性价比高的付费模型

当你需要比免费模型提供更多功能时,这些选项提供了极佳的价值:

超低预算冠军(每百万 Tokens 低于 $0.50)

Mistral Devstral Small

  • 成本: ~$0.20 每百万输入 Tokens
  • 最佳用途: 代码生成、调试、重构
  • 性能: 85% 的高级模型能力,成本仅为 10%

Llama 4 Maverick

  • 成本: ~$0.30 每百万输入 Tokens
  • 最佳用途: 复杂推理、架构规划
  • 性能: 适用于大多数开发任务

DeepSeek v3

  • 成本: ~$0.27 每百万输入 Tokens
  • 最佳用途: 代码分析、大型代码库理解
  • 性能: 强大的技术推理能力

中等价位模型(每百万 Tokens $0.50-$2.00)

Qwen3 235B

  • 成本: ~$1.20 每百万输入 Tokens
  • 最佳用途: 需要高精度的复杂项目
  • 性能: 接近高级质量,成本为 40%

智能使用策略

50% 规则

原则: 将预算模型用于 50% 的任务,将高级模型用于另外 50% 的任务。

预算模型任务:

  • 代码审查和分析
  • 文档编写
  • 简单的错误修复
  • 样板代码生成
  • 重构现有代码

高级模型任务:

  • 复杂的架构决策
  • 调试困难的问题
  • 性能优化
  • 新功能设计
  • 关键生产代码

成本节约的上下文管理

最小化上下文大小:

// 而不是提及整个文件
@src/components/UserProfile.tsx

// 提及特定函数或部分
@src/components/UserProfile.tsx:45-67

有效使用记忆库:

  • Memory bank 中存储一次项目上下文
  • 减少重复解释项目细节的需要
  • 每次对话节省 200-500 个 Tokens

战略性文件提及:

  • 仅包含与任务直接相关的文件
  • 使用 @folder/ 获取广泛上下文,使用特定文件进行针对性工作

模型切换策略

从便宜开始,需要时升级:

  1. 从免费模型开始(Qwen3 Coder, GLM-4.5-Air)
  2. 如果免费模型难以胜任,则切换到预算模型
  3. 仅对复杂任务升级到高级模型

使用 API 配置档案:

  • 为不同成本层级设置 多个配置
  • 在免费、预算和高级模型之间快速切换
  • 根据任务复杂性匹配模型能力

基于模式的成本优化

使用适当的模式来限制昂贵的操作:

用于预算控制的自定义模式:

  • 创建限制昂贵工具的模式
  • 限制对特定目录的文件访问
  • 控制哪些操作是自动批准的

现实世界的性能比较

代码生成任务

简单函数创建:

  • Mistral Devstral Small: 95% 成功率
  • GPT-4: 98% 成功率
  • 成本差异: 免费 vs $0.20 vs $30 每百万令牌

复杂重构:

  • 预算模型: 70-80% 成功率
  • 高级模型: 90-95% 成功率
  • 建议: 从预算开始,需要时再升级

调试性能

简单错误:

  • 免费模型: 通常足够
  • 预算模型: 表现优秀
  • 高级模型: 对于大多数情况来说过于强大

复杂系统问题:

  • 免费模型: 40-60% 成功率
  • 预算模型: 60-80% 成功率
  • 高级模型: 85-95% 成功率

混合方法建议

日常开发工作流程

早晨规划会议:

  • 使用 架构师模式 配合 DeepSeek R1
  • 规划特性和架构
  • 创建任务分解

实施阶段:

  • 使用 代码模式 配合 预算模型
  • 生成和修改代码
  • 处理日常开发任务

复杂问题解决:

  • 当遇到困难时切换到 高级模型
  • 用于关键调试
  • 影响多个系统的架构决策

项目阶段策略

早期开发:

  • 免费和预算模型用于原型制作
  • 快速迭代,无需担心成本
  • 建立模式和结构

生产准备:

  • 高级模型用于关键代码审查
  • 性能优化
  • 安全考虑

成本监控和控制

跟踪你的使用情况

监控令牌消耗:

  • 查看聊天历史中的成本估算
  • 审查每月使用模式
  • 识别高成本操作

设置支出限额:

  • 使用提供商账单警报
  • 配置 速率限制 来控制使用
  • 设置每日/每月预算

节约成本的技巧

减少系统提示大小:

  • 如果不使用外部工具,则 禁用 MCP
  • 使用专注的自定义模式
  • 最小化不必要的上下文

优化对话长度:

  • 使用 检查点 重置上下文
  • 为无关任务开始新的对话
  • 归档已完成的工作

批量处理相似任务:

  • 分组相关的代码更改
  • 在单个请求中处理多个文件
  • 减少对话开销

开始使用预算模型

快速设置指南

  1. 创建 OpenRouter 账户 以获取免费模型
  2. 在 Kilo Code 中配置多个提供商
  3. 设置 API 配置档案 以便轻松切换
  4. 在需要时升级到预算模型
  5. 为复杂工作预留高级模型

推荐的提供商组合

免费层用于基础:

  • OpenRouter - 免费模型
  • Groq - 支持模型的快速推理
  • Z.ai - 提供免费模型 GLM-4.5-Flash

预算层用于选则:

高级层用于备份:

衡量是否成功

跟踪这些指标:

  • 每月 AI 成本 vs 开发生产力
  • 按模型层级的任务完成率
  • 节省的时间 vs 花费的钱
  • 代码质量改进

成功指标:

  • 70%+ 的任务使用免费/预算模型完成
  • 每月成本在你的目标预算内
  • 保持或提高代码质量
  • 更快的开发周期

通过结合免费模型、战略性预算模型使用和智能优化技术,你可以在保持最低成本的同时充分利用 AI 辅助开发的强大功能。从免费选项开始,随着你的需求和对成本的适应程度逐渐增加预算模型。