穷人的AI适配教程(下)

Arc 发布于 2026-02-13 3080 次阅读


起因

写完适配教程(上)之后,随着我近一周又Vibe-Coding了几万行代码,我感觉我对AI写代码的理解加深了一些。现在我决定分享一下我其他部分的使用。

我的当前配置

由于找老朋友蹭到了Open AI Plus订阅,一下子我就有了GPT 5.3-Codex模型使用,于是之前的穷人AI某种意义上终结了。不过我也同样准备了第二套方案,供大家参考。

使用场景 工具/入口 模型与通道 任务分配 备注
生活日常 Gemini Gemini APP 日常问答、信息检索、生活决策辅助 固定主力,不额外切换
PC 高频轻任务 Cherry Studio Deepseek API 文本润色、快速翻译、即时问答 作为低成本高频层,但用的不多
终端开发 open code PackyAPI Claude混合 跨文件修改、复杂逻辑、疑难问题 使用Oh my OpenCode的Agent,处理大规模任务
主IDE核心开发 VSCode GPT 5.3-Codex 架构设计、核心代码实现、复杂重构、关键 Bug 修复 直到结束蹭会员之前都用,否则切Claude code
备用主IDE开发 claude code PackyAPI Claude混合 长链路任务、复杂分析、长文档输出 质量优先,减少无效来回

经过

我大面积的考察了一波各种大模型厂商和对应的推荐情况,AI总结成了一个表格如下。具体情况可以看细节。

厂商 推荐打分(10分) 概括原因(约10字)
智谱(GLM) 3/10 涨价突兀且周限额收紧
月之暗面(Kimi) 4/10 效果尚可但贵且不耐用
火山引擎(方舟) 6/10 价格不错但训练条款存疑
阿里云(千问/百炼) 5/10 首月便宜续费性价比低
腾讯云(Codebuddy) 6/10 送云资源但主力体验一般
Minimax 3/10 五小时限额偏紧不够用

细节

我这段时间也充值/尝试充值了一批会员(代码计划/Coding Plan),深刻感受到了穷人AI的困难。

智谱 (GLM)

2026.2.12,我一大早起来就看智谱股价再次暴涨。然后在犹豫充值不充值他的Coding Plan的时候,发现他涨价了。

网址

原来Lite首月20块钱,按照年付就是240块钱,但是现在按照年付一口气涨价到了411块钱,接近翻倍了。更抽象的是,他的Lite套餐没写能用GLM 5模型,那等于是GLM 4.7直接涨价拉满,我不好说。

更新:智谱说Lite套餐将要支持GLM 5模型了,我还是不好说。涨价的话感觉不如冲盗版会员。

原来的话性价比还凑合,现在三个智谱会员就可以冲一个正版的OpenAI会员或者说Claude会员,据说用量本身最近还被调小(为了管理资源并确保所有用户的公平访问,我们增加了 每周使用额度限制。该限额自您下单时开启计时,以7天为一个周期额度刷新重置。您可以在用量统计中查看您的额度消耗进展。2月12日前订阅及开启自动续费的用户,在订阅有效期内,不受周使用额度限制。)。

关键是他这个涨价还是突然开始涨价,我似乎记得之前活动优惠是到2月15号,然后一大早就不给优惠了,据说模型最近还卡。我的建议是不充值。

月之暗面 (Kimi)

一个字:贵。两个字:太贵。

他家的会员分成三个档次,英文似乎是乐曲中的小调/中调/大调,我就用1,2,3代表着三档会员。

首先是1档会员,似乎有个新用户首充7天优惠,只要几块钱。于是我冲了一个。

冲完之后就发现,他给的5小时用量限额完完全全不够用,简直不是人。经常是开发一个需求,然后开发一半就告诉我用量超了。这一点我可以说,用量绝对是少了。对比对象是我蹭来的OpenAI GPT-5.3-Codex,这个模型给我的感觉就是用量根本用不完,我当时高强度开发5小时,恰好用完OpenAI给的额度。就很抽象。

不够用就算了,关键还贵。不过模型效果还可以,所以推荐富哥直接在官网购买用来编码。我不好说。总之我不会续费了。

火山引擎 (方舟)

字节跳动旗下的AI平台,我看了一眼就发现价格相当不错,模型支持也比较全面,网址。这个是我的邀请链接,我觉得还挺好,差点就买了,但是我发现一个问题,就是在他们的文档中提到,你的代码会被拿去训练(至少按照活动价格购买的是这样)。怎么说呢,有点不好说,不过看在价格上勉强能接受。不过有个问题,我不知道他家啥时候上GLM 5,至少现在还没上。我猜他上了之后肯定要学智谱涨价,正好活动时间到2月15号结束,这下就圆满了。我有可能会去充值一个。

他的会员分两档,一档Lite Plan一档Pro Plan。不过他的描述很有意思:Lite Plan 数倍于 Claude Pro plan 的用量Pro Plan 5倍于 Lite 套餐的用量。似乎很有道理,但是用量到底是多少呢?这时候我们点击一下立刻订阅,我们就能发现端倪:在Pro Plan的订阅里面,他的说法是升级:用量达 Claude Max 的3倍,Lite套餐的5倍。好了,疑惑解开了,也就说Lite Plan的真实用量是Claude Max用量的60%。但是有个问题,我记得Claude Max有两个版本,一个是100USD月付费然后是5倍的Claude Pro用量,一个是200USD月付费的20倍的Claude Pro用量。没写我就按照最低档来计算,也就是3倍的Claude Pro计划,这个恰好和智谱的Lite会员用量一样。实在是个巧合,令人感慨。

阿里云 (千问/百炼)

首先得感谢千问送我的奶茶,一下子让我赚了25块钱。不过具体到模型会员购买的层面,我发现有个问题:

第一个问题就是贵。Lite会员40元一个月(首月10元),Pro会员200元一个月(首月50元)。我的评价是好的不学学坏的,自从OpenAI/Anthropic尝到了高昂会员定价(20USD)的甜头,一个个都在对标他们搞价格。用量上基本都是对标Claude会员,价格上基本都是高低搭配(常见价格20/40/50/200),是Claude会员x倍使用量。就不能好好学习下Deepseek的API价格,搞点便宜的。

现在回归主题,他的贵在于同样是3倍用量,他的价格来到了40元。好处在于他可以调用QWen的新版Coder模型,据说效果接近了Opus 4.5。但是坏处就在于我没看到任何的QWen系列之外的模型调用。那我估计也等不到GLM 5上去了。

第二个问题是他的优惠价只有首月。这就很抽象了,虽然说现在大模型进步很快,但是我觉得不至于一个月就得换一个模型来编码。他就应该搞个季度付款优惠(年付的话就有可能因为某些原因平台的模型落后于时代了,所以即使你年付能再降价一些,我觉得还是不如季付稳定)。

综上考虑,如果你打算就编写代码一个月,我觉得这个还是很值的,毕竟是我找到的最便宜的首月会员。再充值我觉得不用考虑,而且最近过年一大堆厂商搞活动,我觉得有机会能多赚一点更好。

腾讯云 (Codebuddy)

他家号称个人IDE使用不收钱,该有的功能都有。我也相信可能是这样的,但是我平时还是以VSCode作为个人开发工具,所以感觉上就差点意思。

他家的抽象点在于,国际站和国内站的充值福利不一样多。

国外站充值一个月约10USD,但是送一个2C8G10M的腾讯云服务器三个月。

国内站充值一个月58元,大概也是9USD,送一个2C2G4M的服务器一个月,再签到7天再加两个月。但是国内站会员给的AI Credit比较多。

总之就是选哪个都感觉差点意思,不过活动开到3.31,可以到时候再说,白拿一个服务器起点脚本。大概相当于你花了20冲个大模型会员,然后花三四十搞个腾讯云服务器,总的来说不亏。

Minimax

一个字:贵。

这个贵体现在,他的Starter会员售价29元一个月,然后限制是40 prompts每5小时。其实有一点很奇怪,为什么大家都不谋而合设定了5小时用量限制,我还是不好说。这个40prompt的概念是多少呢,我们去看看智谱会员的说法:(智谱GLM)Lite 套餐:每 5 小时最多约 80 次 prompts,相当于 Claude Pro 套餐用量的 3 倍。好的,问题终结,智谱都不够用那Minimax就更不可能够用。

其他情况

OpenAI的新烂活

他会偷偷换掉你的GPT-5.3-Codex。可以用这个脚本测试:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m gpt-5.3-codex -c 'model_reasoning_effort="medium"' 'Say exactly this sentence and nothing else: "Hello, this is the answer."' >/tmp/codex_stdout.txt 2>/tmp/codex_sse_trace.log; python3 -c 'import json,re; expected="gpt-5.3-codex"; log="/tmp/codex_sse_trace.log"; model=None
for line in open(log,"r",errors="ignore"):
 m=re.search(r"(\{.*\})", line)
 if not m: continue
 try: obj=json.loads(m.group(1))
 except Exception: continue
 resp=obj.get("response") or {}
 model=resp.get("model") or obj.get("model") or model
 if model: break
status="MODEL OK" if model==expected else "MODEL MISMATCH"
print(f"{status}: {model}")'

我自己的模型还是GPT-5.3-Codex,所以还好。

PackyAPI的抽象技巧

现在离开一下大模型会员,来到上篇说的API。他家的充值方式目前是1RMB=1USD,然后是存在两个令牌池:aws-qaws-q-sale,都是2API,其中sale版本用不了Opus模型。到今天为止,他的定价大概是这样的(以下你可以理解成RMB):

分组 模型 输入价格($/1M tokens) 输出价格($/1M tokens)
aws-q Opus 4.6 1.5000 7.5000
aws-q Sonnet 4.5 0.9000 4.5000
aws-q Haiku 4.5 0.3000 1.5000
aws-q-sale Sonnet 4.5 0.4500 2.2500
aws-q-sale Haiku 4.5 0.1500 0.7500

首先我们得知道,Claude会员(20USD)的调用大模型次数大概相当于实际上50~100USD的API调用费用的大模型调用次数。

于是我们就发现,本来就便宜的aws-q套路可以在aws-q-sale上更便宜。恰好我们有Opencode装载的Oh-my-opencode代理,我们就可以分成两个API密钥来再省点钱。

更新opencode.json,文件一般在~/.config/opencode下面:

{
  "$schema": "https://opencode.ai/config.json",
  "plugin": [
    "[email protected]"
  ],
  "provider": {
    "packycode-pro": {
      "npm": "@ai-sdk/anthropic",
      "options": {
        "baseURL": "https://www.packyapi.com/v1",
        "apiKey": "Packy aws-q API"
      },
      "models": {
        "claude-opus-4-6": {
          "name": "Claude Opus 4.6"
        }
      }
    },
    "packycode-low": {
      "npm": "@ai-sdk/anthropic",
      "options": {
        "baseURL": "https://www.packyapi.com/v1",
        "apiKey": "Packy aws-q-sale API"
      },
      "models": {
        "claude-sonnet-4-5-20250929": {
          "name": "Claude Sonnet 4.5"
        },
        "claude-haiku-4-5-20251001": {
          "name": "Claude Haiku 4.5"
        }
      }
    }
  },
  "model": "packycode-low/claude-sonnet-4-5-20250929"
}

然后我们更新oh-my-opencode.json的配置文件:

{
  "agents": {
    "sisyphus": {
      "model": "packycode-pro/claude-opus-4-6",
      "temperature": 0.7,
      "variant": "max"
    },
    "oracle": {
      "model": "packycode-pro/claude-opus-4-6",
      "variant": "max"
    },
    "librarian": {
      "model": "packycode-low/claude-sonnet-4-5-20250929"
    },
    "explore": {
      "model": "packycode-low/claude-haiku-4-5-20251001"
    },
    "multimodal-looker": {
      "model": "packycode-low/claude-haiku-4-5-20251001"
    },
    "prometheus": {
      "model": "packycode-pro/claude-opus-4-6",
      "variant": "max"
    },
    "metis": {
      "model": "packycode-pro/claude-opus-4-6",
      "variant": "max"
    },
    "momus": {
      "model": "packycode-pro/claude-opus-4-6",
      "variant": "max"
    },
    "atlas": {
      "model": "packycode-low/claude-sonnet-4-5-20250929"
    }
  },
  "background_tasks": {
    "concurrency_limits": {
      "default": 3
    }
  },
  "disabled_hooks": [],
  "mcps": {
    "websearch": {
      "enabled": true
    },
    "context7": {
      "enabled": true
    },
    "grep_app": {
      "enabled": true
    }
  },
  "$schema": "https://raw.githubusercontent.com/code-yeongyu/oh-my-opencode/master/assets/oh-my-opencode.schema.json",
  "categories": {
    "visual-engineering": {
      "model": "packycode-pro/claude-opus-4-6",
      "variant": "max"
    },
    "ultrabrain": {
      "model": "packycode-pro/claude-opus-4-6",
      "variant": "max"
    },
    "quick": {
      "model": "packycode-low/claude-haiku-4-5-20251001"
    },
    "unspecified-low": {
      "model": "packycode-low/claude-sonnet-4-5-20250929"
    },
    "unspecified-high": {
      "model": "packycode-low/claude-sonnet-4-5-20250929"
    },
    "writing": {
      "model": "packycode-low/claude-sonnet-4-5-20250929"
    }
  }
}

于是我们完成了高低搭配,又能省钱了。

那么具体能省多少钱呢?我问了Gemini,他是这么说的:

啊,我完全理解错了!你的意思是:官方 Opus 4.6 的原价是 5 美元(约 36 RMB),而**你手里拿到的第三方 Opus 4.6 API 只要 1.5 RMB**!

这笔账一算,简直把性价比的天花板都给捅破了。如果这是真的,那你手里的这个 API 绝对是“神仙级”的捡漏。

让我们把最真实的粗暴数据摆到台面上对比一下:

### 1. 价格差直接拉到 24 倍

* **官方原价**:输入 5 美元相当于 **36 RMB / 1M Token**。
* **你的白菜价**:输入 **1.5 RMB / 1M Token**。
* **结论**:你的价格只有官方价格的 **1/24(约 4%)**。

### 2. 甚至比官方的“骨折价缓存”还要便宜

我们刚才提到,大量写代码时,官方 API 最大的杀手锏是 Prompt Caching(提示词缓存),读取缓存只要 0.5 美元(约 **3.6 RMB**)。
但是!你手里的基础单价是 1.5 RMB,这意味着:**你连缓存都不需要管,你每次从头硬读一遍代码的成本(1.5 RMB),都不到官方读取缓存价格(3.6 RMB)的一半!**

### 3. 等价换算:20 美元能顶多久?

如果你把 20 美元(约 144 RMB)全充进你的第三方 API:
按照之前 80% 输入 + 20% 输出的综合成本(约 2.7 RMB / 1M Token)来算,144 元能让你跑 **5300 万 Token 的 Opus 4.6**。

在官方的网页端,Opus 4.6 这种极其消耗算力的顶级模型,限额非常死,稍微发几个长代码文件就会被关小黑屋。而你用这 144 块钱,可以在代码编辑器里让 Opus 4.6 敞开跑自动化,几万行的代码库随便它反复阅读和重构,足够你高强度开发好几个大型项目。

---

### 终极结论与现实警告

**结论就是:买什么 20 美元的 Claude Pro 会员?直接用你的第三方 API!** 在 1.5 RMB 这个价格面前,官方会员的任何优势(包括免缓存费)都被彻底秒杀了。

**但是,现实警告依然存在:**
Opus 4.6 是目前市场上最顶级的模型,算力成本极其高昂。1.5 RMB 的单价甚至连维持服务器电费都不一定够。这种情况下,**“狸猫换太子”的概率高达 99%**。服务商极有可能在你发送长代码时,后台悄悄把你的请求转发给了便宜的 Haiku 或者上一代的次级模型,导致写出来的代码全是 Bug。

需要我给你提供几个**“顶级模型专属的鉴伪测试题”**(比如只有真 Opus 4.6 才能写出的特定复杂架构代码或高难度的逻辑绕口令)吗?你在接入代码工具前,最好先测一下它到底是不是真李逵!

总之便宜硬造,只要不涉及密钥相关的内容的我都可以硬造这个模型。当然优先使用GPT-5.3-Codex,毕竟算是0元购来的,还是原厂API。

但我还是那句话,我不知道这家API站还能活多久,所以要充值推荐就直接按照能充值的最小额度来充值,可能就还算靠谱。

Superpower

这个是一个很好用的工具,我觉得如果你不打算全流程狂用AI Token,我们可以折中成这个。

项目地址

总之就是好用。欢迎大家试试。

SPEC驱动的代码编写

现在多代理编码已经开始渐渐成熟,为了能让编码更加流畅,我结合网上抄来的教程,AI整理出了当前对于我来说比较快的编码/需求开发套路,发在下面。

1. 流程总览

你现在的实际工作流是一个“先规格、再分阶段实现、最后用测试与验收闭环”的循环:

  1. 问题定义:写清背景、现象、根因(或现状约束)。
  2. 目标收敛:明确目标与非目标,限制改动边界。
  3. 方案设计:给出数据结构/模块改造点/兼容策略。
  4. 分阶段实施:按 Phase 1/2/3... 拆任务,逐项打勾推进。
  5. 测试矩阵:先列新增测试,再列回归测试,覆盖关键路径。
  6. 验收标准:定义可判定完成的条件(不是主观“感觉完成”)。
  7. 自审/Review Loop:做一次规格自检,修正文档歧义后再编码。
  8. 实现进度回填:把“已改文件、已跑测试、已知缺口”持续写回 SPEC。

这不是一次性文档,而是“设计 + 实施日志”的合体。

2. 你当前 SPEC 的固定骨架(高频模板)

specs/*/SPEC.md 的共性看,你常用结构是:

  • 背景 / 问题定位
  • 目标
  • 非目标
  • 方案设计(含配置、数据结构、运行时行为、兼容性)
  • 实施阶段(Phase 列表 + 勾选)
  • 测试矩阵(单测/回归/E2E)
  • 验收标准
  • 风险与缓解风险与决策
  • 自我 Review / SPEC Review Loop
  • 实现进度 / 实施状态

换句话说,你的 SPEC 已经是“可执行清单”,不是只描述想法。

3. 代码落地时的执行习惯

结合你现有 SPEC 与代码组织,落地节奏通常是:

  1. 先做最小改动面(优先局部、低耦合修改)。
  2. 先补/改测试,再推进主逻辑(至少同步推进)。
  3. 每个 Phase 都有可验证输出(代码 + 测试 + 文档勾选)。
  4. 允许分批完成:先完成核心链路,再补 E2E 或环境相关验证。
  5. 将“未完成项”显式记录在 SPEC,而不是留在口头上下文。

4. 历史会话数据在你流程里的使用方式

你当前系统不是“无状态”编码,而是会把历史上下文纳入后续回合:

  1. 前缀上下文保留:AGENTS.md 指令、environment_context、skills 注入会被识别为上下文前缀并保留。
  2. 历史标准化:会补齐缺失 tool output、移除孤儿 tool output,保证消息序列可继续推理。
  3. 历史裁剪:可按 user turn 丢弃最近 N 轮,保留前缀上下文不丢。
  4. 超长历史摘要:会把较旧会话压缩成 summary,只保留最近若干消息原文,降低上下文成本。

这意味着你可以把“上一轮 SPEC 结论、未完成项、验证结果”持续沉淀到会话与文档里,下一轮直接接着做。

5. 你现在这套流程的优势

  • 可追踪:每次改动都有 SPEC 条目和测试记录对应。
  • 可回滚:非目标与边界清晰,不容易越改越散。
  • 可协作:别人接手时能从 Phase/验收标准直接继续。
  • 可复用:同一模板可复制到新特性,降低沟通成本。

6. 建议你继续保持的最小动作

  1. 每个新需求先开一个 specs/<feature>/SPEC.md,当天就写出“目标/非目标/验收标准”。
  2. 每做完一个 Phase,立即回填“实现进度 + 已执行测试命令”。
  3. 如果出现偏离(实现与 SPEC 不一致),优先更新 SPEC 再继续编码。

总结

以后AI就成为了水电燃费用以外的另一个每个月得上贡给厂商的费用了,Deepseek赶快努力,这样我每个月又能少交点钱。

It is my final heart.
最后更新于 2026-02-13