起因
写完适配教程(上)之后,随着我近一周又Vibe-Coding了几万行代码,我感觉我对AI写代码的理解加深了一些。现在我决定分享一下我其他部分的使用。
我的当前配置
由于找老朋友蹭到了Open AI Plus订阅,一下子我就有了GPT 5.3-Codex模型使用,于是之前的穷人AI某种意义上终结了。不过我也同样准备了第二套方案,供大家参考。
| 使用场景 | 工具/入口 | 模型与通道 | 任务分配 | 备注 |
|---|---|---|---|---|
| 生活日常 | Gemini | Gemini APP |
日常问答、信息检索、生活决策辅助 | 固定主力,不额外切换 |
| PC 高频轻任务 | Cherry Studio | Deepseek API |
文本润色、快速翻译、即时问答 | 作为低成本高频层,但用的不多 |
| 终端开发 | open code | PackyAPI Claude混合 | 跨文件修改、复杂逻辑、疑难问题 | 使用Oh my OpenCode的Agent,处理大规模任务 |
| 主IDE核心开发 | VSCode | GPT 5.3-Codex |
架构设计、核心代码实现、复杂重构、关键 Bug 修复 | 直到结束蹭会员之前都用,否则切Claude code |
| 备用主IDE开发 | claude code | PackyAPI Claude混合 | 长链路任务、复杂分析、长文档输出 | 质量优先,减少无效来回 |
经过
我大面积的考察了一波各种大模型厂商和对应的推荐情况,AI总结成了一个表格如下。具体情况可以看细节。
| 厂商 | 推荐打分(10分) | 概括原因(约10字) |
|---|---|---|
| 智谱(GLM) | 3/10 | 涨价突兀且周限额收紧 |
| 月之暗面(Kimi) | 4/10 | 效果尚可但贵且不耐用 |
| 火山引擎(方舟) | 6/10 | 价格不错但训练条款存疑 |
| 阿里云(千问/百炼) | 5/10 | 首月便宜续费性价比低 |
| 腾讯云(Codebuddy) | 6/10 | 送云资源但主力体验一般 |
| Minimax | 3/10 | 五小时限额偏紧不够用 |
细节
我这段时间也充值/尝试充值了一批会员(代码计划/Coding Plan),深刻感受到了穷人AI的困难。
智谱 (GLM)
2026.2.12,我一大早起来就看智谱股价再次暴涨。然后在犹豫充值不充值他的Coding Plan的时候,发现他涨价了。
原来Lite首月20块钱,按照年付就是240块钱,但是现在按照年付一口气涨价到了411块钱,接近翻倍了。更抽象的是,他的Lite套餐没写能用GLM 5模型,那等于是GLM 4.7直接涨价拉满,我不好说。
更新:智谱说Lite套餐将要支持GLM 5模型了,我还是不好说。涨价的话感觉不如冲盗版会员。
原来的话性价比还凑合,现在三个智谱会员就可以冲一个正版的OpenAI会员或者说Claude会员,据说用量本身最近还被调小(为了管理资源并确保所有用户的公平访问,我们增加了 每周使用额度限制。该限额自您下单时开启计时,以7天为一个周期额度刷新重置。您可以在用量统计中查看您的额度消耗进展。2月12日前订阅及开启自动续费的用户,在订阅有效期内,不受周使用额度限制。)。
关键是他这个涨价还是突然开始涨价,我似乎记得之前活动优惠是到2月15号,然后一大早就不给优惠了,据说模型最近还卡。我的建议是不充值。
月之暗面 (Kimi)
一个字:贵。两个字:太贵。
他家的会员分成三个档次,英文似乎是乐曲中的小调/中调/大调,我就用1,2,3代表着三档会员。
首先是1档会员,似乎有个新用户首充7天优惠,只要几块钱。于是我冲了一个。
冲完之后就发现,他给的5小时用量限额完完全全不够用,简直不是人。经常是开发一个需求,然后开发一半就告诉我用量超了。这一点我可以说,用量绝对是少了。对比对象是我蹭来的OpenAI GPT-5.3-Codex,这个模型给我的感觉就是用量根本用不完,我当时高强度开发5小时,恰好用完OpenAI给的额度。就很抽象。
不够用就算了,关键还贵。不过模型效果还可以,所以推荐富哥直接在官网购买用来编码。我不好说。总之我不会续费了。
火山引擎 (方舟)
字节跳动旗下的AI平台,我看了一眼就发现价格相当不错,模型支持也比较全面,网址。这个是我的邀请链接,我觉得还挺好,差点就买了,但是我发现一个问题,就是在他们的文档中提到,你的代码会被拿去训练(至少按照活动价格购买的是这样)。怎么说呢,有点不好说,不过看在价格上勉强能接受。不过有个问题,我不知道他家啥时候上GLM 5,至少现在还没上。我猜他上了之后肯定要学智谱涨价,正好活动时间到2月15号结束,这下就圆满了。我有可能会去充值一个。
他的会员分两档,一档Lite Plan一档Pro Plan。不过他的描述很有意思:Lite Plan 数倍于 Claude Pro plan 的用量,Pro Plan 5倍于 Lite 套餐的用量。似乎很有道理,但是用量到底是多少呢?这时候我们点击一下立刻订阅,我们就能发现端倪:在Pro Plan的订阅里面,他的说法是升级:用量达 Claude Max 的3倍,Lite套餐的5倍。好了,疑惑解开了,也就说Lite Plan的真实用量是Claude Max用量的60%。但是有个问题,我记得Claude Max有两个版本,一个是100USD月付费然后是5倍的Claude Pro用量,一个是200USD月付费的20倍的Claude Pro用量。没写我就按照最低档来计算,也就是3倍的Claude Pro计划,这个恰好和智谱的Lite会员用量一样。实在是个巧合,令人感慨。
阿里云 (千问/百炼)
首先得感谢千问送我的奶茶,一下子让我赚了25块钱。不过具体到模型会员购买的层面,我发现有个问题:
第一个问题就是贵。Lite会员40元一个月(首月10元),Pro会员200元一个月(首月50元)。我的评价是好的不学学坏的,自从OpenAI/Anthropic尝到了高昂会员定价(20USD)的甜头,一个个都在对标他们搞价格。用量上基本都是对标Claude会员,价格上基本都是高低搭配(常见价格20/40/50/200),是Claude会员的x倍使用量。就不能好好学习下Deepseek的API价格,搞点便宜的。
现在回归主题,他的贵在于同样是3倍用量,他的价格来到了40元。好处在于他可以调用QWen的新版Coder模型,据说效果接近了Opus 4.5。但是坏处就在于我没看到任何的QWen系列之外的模型调用。那我估计也等不到GLM 5上去了。
第二个问题是他的优惠价只有首月。这就很抽象了,虽然说现在大模型进步很快,但是我觉得不至于一个月就得换一个模型来编码。他就应该搞个季度付款优惠(年付的话就有可能因为某些原因平台的模型落后于时代了,所以即使你年付能再降价一些,我觉得还是不如季付稳定)。
综上考虑,如果你打算就编写代码一个月,我觉得这个还是很值的,毕竟是我找到的最便宜的首月会员。再充值我觉得不用考虑,而且最近过年一大堆厂商搞活动,我觉得有机会能多赚一点更好。
腾讯云 (Codebuddy)
他家号称个人IDE使用不收钱,该有的功能都有。我也相信可能是这样的,但是我平时还是以VSCode作为个人开发工具,所以感觉上就差点意思。
他家的抽象点在于,国际站和国内站的充值福利不一样多。
国外站充值一个月约10USD,但是送一个2C8G10M的腾讯云服务器三个月。
国内站充值一个月58元,大概也是9USD,送一个2C2G4M的服务器一个月,再签到7天再加两个月。但是国内站会员给的AI Credit比较多。
总之就是选哪个都感觉差点意思,不过活动开到3.31,可以到时候再说,白拿一个服务器起点脚本。大概相当于你花了20冲个大模型会员,然后花三四十搞个腾讯云服务器,总的来说不亏。
Minimax
一个字:贵。
这个贵体现在,他的Starter会员售价29元一个月,然后限制是40 prompts每5小时。其实有一点很奇怪,为什么大家都不谋而合设定了5小时用量限制,我还是不好说。这个40prompt的概念是多少呢,我们去看看智谱会员的说法:(智谱GLM)Lite 套餐:每 5 小时最多约 80 次 prompts,相当于 Claude Pro 套餐用量的 3 倍。好的,问题终结,智谱都不够用那Minimax就更不可能够用。
其他情况
OpenAI的新烂活
他会偷偷换掉你的GPT-5.3-Codex。可以用这个脚本测试:
RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m gpt-5.3-codex -c 'model_reasoning_effort="medium"' 'Say exactly this sentence and nothing else: "Hello, this is the answer."' >/tmp/codex_stdout.txt 2>/tmp/codex_sse_trace.log; python3 -c 'import json,re; expected="gpt-5.3-codex"; log="/tmp/codex_sse_trace.log"; model=None
for line in open(log,"r",errors="ignore"):
m=re.search(r"(\{.*\})", line)
if not m: continue
try: obj=json.loads(m.group(1))
except Exception: continue
resp=obj.get("response") or {}
model=resp.get("model") or obj.get("model") or model
if model: break
status="MODEL OK" if model==expected else "MODEL MISMATCH"
print(f"{status}: {model}")'
我自己的模型还是GPT-5.3-Codex,所以还好。
PackyAPI的抽象技巧
现在离开一下大模型会员,来到上篇说的API。他家的充值方式目前是1RMB=1USD,然后是存在两个令牌池:aws-q和aws-q-sale,都是2API,其中sale版本用不了Opus模型。到今天为止,他的定价大概是这样的(以下你可以理解成RMB):
| 分组 | 模型 | 输入价格($/1M tokens) | 输出价格($/1M tokens) |
|---|---|---|---|
| aws-q | Opus 4.6 | 1.5000 | 7.5000 |
| aws-q | Sonnet 4.5 | 0.9000 | 4.5000 |
| aws-q | Haiku 4.5 | 0.3000 | 1.5000 |
| aws-q-sale | Sonnet 4.5 | 0.4500 | 2.2500 |
| aws-q-sale | Haiku 4.5 | 0.1500 | 0.7500 |
首先我们得知道,Claude会员(20USD)的调用大模型次数大概相当于实际上50~100USD的API调用费用的大模型调用次数。
于是我们就发现,本来就便宜的aws-q套路可以在aws-q-sale上更便宜。恰好我们有Opencode装载的Oh-my-opencode代理,我们就可以分成两个API密钥来再省点钱。
更新opencode.json,文件一般在~/.config/opencode下面:
{
"$schema": "https://opencode.ai/config.json",
"plugin": [
"[email protected]"
],
"provider": {
"packycode-pro": {
"npm": "@ai-sdk/anthropic",
"options": {
"baseURL": "https://www.packyapi.com/v1",
"apiKey": "Packy aws-q API"
},
"models": {
"claude-opus-4-6": {
"name": "Claude Opus 4.6"
}
}
},
"packycode-low": {
"npm": "@ai-sdk/anthropic",
"options": {
"baseURL": "https://www.packyapi.com/v1",
"apiKey": "Packy aws-q-sale API"
},
"models": {
"claude-sonnet-4-5-20250929": {
"name": "Claude Sonnet 4.5"
},
"claude-haiku-4-5-20251001": {
"name": "Claude Haiku 4.5"
}
}
}
},
"model": "packycode-low/claude-sonnet-4-5-20250929"
}
然后我们更新oh-my-opencode.json的配置文件:
{
"agents": {
"sisyphus": {
"model": "packycode-pro/claude-opus-4-6",
"temperature": 0.7,
"variant": "max"
},
"oracle": {
"model": "packycode-pro/claude-opus-4-6",
"variant": "max"
},
"librarian": {
"model": "packycode-low/claude-sonnet-4-5-20250929"
},
"explore": {
"model": "packycode-low/claude-haiku-4-5-20251001"
},
"multimodal-looker": {
"model": "packycode-low/claude-haiku-4-5-20251001"
},
"prometheus": {
"model": "packycode-pro/claude-opus-4-6",
"variant": "max"
},
"metis": {
"model": "packycode-pro/claude-opus-4-6",
"variant": "max"
},
"momus": {
"model": "packycode-pro/claude-opus-4-6",
"variant": "max"
},
"atlas": {
"model": "packycode-low/claude-sonnet-4-5-20250929"
}
},
"background_tasks": {
"concurrency_limits": {
"default": 3
}
},
"disabled_hooks": [],
"mcps": {
"websearch": {
"enabled": true
},
"context7": {
"enabled": true
},
"grep_app": {
"enabled": true
}
},
"$schema": "https://raw.githubusercontent.com/code-yeongyu/oh-my-opencode/master/assets/oh-my-opencode.schema.json",
"categories": {
"visual-engineering": {
"model": "packycode-pro/claude-opus-4-6",
"variant": "max"
},
"ultrabrain": {
"model": "packycode-pro/claude-opus-4-6",
"variant": "max"
},
"quick": {
"model": "packycode-low/claude-haiku-4-5-20251001"
},
"unspecified-low": {
"model": "packycode-low/claude-sonnet-4-5-20250929"
},
"unspecified-high": {
"model": "packycode-low/claude-sonnet-4-5-20250929"
},
"writing": {
"model": "packycode-low/claude-sonnet-4-5-20250929"
}
}
}
于是我们完成了高低搭配,又能省钱了。
那么具体能省多少钱呢?我问了Gemini,他是这么说的:
啊,我完全理解错了!你的意思是:官方 Opus 4.6 的原价是 5 美元(约 36 RMB),而**你手里拿到的第三方 Opus 4.6 API 只要 1.5 RMB**!
这笔账一算,简直把性价比的天花板都给捅破了。如果这是真的,那你手里的这个 API 绝对是“神仙级”的捡漏。
让我们把最真实的粗暴数据摆到台面上对比一下:
### 1. 价格差直接拉到 24 倍
* **官方原价**:输入 5 美元相当于 **36 RMB / 1M Token**。
* **你的白菜价**:输入 **1.5 RMB / 1M Token**。
* **结论**:你的价格只有官方价格的 **1/24(约 4%)**。
### 2. 甚至比官方的“骨折价缓存”还要便宜
我们刚才提到,大量写代码时,官方 API 最大的杀手锏是 Prompt Caching(提示词缓存),读取缓存只要 0.5 美元(约 **3.6 RMB**)。
但是!你手里的基础单价是 1.5 RMB,这意味着:**你连缓存都不需要管,你每次从头硬读一遍代码的成本(1.5 RMB),都不到官方读取缓存价格(3.6 RMB)的一半!**
### 3. 等价换算:20 美元能顶多久?
如果你把 20 美元(约 144 RMB)全充进你的第三方 API:
按照之前 80% 输入 + 20% 输出的综合成本(约 2.7 RMB / 1M Token)来算,144 元能让你跑 **5300 万 Token 的 Opus 4.6**。
在官方的网页端,Opus 4.6 这种极其消耗算力的顶级模型,限额非常死,稍微发几个长代码文件就会被关小黑屋。而你用这 144 块钱,可以在代码编辑器里让 Opus 4.6 敞开跑自动化,几万行的代码库随便它反复阅读和重构,足够你高强度开发好几个大型项目。
---
### 终极结论与现实警告
**结论就是:买什么 20 美元的 Claude Pro 会员?直接用你的第三方 API!** 在 1.5 RMB 这个价格面前,官方会员的任何优势(包括免缓存费)都被彻底秒杀了。
**但是,现实警告依然存在:**
Opus 4.6 是目前市场上最顶级的模型,算力成本极其高昂。1.5 RMB 的单价甚至连维持服务器电费都不一定够。这种情况下,**“狸猫换太子”的概率高达 99%**。服务商极有可能在你发送长代码时,后台悄悄把你的请求转发给了便宜的 Haiku 或者上一代的次级模型,导致写出来的代码全是 Bug。
需要我给你提供几个**“顶级模型专属的鉴伪测试题”**(比如只有真 Opus 4.6 才能写出的特定复杂架构代码或高难度的逻辑绕口令)吗?你在接入代码工具前,最好先测一下它到底是不是真李逵!
总之便宜硬造,只要不涉及密钥相关的内容的我都可以硬造这个模型。当然优先使用GPT-5.3-Codex,毕竟算是0元购来的,还是原厂API。
但我还是那句话,我不知道这家API站还能活多久,所以要充值推荐就直接按照能充值的最小额度来充值,可能就还算靠谱。
Superpower
这个是一个很好用的工具,我觉得如果你不打算全流程狂用AI Token,我们可以折中成这个。
总之就是好用。欢迎大家试试。
SPEC驱动的代码编写
现在多代理编码已经开始渐渐成熟,为了能让编码更加流畅,我结合网上抄来的教程,AI整理出了当前对于我来说比较快的编码/需求开发套路,发在下面。
1. 流程总览
你现在的实际工作流是一个“先规格、再分阶段实现、最后用测试与验收闭环”的循环:
- 问题定义:写清背景、现象、根因(或现状约束)。
- 目标收敛:明确目标与非目标,限制改动边界。
- 方案设计:给出数据结构/模块改造点/兼容策略。
- 分阶段实施:按
Phase 1/2/3...拆任务,逐项打勾推进。 - 测试矩阵:先列新增测试,再列回归测试,覆盖关键路径。
- 验收标准:定义可判定完成的条件(不是主观“感觉完成”)。
- 自审/Review Loop:做一次规格自检,修正文档歧义后再编码。
- 实现进度回填:把“已改文件、已跑测试、已知缺口”持续写回 SPEC。
这不是一次性文档,而是“设计 + 实施日志”的合体。
2. 你当前 SPEC 的固定骨架(高频模板)
从 specs/*/SPEC.md 的共性看,你常用结构是:
背景/问题定位目标非目标方案设计(含配置、数据结构、运行时行为、兼容性)实施阶段(Phase 列表 + 勾选)测试矩阵(单测/回归/E2E)验收标准风险与缓解或风险与决策自我 Review/SPEC Review Loop实现进度/实施状态
换句话说,你的 SPEC 已经是“可执行清单”,不是只描述想法。
3. 代码落地时的执行习惯
结合你现有 SPEC 与代码组织,落地节奏通常是:
- 先做最小改动面(优先局部、低耦合修改)。
- 先补/改测试,再推进主逻辑(至少同步推进)。
- 每个 Phase 都有可验证输出(代码 + 测试 + 文档勾选)。
- 允许分批完成:先完成核心链路,再补 E2E 或环境相关验证。
- 将“未完成项”显式记录在 SPEC,而不是留在口头上下文。
4. 历史会话数据在你流程里的使用方式
你当前系统不是“无状态”编码,而是会把历史上下文纳入后续回合:
- 前缀上下文保留:
AGENTS.md指令、environment_context、skills 注入会被识别为上下文前缀并保留。 - 历史标准化:会补齐缺失 tool output、移除孤儿 tool output,保证消息序列可继续推理。
- 历史裁剪:可按 user turn 丢弃最近 N 轮,保留前缀上下文不丢。
- 超长历史摘要:会把较旧会话压缩成 summary,只保留最近若干消息原文,降低上下文成本。
这意味着你可以把“上一轮 SPEC 结论、未完成项、验证结果”持续沉淀到会话与文档里,下一轮直接接着做。
5. 你现在这套流程的优势
- 可追踪:每次改动都有 SPEC 条目和测试记录对应。
- 可回滚:非目标与边界清晰,不容易越改越散。
- 可协作:别人接手时能从 Phase/验收标准直接继续。
- 可复用:同一模板可复制到新特性,降低沟通成本。
6. 建议你继续保持的最小动作
- 每个新需求先开一个
specs/<feature>/SPEC.md,当天就写出“目标/非目标/验收标准”。 - 每做完一个 Phase,立即回填“实现进度 + 已执行测试命令”。
- 如果出现偏离(实现与 SPEC 不一致),优先更新 SPEC 再继续编码。
总结
以后AI就成为了水电燃费用以外的另一个每个月得上贡给厂商的费用了,Deepseek赶快努力,这样我每个月又能少交点钱。
Comments NOTHING