模型与上下文
Novi 在对话与构建时会调用大模型。模型相关的入口分布在几个位置,本页集中说明。
选择模型
| 入口 | 位置 | 说明 |
|---|---|---|
| 起点选模型 | 代码工坊起点(写下想法的旁边) | 开始一个想法时,可选择使用的模型与项目模板,再点「开始」。 |
| 对话模型标签 | 原力对话输入框右下 | 显示当前会话使用的模型(如 opus)。 |
| 省钱建议 | 顶栏资源胶囊弹层 | 展示当前模型,并在合适时给出更省 Credits 的模型建议。 |
上下文(CTX)
每轮对话都会占用一定的上下文容量,在顶栏「资源胶囊」中以 已用 / 上限 形式显示(例:63.8K / 200K)。
- 上下文快满时,Novi 会自动归整较早的内容,无需手动清理。
- 上下文与 Credits 共同决定一次对话的开销。
计费:按 Credit 计费
模型调用按 Credit 计费:每次对话 / 构建消耗的 tokens,会按所用模型的计费比例折算成 Credits 扣减。不同模型比例不同,越强的模型单价通常越高。
下表为各模型每 100 万(1M)tokens 消耗的 Credits,分输入 / 输出两档(输出通常更贵)。套餐内含的 AI Tokens 配额见定价,余额查看与扣减规则见积分(Credits)。
模型与计费比例
平台接入的模型及各自计费比例如下(按输入单价从低到高):
| 模型 | 模型 ID | 输入(Credits / 1M) | 输出(Credits / 1M) |
|---|---|---|---|
deepseek-v4-flash | 1 | 2 | |
deepseek-v4-pro | 20 | 40 | |
mimo-v2.5-pro | 30 | 50 | |
glm-5.1 | 30 | 60 | |
MiniMax-M2.7 | 40 | 80 | |
MiniMax-M3 | 50 | 150 | |
qwen3.7-max-2026-05-17 | 100 | 250 | |
qwen3.7-max-2026-06-08 | 100 | 250 | |
claude-sonnet-4-6 | 100 | 250 | |
claude-opus-4-7 | 100 | 250 | |
gpt-5.3-codex | 125 | 250 | |
gpt-5.4 | 125 | 250 | |
gpt-5.5 | 150 | 300 | |
claude-opus-4-8 | 150 | 300 |
举例:用 Claude Opus 4.8 处理 1M 输入 + 1M 输出 tokens,约消耗 150 + 300 = 450 Credits;同样的量用 Deepseek V4 Pro 仅约 20 + 40 = 60 Credits。预算紧张时可优先选输入 / 输出单价更低的模型,或采纳顶栏「资源胶囊」的省钱建议。
说明
模型清单与计费比例会随平台调整增减,实际可选模型与最新单价以产品内模型下拉 / 计费页显示为准;部分模型可能临时停用或未对当前套餐开放。
