Moma-Token - Moma算力 | Token中转站 | 稳定Token输出 | Token源头厂家

产品与服务

Token中转站直供 · 稳定Token输出 · 支持Token免费测试 · Token出海 · 算力出海 — 覆盖主流 AI 大模型场景，提供从开发测试到生产部署的全栈算力解决方案

Token 算力包

Token源头厂家直供，稳定Token输出保障。预购 Token 充值包，按实际调用量扣费，支持 Token 免费测试，一次采购灵活分配至不同业务线。

查看套餐价格

统一 API 网关 / Token中转站

一套 OpenAI 兼容接口对接所有主流模型，作为稳定 Token 中转站使用。切换底层模型无需改代码，降低多供应商接入成本，支持 Token 出海访问国际模型。

了解技术方案

用量分析面板

实时追踪每个项目、每个模型的 Token 消耗趋势。自动生成月度账单与成本优化建议。

查看演示

企业私有部署 / 算力出海

支持混合云与私有化部署模式，数据不出内网。同时提供算力出海方案，无缝对接海外 GPU 资源与国际大模型服务，提供 SLA 保障与专属技术支持通道。

联系销售团队

智能路由调度

基于任务类型自动选择最优模型与线路。高峰期自动负载均衡，保障服务稳定性。

技术详情

团队协作管理

多成员角色权限管控，API Key 隔离与配额分配。适合团队共享资源的企业场景。

开通团队版

算力套餐

灵活的阶梯定价策略，满足个人开发者到企业级客户的不同规模需求

体验版

适合个人学习与轻度使用

¥ 29 /月起

原价 ¥49/月

50 万 Token 基础额度
支持 5 款主流模型
标准 API 响应速度
用量统计面板
社区技术支持

最受欢迎

专业版

适合中小团队与商业项目

¥ 199 /月起

原价 ¥329/月

500 万 Token 月度额度
全部 15+ 模型可用
优先级加速通道
高级数据分析报告
工单客服支持（工作日内）
3 个 API Key 隔离

企业版

适合规模化生产环境

¥ 899 /月起

原价 ¥1499/月

3000 万 Token 月度额度
全模型 + 私有模型接入
专属高并发通道
99.95% SLA 保障
7x24 专属客服
不限 API Key 数量
团队权限管理

定制方案

为大型企业量身打造

按需议价

-

无上限 Token 配额
私有化/混合云部署
定制化 SLA 条款
专属客户成功经理
安全合规审计支持
签约账期支持

模型报价

全量模型透明定价，按Token计费，即用即付

更新时间：2026-05-15 | 单位：元/百万Token（人民币含税）

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
DeepSeek	DeepSeek-V4-Pro	¥13.0435	¥26.087
	DeepSeek-V4-Flash	¥1.087	¥2.1739
	DeepSeek-V3.2	¥0.7609	¥1.1413
	DeepSeek-V3.1-Terminus	¥1.5217	¥4.5652
	DeepSeek-V3.1	¥1.5217	¥4.5652
	DeepSeek-V3-250324	¥0.7609	¥3.0435
	DeepSeek-R1-0528	¥1.5217	¥6.087
GLM最新模型	GLM-5.1	¥6.087	¥21.3043
	GLM-5	¥4.5652	¥15.2174
	GLM-5-Turbo	¥5.3261	¥19.7826
	GLM-4.7	¥2.663	¥12.1739
	GLM-4.6	¥2.663	¥12.1739
GLM-4.5	GLM-4.5-Flash	免费	免费
	GLM-4.5	¥2.663	¥10.6522
	GLM-4.5-Air	¥0.7609	¥4.5652
	GLM-4.5-X	¥10.6522	¥28.1522
	GLM-4.5-AirX	¥3.4772	¥13.9163
GLM-4	GLM-4-Flash	免费	免费
	GLM-4-9B	¥1.5217	¥1.5217
	GLM-4-Plus	¥3.8043	¥3.8043
	GLM-4-Air	¥0.3804	¥0.3804
	GLM-4-Long	¥0.7609	¥0.7609
	GLM-4-AirX	¥7.6087	¥7.6087
	GLM-4-FlashX	¥0.0761	¥0.0761
GLM-Z1	GLM-Z1-Flash	免费	免费
	GLM-Z1-Air	¥0.3804	¥0.3804
	GLM-Z1-AirX	¥3.8043	¥3.8043
Qwen3	Qwen3-Next-80B-A3B-Instruct	¥0.9326	¥3.7239
	Qwen3-Next-80B-A3B-Thinking	¥0.9326	¥9.3196
	Qwen3-235B-A22B	¥2.6087	¥26.087
	Qwen3-32B	¥1.3043	¥13.0435
	Qwen3-235B-A22B-Thinking-2507	¥1.8652	¥18.6326
	Qwen3-235B-A22B-Instruct-2507（非思考）	¥1.8652	¥7.4543
	Qwen3-30B-A3B-Thinking-2507	¥0.6978	¥6.9848
	Qwen3-30B-A3B-Instruct-2507（非思考）	¥0.6978	¥2.7978
ERNIE-4.5-Turbo	ERNIE-4.5-Turbo-32K	¥1.2391	¥4.9674
ERNIE-4.5-Turbo	ERNIE-4.5-Turbo-128K	¥1.2391	¥4.9674
MiniMax	MiniMax-M1-80k	¥3.0435	¥12.1739
	MiniMax-Text-01	¥0.7609	¥6.087
	MiniMax-M2	¥1.5978	¥6.3913
	MiniMax-M2.5	¥1.5978	¥6.3913
	MiniMax-M2.7	¥1.5978	¥6.3913
Qwen3-Coder	Qwen3-Coder-480B-A35B-Instruct	¥9.7826	¥9.7826
Qwen3-Coder	Qwen3-Coder-Plus	¥9.7826	¥9.7826
百川	Baichuan-M2	¥0.5435	¥0.5435
百川	Baichuan-M3	¥10.8696	¥32.6087
Kimi	Kimi-K2.5	¥3.0435	¥15.9783
Qwen	Qwen-Long	¥0.463	¥1.8652

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
Qwen3.5	Qwen3.5-Plus	¥2.6087	¥15.6522
	Qwen3.5-397B-A17B	¥1.9565	¥11.7391
	Qwen3.5-122B-A10B	¥1.3043	¥10.4348
	Qwen3.5-35B-A3B	¥1.0435	¥8.3478
	Qwen3.5-27B	¥1.1739	¥9.3913

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
Qwen3-VL	Qwen3-VL-30B-A3B-Thinking	¥0.6978	¥6.9848
	Qwen3-VL-30B-A3B-Instruct	¥0.6978	¥2.7978
	Qwen3-VL-235B-A22B-Thinking	¥1.8587	¥18.6326
	Qwen3-VL-235B-A22B-Instruct	¥1.8587	¥7.4543
GLM-4V	GLM-4V-Plus-011	¥3.0435	¥3.0435
	GLM-4V	¥38.0435	¥38.0435
	GLM-4V-Flash	-	-
ERNIE-4.5-Turbo-VL	ERNIE-4.5-Turbo-VL-32K	¥4.663	¥13.9783
GLM-4.5V	GLM-4.5V	¥3.4772	¥10.4315
GLM-4.6V	GLM-4.6V	¥1.7424	¥5.2196
PaddleOCR	PaddleOCR-VL-0.9B	免费	免费

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
MiniMax	MiniMax-Hailuo-02	输出视频768P 6s : 1.75元/视频输出视频768P 10s : 3.48元/视频输出视频1080P 6s : 3.05元/视频	-
MiniMax	MiniMax-Hailuo-2.3	输出视频768P 6s：1.52元/视频 768P 10s：3.05元/视频 1080P 6s：2.67元/视频	-
Doubao-Seedance-1.0	Doubao-Seedance-1.0-Pro	-	-

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
MiniMax	T2V-01	2.6元/个	-
MiniMax	T2V-01-Director	2.6元/个	-

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
MiniMax	I2V-01	2.6元/个	-
	I2V-01-live	2.6元/个	-
	I2V-01-Director	2.6元/个	-

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
通义万相	WanX2.1-T2I-Plus	0.22/张	-
通义万相	WanX2.1-T2I-Turbo	0.16/张	-
Doubao-Seedream-3.0	Doubao-Seedream-3.0-T2I	0.41/张	-
Doubao-Seedream-4.0	Doubao-Seedream-4.0	0.32/张	-

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
Embedding	embedding-2	¥0.3804	¥0.3804
Embedding	embedding-3	¥0.3804	¥0.3804

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
GLM-Rerank	GLM-Rerank	¥0.6087	¥0.6087

系列	模型名称	输入价格（元/百万Token）	输出价格（元/百万Token）
GLM-ASR	GLM-ASR-2512	¥0.1141	-

以下模型需单独申请开通权限，国外模型在合同中以【代称】体现

系列	模型名称	代称	中转计费（元/百万Tokens）		直转计费（元/百万Tokens）
系列	模型名称	代称	输入	输出	输入	输出
Claude	Claude-Sonnet-4.5	C-S-4.5	¥16.663	¥101.1685	¥20.2337	¥101.1685
	Claude-Sonnet-4.6	C-S-4.6	¥16.663	¥101.1685	¥20.2337	¥101.1685
	Claude-Haiku-4.5	C-H-4.5	¥5.5543	¥33.7228	¥6.7446	¥33.7228
	Claude-Opus-4.5	C-O-4.5	¥27.7717	¥168.6141	¥33.7228	¥168.6141
	Claude-Opus-4.6	C-O-4.6	¥27.7717	¥168.6141	¥33.7228	¥168.6141
	Claude-Opus-4.7	C-O-4.7	¥27.7717	¥168.6141	¥33.7228	¥168.6141
	AWS-Claude-Haiku-4.5	A-C-H-4.5	¥5.5543	¥33.7228	¥6.7446	¥33.7228
	AWS-Claude-Sonnet-4.6	A-C-S-4.6	¥16.663	¥101.1685	¥20.2337	¥101.1685
	AWS-Claude-Opus-4.6	A-C-O-4.6	¥27.7717	¥138.8587	¥33.7228	¥168.6141
	CC-Claude-Haiku-4.5	CC-C-H-4.5	¥5.5543	¥27.7717	¥6.7446	¥33.7228
	CC-Claude-Opus-4.6	CC-C-O-4.6	¥27.7717	¥138.8587	¥33.7228	¥168.6141
	CC-Claude-Sonnet-4.6	CC-C-S-4.6	¥16.663	¥83.3152	¥20.2337	¥101.1685
Gemini	Gemini-3.1-Pro-Preview	Ge-3.1-P-P	¥11.1087	¥66.6522	¥13.4891	¥80.9348
	AWS-Gemini-3.1-Pro-Preview	A-Ge-3.1-P-P	¥11.1087	¥66.6522	¥13.4891	¥80.9348
	Gemini-3-Pro-Preview	Ge-3-P-P	¥11.1087	¥66.6522	¥13.4891	¥80.9348
	Gemini-3-Flash-Preview	Ge-3-F-P	¥2.7391	¥16.4348	¥3.3261	¥19.9565
OpenAI	GPT-5.4	GP-5.4	¥13.8859	¥83.3152	¥16.8614	¥101.1685
	AWS-GPT-5.4（优质资源）	A-GP-5.4	¥13.8859	¥83.3152	¥16.8614	¥101.1685
	GPT-5.2	GP-5.2	¥9.587	¥76.6957	¥11.6413	¥93.1304
xAI	Grok-4	GR-4	¥16.7391	¥83.6957	¥20.3261	¥101.6304

智能调度成功 延迟降低 42%

实时监控 全部节点运行正常

为什么选择 Moma Token

永不移动Token稳定算力中心 — Token源头厂家直供，稳定Token输出，Token中转站一键接入，支持Token免费测试、Token出海、算力出海，让 AI 能力的获取像用水用电一样简单

01

Token源头厂家，稳定Token输出

作为 Token 源头厂家直供平台，整合 OpenAI、Anthropic、DeepSeek、百度、阿里等国内外十余家主流大模型服务商，稳定 Token 输出，通过统一的 Token 中转站 API 格式与密钥体系管理，无需分别注册和对接。
02

Token免费测试，按量计费

注册即获免费 Token 测试额度，新用户可免费体验全部模型调用效果。所有模型统一以 Token 为计量单位，明码标价无隐藏费用，平均为客户节省 35%-60% 的算力开支。
03

Token出海 · 算力出海，稳定可靠

提供专业 Token 出海与算力出海通道，无缝访问 GPT、Claude 等国际顶级模型。多地域多节点冗余部署，自动故障转移，综合可用率达到 99.99% 以上。
04

Token中转站，零迁移成本

Moma Token 作为标准 Token 中转站，完全兼容 OpenAI SDK 调用规范，现有代码几乎无需改动即可接入。支持 Python、JavaScript、Java、Go 等主流语言官方 SDK。

使用流程

四步完成从注册到上线的全流程，支持 Token 免费测试，最快 5 分钟内即可通过 Token 中转站发起第一次 API 调用，快速开启 Token 出海与算力出海之旅

1

注册账号

使用邮箱或手机号快速注册，完成实名认证后即可获得 Token 免费测试额度

2

选择套餐

根据预估用量选择合适的算力套餐，或先充值按量扣费

3

创建 API Key

在控制台生成专属 API Key，可按项目设置独立的调用限额

4

开始调用

替换原有 API 地址与密钥，保持代码不变，立即享受多模型能力

支持的 AI 模型

Token 源头厂家直供，持续接入全球领先的 AI 大模型，一个 Token 中转站平台覆盖全场景需求，稳定 Token 输出，支持 Token 出海与算力出海

GPT

GPT-4o

OpenAI

GPT

GPT-4o-mini

OpenAI

CC

Claude 3.5

Anthropic

DS

DeepSeek-V3

DeepSeek

DS

DeepSeek-R1

DeepSeek

文心

ERNIE 4.0

百度

通义

Qwen-Max

阿里云

GLM

GLM-4

智谱

Moonshot

Kimi K2

月之暗面

MiniMax

abab 6.5

稀土数智

Spark

讯飞星火

科大讯飞

+more

更多模型

持续接入中

常见问题

关于 Moma Token 算力超市的高频问题解答

Moma Token 与直接向各厂商购买 API 有什么区别？

主要区别在于便捷性与成本。直接向各厂商购买需要分别注册账号、单独充值、分别对接不同格式的 API，管理和对齐成本较高。Moma Token 通过统一网关聚合多家厂商资源，你只需要一个账户、一套 API 密钥、一份账单即可使用全部模型。此外，我们的集中采购议价能力通常能为你带来 35%-60% 的成本优势。

Token 是如何计算的？不同模型之间的 Token 可以通用吗？

我们采用标准化的 Token 计量体系。不同模型的 Token 换算系数会在控制台明确标注（例如：1 个标准 Token = 1 个 GPT-4o Token ≈ 1.2 个 Claude Token）。购买的是"标准 Token 额度"，调用任何模型时按对应换算系数扣除。这样设计让你可以灵活地在不同模型之间调配算力资源，而不必担心各家的独立计费规则。

数据安全如何保障？我的对话内容会被存储吗？

数据安全是我们的核心关注点。首先，传输全程采用 TLS 1.3 加密；其次，我们不会主动存储你的 API 请求内容与模型回复数据，仅保留必要的匿名化统计信息（如调用次数、Token 用量）用于计费与运维。对于企业版和定制方案客户，我们还支持私有化部署选项，确保数据完全不出您的内网环境。平台已通过 ISO 27001 信息安全管理体系认证。

如何从现有的 OpenAI / 其他厂商迁移到 Moma Token？

迁移非常简单。由于我们的 API 完全兼容 OpenAI 的接口格式，你只需要做两件事：第一，将 API Base URL 从 `api.openai.com` 替换为 `api.moma-token.com`；第二，将 API Key 替换为你在 Moma Token 控制台生成的密钥。其余代码（包括请求参数、流式调用方式等）均无需修改。我们提供详细的迁移指南文档，以及一对一的技术支持协助你完成切换。

如果某个上游供应商出现故障，会影响我的服务吗？

我们的智能路由系统设计了多层容错机制。当某个供应商节点出现异常时，系统会自动将请求切换到备用节点或其他等效模型上，整个过程对上层应用透明。对于配置了自动降级策略的用户，还可以设定当主力模型不可用时自动降级至替代模型继续提供服务，最大限度保障业务连续性。

套餐内的 Token 用完了怎么办？是否支持超额使用？

支持多种续费与扩容方式。当套餐额度即将用尽时（默认阈值为 80%），系统会通过邮件和控制台通知提醒你。你可以选择：1) 按原价追加同等额度的补充包；2) 升级到更高档位套餐；3) 开启按量超额模式（超出部分按标准单价计费）。企业版用户还可设置自动续费规则，避免因余额不足导致服务中断。

准备好提升你的 AI 算力效率了吗？

立即注册即可获得 10 万 Token 免费试用额度，零门槛体验多模型聚合能力

一站式 Token算力超市

产品与服务

Token 算力包

统一 API 网关 / Token中转站

用量分析面板

企业私有部署 / 算力出海

智能路由调度

团队协作管理

算力套餐

模型报价

为什么选择 Moma Token

Token源头厂家，稳定Token输出

Token免费测试，按量计费

Token出海 · 算力出海，稳定可靠

Token中转站，零迁移成本

使用流程

支持的 AI 模型

常见问题

Moma Token 与直接向各厂商购买 API 有什么区别？

Token 是如何计算的？不同模型之间的 Token 可以通用吗？

数据安全如何保障？我的对话内容会被存储吗？

如何从现有的 OpenAI / 其他厂商迁移到 Moma Token？

如果某个上游供应商出现故障，会影响我的服务吗？

套餐内的 Token 用完了怎么办？是否支持超额使用？

准备好提升你的 AI 算力效率了吗？

一站式 Token
算力超市