Token中转站 · 源头厂家直供 · 稳定Token输出

一站式 Token
算力超市

永不移动Token稳定算力中心 — Token中转站与源头厂家直供,稳定Token输出,支持Token免费测试,助力Token出海与算力出海。聚合多品牌大模型 API,统一接口、灵活计费,让每一笔算力投入都清晰可控。

50万+
累计服务用户
99.99%
服务可用率
<100ms
平均响应延迟
moma-token.com/dashboard
128,450
可用 Token
23.6K
今日消耗
86%
节省比例
GPT-4o / GPT-4o-mini 45%
Claude 3.5 Sonnet 28%
DeepSeek-V3 18%
其他模型 9%

产品与服务

Token中转站直供 · 稳定Token输出 · 支持Token免费测试 · Token出海 · 算力出海 — 覆盖主流 AI 大模型场景,提供从开发测试到生产部署的全栈算力解决方案

Token 算力包

Token源头厂家直供,稳定Token输出保障。预购 Token 充值包,按实际调用量扣费,支持 Token 免费测试,一次采购灵活分配至不同业务线。

查看套餐价格

统一 API 网关 / Token中转站

一套 OpenAI 兼容接口对接所有主流模型,作为稳定 Token 中转站使用。切换底层模型无需改代码,降低多供应商接入成本,支持 Token 出海访问国际模型。

了解技术方案

用量分析面板

实时追踪每个项目、每个模型的 Token 消耗趋势。自动生成月度账单与成本优化建议。

查看演示

企业私有部署 / 算力出海

支持混合云与私有化部署模式,数据不出内网。同时提供算力出海方案,无缝对接海外 GPU 资源与国际大模型服务,提供 SLA 保障与专属技术支持通道。

联系销售团队

智能路由调度

基于任务类型自动选择最优模型与线路。高峰期自动负载均衡,保障服务稳定性。

技术详情

团队协作管理

多成员角色权限管控,API Key 隔离与配额分配。适合团队共享资源的企业场景。

开通团队版

算力套餐

灵活的阶梯定价策略,满足个人开发者到企业级客户的不同规模需求

体验版
适合个人学习与轻度使用
¥ 29 /月起
原价 ¥49/月
  • 50 万 Token 基础额度
  • 支持 5 款主流模型
  • 标准 API 响应速度
  • 用量统计面板
  • 社区技术支持
企业版
适合规模化生产环境
¥ 899 /月起
原价 ¥1499/月
  • 3000 万 Token 月度额度
  • 全模型 + 私有模型接入
  • 专属高并发通道
  • 99.95% SLA 保障
  • 7x24 专属客服
  • 不限 API Key 数量
  • 团队权限管理
定制方案
为大型企业量身打造
按需议价
  • 无上限 Token 配额
  • 私有化/混合云部署
  • 定制化 SLA 条款
  • 专属客户成功经理
  • 安全合规审计支持
  • 签约账期支持

模型报价

全量模型透明定价,按Token计费,即用即付

更新时间:2026-05-15  |  单位:元/百万Token(人民币含税)

系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
DeepSeekDeepSeek-V4-Pro¥13.0435¥26.087
DeepSeek-V4-Flash¥1.087¥2.1739
DeepSeek-V3.2¥0.7609¥1.1413
DeepSeek-V3.1-Terminus¥1.5217¥4.5652
DeepSeek-V3.1¥1.5217¥4.5652
DeepSeek-V3-250324¥0.7609¥3.0435
DeepSeek-R1-0528¥1.5217¥6.087
GLM最新模型GLM-5.1¥6.087¥21.3043
GLM-5¥4.5652¥15.2174
GLM-5-Turbo¥5.3261¥19.7826
GLM-4.7¥2.663¥12.1739
GLM-4.6¥2.663¥12.1739
GLM-4.5GLM-4.5-Flash免费免费
GLM-4.5¥2.663¥10.6522
GLM-4.5-Air¥0.7609¥4.5652
GLM-4.5-X¥10.6522¥28.1522
GLM-4.5-AirX¥3.4772¥13.9163
GLM-4GLM-4-Flash免费免费
GLM-4-9B¥1.5217¥1.5217
GLM-4-Plus¥3.8043¥3.8043
GLM-4-Air¥0.3804¥0.3804
GLM-4-Long¥0.7609¥0.7609
GLM-4-AirX¥7.6087¥7.6087
GLM-4-FlashX¥0.0761¥0.0761
GLM-Z1GLM-Z1-Flash免费免费
GLM-Z1-Air¥0.3804¥0.3804
GLM-Z1-AirX¥3.8043¥3.8043
Qwen3Qwen3-Next-80B-A3B-Instruct¥0.9326¥3.7239
Qwen3-Next-80B-A3B-Thinking¥0.9326¥9.3196
Qwen3-235B-A22B¥2.6087¥26.087
Qwen3-32B¥1.3043¥13.0435
Qwen3-235B-A22B-Thinking-2507¥1.8652¥18.6326
Qwen3-235B-A22B-Instruct-2507(非思考)¥1.8652¥7.4543
Qwen3-30B-A3B-Thinking-2507¥0.6978¥6.9848
Qwen3-30B-A3B-Instruct-2507(非思考)¥0.6978¥2.7978
ERNIE-4.5-TurboERNIE-4.5-Turbo-32K¥1.2391¥4.9674
ERNIE-4.5-Turbo-128K¥1.2391¥4.9674
MiniMaxMiniMax-M1-80k¥3.0435¥12.1739
MiniMax-Text-01¥0.7609¥6.087
MiniMax-M2¥1.5978¥6.3913
MiniMax-M2.5¥1.5978¥6.3913
MiniMax-M2.7¥1.5978¥6.3913
Qwen3-CoderQwen3-Coder-480B-A35B-Instruct¥9.7826¥9.7826
Qwen3-Coder-Plus¥9.7826¥9.7826
百川Baichuan-M2¥0.5435¥0.5435
Baichuan-M3¥10.8696¥32.6087
KimiKimi-K2.5¥3.0435¥15.9783
QwenQwen-Long¥0.463¥1.8652
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
Qwen3.5Qwen3.5-Plus¥2.6087¥15.6522
Qwen3.5-397B-A17B¥1.9565¥11.7391
Qwen3.5-122B-A10B¥1.3043¥10.4348
Qwen3.5-35B-A3B¥1.0435¥8.3478
Qwen3.5-27B¥1.1739¥9.3913
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
Qwen3-VLQwen3-VL-30B-A3B-Thinking¥0.6978¥6.9848
Qwen3-VL-30B-A3B-Instruct¥0.6978¥2.7978
Qwen3-VL-235B-A22B-Thinking¥1.8587¥18.6326
Qwen3-VL-235B-A22B-Instruct¥1.8587¥7.4543
GLM-4VGLM-4V-Plus-011¥3.0435¥3.0435
GLM-4V¥38.0435¥38.0435
GLM-4V-Flash--
ERNIE-4.5-Turbo-VLERNIE-4.5-Turbo-VL-32K¥4.663¥13.9783
GLM-4.5VGLM-4.5V¥3.4772¥10.4315
GLM-4.6VGLM-4.6V¥1.7424¥5.2196
PaddleOCRPaddleOCR-VL-0.9B免费免费
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
MiniMaxMiniMax-Hailuo-02输出视频768P 6s : 1.75元/视频
输出视频768P 10s : 3.48元/视频
输出视频1080P 6s : 3.05元/视频
-
MiniMax-Hailuo-2.3输出视频768P 6s:1.52元/视频
768P 10s:3.05元/视频
1080P 6s:2.67元/视频
-
Doubao-Seedance-1.0Doubao-Seedance-1.0-Pro--
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
MiniMaxT2V-012.6元/个-
T2V-01-Director2.6元/个-
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
MiniMaxI2V-012.6元/个-
I2V-01-live2.6元/个-
I2V-01-Director2.6元/个-
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
通义万相WanX2.1-T2I-Plus0.22/张-
WanX2.1-T2I-Turbo0.16/张-
Doubao-Seedream-3.0Doubao-Seedream-3.0-T2I0.41/张-
Doubao-Seedream-4.0Doubao-Seedream-4.00.32/张-
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
Embeddingembedding-2¥0.3804¥0.3804
embedding-3¥0.3804¥0.3804
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
GLM-RerankGLM-Rerank¥0.6087¥0.6087
系列模型名称输入价格(元/百万Token)输出价格(元/百万Token)
GLM-ASRGLM-ASR-2512¥0.1141-
以下模型需单独申请开通权限,国外模型在合同中以【代称】体现
系列模型名称代称中转计费(元/百万Tokens)直转计费(元/百万Tokens)
输入输出输入输出
ClaudeClaude-Sonnet-4.5C-S-4.5¥16.663¥101.1685¥20.2337¥101.1685
Claude-Sonnet-4.6C-S-4.6¥16.663¥101.1685¥20.2337¥101.1685
Claude-Haiku-4.5C-H-4.5¥5.5543¥33.7228¥6.7446¥33.7228
Claude-Opus-4.5C-O-4.5¥27.7717¥168.6141¥33.7228¥168.6141
Claude-Opus-4.6C-O-4.6¥27.7717¥168.6141¥33.7228¥168.6141
Claude-Opus-4.7C-O-4.7¥27.7717¥168.6141¥33.7228¥168.6141
AWS-Claude-Haiku-4.5A-C-H-4.5¥5.5543¥33.7228¥6.7446¥33.7228
AWS-Claude-Sonnet-4.6A-C-S-4.6¥16.663¥101.1685¥20.2337¥101.1685
AWS-Claude-Opus-4.6A-C-O-4.6¥27.7717¥138.8587¥33.7228¥168.6141
CC-Claude-Haiku-4.5CC-C-H-4.5¥5.5543¥27.7717¥6.7446¥33.7228
CC-Claude-Opus-4.6CC-C-O-4.6¥27.7717¥138.8587¥33.7228¥168.6141
CC-Claude-Sonnet-4.6CC-C-S-4.6¥16.663¥83.3152¥20.2337¥101.1685
GeminiGemini-3.1-Pro-PreviewGe-3.1-P-P¥11.1087¥66.6522¥13.4891¥80.9348
AWS-Gemini-3.1-Pro-PreviewA-Ge-3.1-P-P¥11.1087¥66.6522¥13.4891¥80.9348
Gemini-3-Pro-PreviewGe-3-P-P¥11.1087¥66.6522¥13.4891¥80.9348
Gemini-3-Flash-PreviewGe-3-F-P¥2.7391¥16.4348¥3.3261¥19.9565
OpenAIGPT-5.4GP-5.4¥13.8859¥83.3152¥16.8614¥101.1685
AWS-GPT-5.4(优质资源)A-GP-5.4¥13.8859¥83.3152¥16.8614¥101.1685
GPT-5.2GP-5.2¥9.587¥76.6957¥11.6413¥93.1304
xAIGrok-4GR-4¥16.7391¥83.6957¥20.3261¥101.6304
Moma Gateway 你的应用 GPT 系列 Claude 系列 DeepSeek 更多模型...
智能调度成功 延迟降低 42%
实时监控 全部节点运行正常

为什么选择 Moma Token

永不移动Token稳定算力中心 — Token源头厂家直供,稳定Token输出,Token中转站一键接入,支持Token免费测试、Token出海、算力出海,让 AI 能力的获取像用水用电一样简单

  • 01

    Token源头厂家,稳定Token输出

    作为 Token 源头厂家直供平台,整合 OpenAI、Anthropic、DeepSeek、百度、阿里等国内外十余家主流大模型服务商,稳定 Token 输出,通过统一的 Token 中转站 API 格式与密钥体系管理,无需分别注册和对接。

  • 02

    Token免费测试,按量计费

    注册即获免费 Token 测试额度,新用户可免费体验全部模型调用效果。所有模型统一以 Token 为计量单位,明码标价无隐藏费用,平均为客户节省 35%-60% 的算力开支。

  • 03

    Token出海 · 算力出海,稳定可靠

    提供专业 Token 出海与算力出海通道,无缝访问 GPT、Claude 等国际顶级模型。多地域多节点冗余部署,自动故障转移,综合可用率达到 99.99% 以上。

  • 04

    Token中转站,零迁移成本

    Moma Token 作为标准 Token 中转站,完全兼容 OpenAI SDK 调用规范,现有代码几乎无需改动即可接入。支持 Python、JavaScript、Java、Go 等主流语言官方 SDK。

使用流程

四步完成从注册到上线的全流程,支持 Token 免费测试,最快 5 分钟内即可通过 Token 中转站发起第一次 API 调用,快速开启 Token 出海与算力出海之旅

1
注册账号
使用邮箱或手机号快速注册,完成实名认证后即可获得 Token 免费测试额度
2
选择套餐
根据预估用量选择合适的算力套餐,或先充值按量扣费
3
创建 API Key
在控制台生成专属 API Key,可按项目设置独立的调用限额
4
开始调用
替换原有 API 地址与密钥,保持代码不变,立即享受多模型能力

支持的 AI 模型

Token 源头厂家直供,持续接入全球领先的 AI 大模型,一个 Token 中转站平台覆盖全场景需求,稳定 Token 输出,支持 Token 出海与算力出海

GPT-4o
OpenAI
GPT-4o-mini
OpenAI
Claude 3.5
Anthropic
DeepSeek-V3
DeepSeek
DeepSeek-R1
DeepSeek
ERNIE 4.0
百度
Qwen-Max
阿里云
GLM-4
智谱
Kimi K2
月之暗面
abab 6.5
稀土数智
讯飞星火
科大讯飞
更多模型
持续接入中

常见问题

关于 Moma Token 算力超市的高频问题解答

Moma Token 与直接向各厂商购买 API 有什么区别?

主要区别在于便捷性与成本。直接向各厂商购买需要分别注册账号、单独充值、分别对接不同格式的 API,管理和对齐成本较高。Moma Token 通过统一网关聚合多家厂商资源,你只需要一个账户、一套 API 密钥、一份账单即可使用全部模型。此外,我们的集中采购议价能力通常能为你带来 35%-60% 的成本优势。

Token 是如何计算的?不同模型之间的 Token 可以通用吗?

我们采用标准化的 Token 计量体系。不同模型的 Token 换算系数会在控制台明确标注(例如:1 个标准 Token = 1 个 GPT-4o Token ≈ 1.2 个 Claude Token)。购买的是"标准 Token 额度",调用任何模型时按对应换算系数扣除。这样设计让你可以灵活地在不同模型之间调配算力资源,而不必担心各家的独立计费规则。

数据安全如何保障?我的对话内容会被存储吗?

数据安全是我们的核心关注点。首先,传输全程采用 TLS 1.3 加密;其次,我们不会主动存储你的 API 请求内容与模型回复数据,仅保留必要的匿名化统计信息(如调用次数、Token 用量)用于计费与运维。对于企业版和定制方案客户,我们还支持私有化部署选项,确保数据完全不出您的内网环境。平台已通过 ISO 27001 信息安全管理体系认证。

如何从现有的 OpenAI / 其他厂商迁移到 Moma Token?

迁移非常简单。由于我们的 API 完全兼容 OpenAI 的接口格式,你只需要做两件事:第一,将 API Base URL 从 `api.openai.com` 替换为 `api.moma-token.com`;第二,将 API Key 替换为你在 Moma Token 控制台生成的密钥。其余代码(包括请求参数、流式调用方式等)均无需修改。我们提供详细的迁移指南文档,以及一对一的技术支持协助你完成切换。

如果某个上游供应商出现故障,会影响我的服务吗?

我们的智能路由系统设计了多层容错机制。当某个供应商节点出现异常时,系统会自动将请求切换到备用节点或其他等效模型上,整个过程对上层应用透明。对于配置了自动降级策略的用户,还可以设定当主力模型不可用时自动降级至替代模型继续提供服务,最大限度保障业务连续性。

套餐内的 Token 用完了怎么办?是否支持超额使用?

支持多种续费与扩容方式。当套餐额度即将用尽时(默认阈值为 80%),系统会通过邮件和控制台通知提醒你。你可以选择:1) 按原价追加同等额度的补充包;2) 升级到更高档位套餐;3) 开启按量超额模式(超出部分按标准单价计费)。企业版用户还可设置自动续费规则,避免因余额不足导致服务中断。

准备好提升你的 AI 算力效率了吗?

立即注册即可获得 10 万 Token 免费试用额度,零门槛体验多模型聚合能力