OpenAI停服，国产大模型免费用！开发者Token自由实现了

机器之心发布

机器之心编辑部

今天凌晨，OpenAI 突然宣布终止对中国提供 API 服务，进一步收紧国内开发者访问 GPT 等高水平大模型。国内开发者真是太难了。

好在，随着开源大模型水平越来越高，开发者已经有很多不错的 “平替”，比如 Qwen2、DeepSeek V2 等模型。为了给开发者提供更快、更便宜、更全面、体验更丝滑的开源大模型 API，AI Infra 领域的专业选手硅基流动（SiliconFlow）上场，推出了一站式大模型 API 平台 SiliconCloud。

刚刚，硅基流动为国内开发者献上一份前所未有的大礼：Qwen2 (7B)、GLM4 (9B)、Yi1.5（9B）等顶尖开源大模型永久免费。

从此，开发者 “Token 自由” 不再是梦，可以甩开膀子开发超级应用了。

“Token 自由” 传送门，一键直达：

cloud.siliconflow.cn/s/free

正如在工业化时代，机械化工厂推动了大规模生产商品的效率。在大模型时代，生成式 AI 应用的繁荣亟需高性价比的 Token 生产工厂。

通过云服务接入大模型 API 已成为开发者的最优选择。不过，很多平台只提供自家大模型 API，不包含其他顶尖大模型，同时，在模型响应速度、用户体验以及成本方面，远不能满足开发者的需求。

现在，硅基流动的超级 Token 工厂 SiliconCloud，让开发者不用再花费精力部署大模型，大规模降低 AI-Native 应用开发门槛与成本。

大模型 Token 工厂

即时上新、极速输出、价格亲民

既然叫 Token 工厂，那用户喜欢的模型就都能直接在 SiliconCloud 上找到。

最近，大模型社区相当热闹，开源模型不断刷新着 SOTA，轮流霸榜。

硅基流动第一时间将这些大模型快速上架到 SiliconCloud，包括最强开源代码生成模型 DeepSeek-Coder-V2，超越 Llama3 的大语言模型 Qwen2、GLM-4-9B-Chat、DeepSeek V2 系列模型。还支持 Stable Diffusion 3 Medium、InstantID 等文生图模型。

值得一提的是，对 DeepSeek V2 等部署难度极高的模型，SiliconCloud 是除官方之外唯一支持这些开源大模型的云服务平台。

考虑到在不同应用场景下需要选择适合的大模型，开发者可在 SiliconCloud 自由切换。

这样的开源大模型聚合平台，已经为开发者提供了不少便利，但还远远不够，作为世界顶级的 AI Infra 团队，硅基流动致力于将大模型部署成本降低 10000 倍。

要实现这一目标，核心挑战是如何大幅提升大模型推理速度。对此，SiliconCloud 做到了什么程度？

直观上图，感受一下 Qwen2-72B-Instruct 在 SiliconCloud 上的响应速度。

刚开源不久的 SD3 Medium 的生图时间在 1s 左右。

这些开源大模型的响应速度变快，相同的算力的产出更高，价格自然就打下来了。

SiliconCloud 上的大模型 API 价格也（很卷）更为亲民。即使是 Qwen2-72B，官网显示只要 4.13 元 / 1M Token。新用户还可免费畅享 2000 万 Token。

开发者评价：“速度快得再也回不去了”

SiliconCloud 一经发布，不少开发者就在各大社交平台分享了使用体验。部分 “自来水” 用户是这样评价的：

知乎上，机器学习系统专家 @方佳瑞称赞了 SiliconCloud 的输出速度，“用久了就受不了其他大模型厂商 web 端的响应速度”。

微博用户 @祝威廉二世称，其他几家平台都不敢放 Qwen2 大规模参数的模型，SiliconCloud 都放了，速度很快，还很便宜，一定会付费。

他还提到，大模型的最终产物是 Token，未来会由硅基流动这样的 Token 工厂，或 OpenAI、阿里云这样的大模型企业或云厂商完成 Token 的生产。

还有 X 用户强烈推荐 SiliconCloud，体验太过丝滑，尤其还有体贴周到的一流售后服务团队。

微信公众号博主评价：SiliconCloud 是国内同类产品中体验最好的一家。

这些评价有一个明显的共性，他们不约而同地提到了 SiliconCloud 平台的速度。为什么它的响应这么快？

答案很简单：硅基流动团队做了大量性能优化工作。

早在 2016 年，硅基流动的前身 OneFlow 团队就投身大模型基础设施，是世界上做通用深度学习框架的唯一创业团队。再次创业，他们基于丰富的 AI 基础设施及加速优化经验，率先研发了高性能大模型推理引擎，在某些场景中，让大模型吞吐实现最高 10 倍加速，该引擎也集成到了 SiliconCloud 平台。

换句话说，让开发者用上输出速度更快、价格实在的大模型服务，是硅基流动团队的拿手绝活。

Token 自由后，现象级应用还远吗？

此前，阻碍国内开发者开发 AI 应用的一大因素是不方便访问高水平大模型，即便做出了优质应用也不敢大规模推广，因为烧钱太快，他们无力承受。

随着国产开源大模型不断迭代，以 Qwen2、DeepSeek V2 为代表的模型已足够支持超级应用，更重要的是，Token 工厂 SiliconCloud 的出现能解决超级个体的后顾之忧，他们不用再担心应用研发与大规模推广带来的算力成本，只需专注实现产品想法，做出用户需要的生成式 AI 应用。

可以说，现在是超级个体开发者与产品经理的最佳 “掘金” 时刻，而 SiliconCloud 这个好用的掘金工具已经为你准备好了。

再提醒一下：Qwen2 (7B)、GLM4 (9B) 等顶尖开源大模型永久免费。

欢迎走进 Token 工厂 SiliconCloud：

cloud.siliconflow.cn/s/free

OpenAI停服，国产大模型免费用！开发者Token自由实现了

“泼天富贵”砸向国产大模型

拼命抢客！OpenAI背刺中国开发者，国产大模型谁能“平替”？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

纯太阳能电车何时能实现，马斯克怎么看？

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

力挺马斯克的前OpenAI科学家放话：AGI将导致失业潮，预言大规模AI安全危机

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

不分割成token，直接从字节中高效学习，Mamba原来还能这样用

大疆前高管带6人创业，做出了类目Top1的割草机器人

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看

国产机器人也会空翻了！打破限制，世界首款！

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

技术吹得再强，离用户不近有何用？

LLM惊现篡改代码获得奖励，欺骗人类无法根除逆转！Anthropic新作揭露惊人真相

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

被AI量产的短视频营销号气疯了，于是，我也做了一个

这个机器人的手真的太灵活了！收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。这是星动纪

AI时代，谁还没用AI智能硬件提升工作效率？

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

OpenAI停服，国产大模型免费用！开发者Token自由实现了

“泼天富贵”砸向国产大模型

拼命抢客！OpenAI背刺中国开发者，国产大模型谁能“平替”？

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

纯太阳能电车何时能实现，马斯克怎么看？

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

力挺马斯克的前OpenAI科学家放话：AGI将导致失业潮，预言大规模AI安全危机

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

不分割成token，直接从字节中高效学习，Mamba原来还能这样用

大疆前高管带6人创业，做出了类目Top1的割草机器人

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。 通过视频直接提问，看看

国产机器人也会空翻了！打破限制，世界首款！

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

技术吹得再强，离用户不近有何用？

LLM惊现篡改代码获得奖励，欺骗人类无法根除逆转！Anthropic新作揭露惊人真相

3分钟带你看遍IPF大会十年黑科技，迈向AI+新时代

被AI量产的短视频营销号气疯了，于是，我也做了一个

这个机器人的手真的太灵活了！ 收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。 这是星动纪

AI时代，谁还没用AI智能硬件提升工作效率？

论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

Google 搜索诞生 25 年来最大更新之一，用 AI 把搜索重做一遍。通过视频直接提问，看看

这个机器人的手真的太灵活了！收纳、撸猫、修剪绿植样样都行，原速演示流畅程度堪比人类。这是星动纪