加拿大 AI 初创公司 Cohere 推出了Command R7B,这是其R系列大型语言模型 (LLM) 中最小的模型,面向注重速度、成本效率和灵活性的企业。
该模型适合部署在低端GPU、CPU甚至 MacBook 上。它支持128k 的上下文长度,并提供具有本机内联引用的检索增强生成(RAG)、多语言功能以及数学、代码和推理任务的性能等功能。Cohere强调了该模型适用于客户服务和HR等企业使用案例。
Command R7B平衡了效率和性能,使企业能够在负担得起的基础设施上部署高质量的AI 解决方案。
该模型在 HuggingFace Open LLM 排行榜上展示了出色的结果,并且在与RAG、工具使用和 AI 代理相关的任务中优于竞争对手。它的性能已根据多个基准测试进行了评估,包括 ChatRAGBench、StrategyQA 和 Berkeley Function-Calling 排行榜。
Command R7B 可通过Cohere Platform 和 HuggingFace 访问,并发布模型的权重供 AI 研究社区使用。Cohere 以每百万个输入代币 0.0375 美元的价格提供该模型。
Command 7B加入了本周发布的其他小型语言模型的行列,包括Microsoft的Phi-4和Google 的PaliGemma 2。
Cohere 最近推出了 Rerank 3.5,以提高企业的搜索相关性和内容排名,提供100多种语言的多语言支持,包括阿拉伯语、中文、英语、法语、德语、印地语、日语、韩语、葡萄牙语、俄语和西班牙语。
该公司最近从加拿大政府获得了2.4 亿美元的投资,用于在加拿大建造一个价值数十亿美元的 AI 数据中心。
Cohere 成立于 2019 年,专门为商业应用程序开发 LLM。与 OpenAI 和 Google 等一些同行不同,Cohere 只专注于企业,而不是追求通用人工智能 (AGI)。今年早些时候,Cohere 在其 D 轮融资中筹集了 5 亿美元,估值达到了 55 亿美元。