本地运行 Llama 3，可以中文，但不强

Llama 3 简介

大家好，我是老章

Meta 发布 Llama 3，大模型开源世界这几天又热闹起来了。

Llama 3 提供两个版本（8B 和 70B）：

**8B 版本适合在消费级 GPU 上高效部署和开发；

70B 版本则专为大规模 AI 应用设计。

每个版本都包括基础和指令调优两种形式。

Meta 官方数据显示，Llama 3 8B 和 70B 版本在语言（MMLU）、知识（GPQA）、编程（HumanEval）、数学（GSM-8K、MATH）等能力上，Llama 3 几乎全面领先于同等规模的其他模型。

8B 模型在 MMLU、GPQA、HumanEval 等多项基准上均胜过 Gemma 7B 和 Mistral 7B Instruct。

用 Ollama 本地运行 Llama3

我看了一些文章介绍本地运行Llama方式很奇怪也很麻烦，难道最极简、省事儿的方式不是Ollama吗？

本公众号读者应该对 Ollama 非常熟悉了，因为介绍过多次。

Ollama 为那些在 macOS、Linux、Windows 上使用 LLM 的开发者提供了一种简便的解决方案，可以更轻松地将这些模型集成到自己的应用程序中。

Ollama 目前支持了市面上几乎所有的开源大模型，安装后均可一个命令本地启动并运行

下载地址：https://ollama.ai/download

下载后安装即可，一路下一步，无须多言。

Ollama 支持 Llama 3 的所有模型。

指令调整模型针对对话/聊天用例进行了微调和优化，并且在常见基准测试中优于许多可用的开源聊天模型。

其中：

Instruct针对聊天/对话用例进行了微调。

例子： ollama run llama3 or ollama run llama3:70b

text 预训练是基础模型。

例子： ollama run llama3:text or ollama run llama3:70b-text

如果个人电脑，显卡一般就老老实实运行8b版吧

安装Ollama后在Terminal中执行ollama run llama3:8b

模型下载完成后就可以直接在 Terminal 中聊天了，我的电脑是丐版 MacBook Air M1，推理时相当卡。

Llama 3 支持中文，但是对中文世界还是不太擅长。

我测了一下，感觉7b的能力还不如 Mistral，同样问题，结果分别如下：

对了 Ollama 还提供 API 接口，开发测试可以使用：

curl -X POST http://localhost:11434/api/generate -d '{ "model": "llama3:8b", "prompt":"Why is the sky blue?" }'

本地运行 Llama 3，可以中文，但不强

RISC-V浪潮下，开源社区正与这个新架构不断融合

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

用检索增强生成让大模型更强大，这里有个手把手的Python实现

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

嫦娥六号发射任务圆满成功

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

没有什么能拦住生成式AI落地了

寻求大模型时代算力最优解，虚拟化之外还另一条路径

外交发言频繁使用“甩锅”，真的合适吗？

「代理人战争」！微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱

花了2500亿！被迫“憋尿”的出国游，逼疯中国游客

牛弹琴:拜登不小心说出美国的小心思日本印度都急眼了

仅6周，“神剑”命中率就从70%降到6%！美国新军援专打俄军电子战

SUSE：“走向市场”，让客户有自己的选择 | ToB产业观察

确定不打了！基本无缘辽粤大战G3！辽宁队“老大”正式放话！

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

心酸！网传太原一父亲为女儿买不起苹果手机下跪，这世界怎么了？

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

本地运行 Llama 3，可以中文，但不强

RISC-V浪潮下，开源社区正与这个新架构不断融合

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

用检索增强生成让大模型更强大，这里有个手把手的Python实现

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

嫦娥六号发射任务圆满成功

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

没有什么能拦住生成式AI落地了

寻求大模型时代算力最优解，虚拟化之外还另一条路径

外交发言频繁使用“甩锅”，真的合适吗？

「代理人战争」！微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱

花了2500亿！被迫“憋尿”的出国游，逼疯中国游客

牛弹琴:拜登不小心说出美国的小心思 日本印度都急眼了

仅6周，“神剑”命中率就从70%降到6%！美国新军援专打俄军电子战

SUSE：“走向市场”，让客户有自己的选择 | ToB产业观察

确定不打了！基本无缘辽粤大战G3！辽宁队“老大”正式放话！

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

心酸！网传太原一父亲为女儿买不起苹果手机下跪，这世界怎么了？

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

牛弹琴:拜登不小心说出美国的小心思日本印度都急眼了