本文介绍如何在 Mac(特别是 M 系列芯片)上安装和使用 Ollama,以便在本地流畅运行 Gemma、Llama 3 等大型语言模型。

1. 安装 Ollama

访问 Ollama 官网下载 macOS 版本进行安装:
https://ollama.com/

2. 常用命令速查

2.1 服务管理

1
2
# 启动 Ollama 服务 (一般安装后会自动启动)
ollama serve

2.2 模型运行与管理

1
2
3
4
5
6
7
8
9
10
11
12
# 运行模型 (如果模型不存在会自动下载)
# 例如运行 Google 的 Gemma 2
ollama run gemma2:27b

# 从注册表拉取模型 (仅下载不运行)
ollama pull llama3

# 列出本地所有模型
ollama list

# 删除模型
ollama rm gemma2:27b

2.3 其他操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 查看模型详细信息
ollama show gemma2:27b

# 复制模型 (用于创建副本或重命名)
ollama cp source-model new-model

# 将模型推送到 ollama.com 注册表
ollama push my-model

# 查看帮助
ollama help

# 查看版本
ollama -v

3. 实战示例

运行 Gemma 2 (27B)

1
ollama run gemma2:27b

运行后,你将进入一个交互式的聊天界面,可以直接输入问题与模型进行对话。

14-03-44-PB3DeN_ZgQ43x