说起来这个问题真实让人无语。按照我之前说过的方法:设置Ollama在局域网中访问的方法(Ubuntu)_ollama 局域网访问-CSDN博客
把Ollama的默认端口修改后,如果再运行:
ollama ps
则会报下面的错:
Error: could not connect to ollama app, is it running?
感觉似乎是没有运行一样,运行ollama list也是一样的结果,但是如果查看服务的状态:
sudo systemctl status ollama
可以看到服务是active的。百思不得其解,以为是ollama的bug,结果在这里看到:
https://github.com/ollama/ollama/issues/2928
原来改过端口之后要加端口号才能正常运行命令:
OLLAMA_HOST=127.0.0.1:10001 ollama listOLLAMA_HOST=127.0.0.1:10001 ollama psOLLAMA_HOST=127.0.0.1:10001 ollama run qwen2:72b
我这里对应的.service文件是这样:
[Unit]Description=Ollama ServiceAfter=network-online.target[Service]ExecStart=/usr/local/bin/ollama serveUser=ollamaGroup=ollamaRestart=alwaysRestartSec=3Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:/snap/bin"Environment="OLLAMA_HOST=0.0.0.0:10001"Environment="OLLAMA_KEEP_ALIVE=1h"Environment="OLLAMA_NUM_PARALLEL=5"[Install]WantedBy=default.target
其实User,Group之类的都不需要修改,主要是要加上端口号才能正常运行。修改完.service文件,需要重新启动一下服务(我之前说的是重启操作系统,效果是一样的):
sudo systemctl daemon-reloadsudo systemctl restart ollama
另外,修改并发数之后,加载到GPU/CPU的模型大小也会发生变化:
~$ OLLAMA_HOST=127.0.0.1:10001 ollama psNAME ID SIZE PROCESSOR UNTIL qwen2:72b14066dfa503f49 GB5%/95% CPU/GPU59 minutes from now
原本42GB的qwen2:72b变成49GB了,interesting,虽然大小只变化了一点,但在CPU上之后速度慢了很多。
就简单总结这么多。