当前位置:首页 » 《我的小黑屋》 » 正文

在ubuntu24.04上安装Ollama并设置跨域访问

0 人参与  2024年11月02日 08:40  分类 : 《我的小黑屋》  评论

点击全文阅读


Ollama 是一个基于 Go 语言开发的简单易用的本地大模型运行框架。它同时支持Nvidia和AMD显卡,最主要的是国内下载模型的速度很快。

我们在前几期文章中介绍的lobechat,oneapi等应用,可以方便的利用ollama构建本地大模型运行平台。接下来我们就介绍如何构建ollama的运行平台。

设备构成:

1、Nvidia P40两片,32G内存。

2、ubuntu24.04操作系统。

具体安装过程如下:

一:安装Ollama

1、准备环境

#安装gcc和g++sudo apt updatesudo apt install gcc g++#安装makesudo apt install makesudo apt install make-guile

2、安装Nvidia驱动

#编辑黑名单配置。vim /etc/modprobe.d/blacklist.conf#在文件的最后添加下面两行。blacklist nouveauoptions nouveau modeset=0#然后,输入下面的命令更新并重启。update-initramfs -ureboot#重启后输入下面的命令验证是否禁用成功,成功的话这行命令不会有输出。lsmod | grep nouveau#驱动安装#首先,使用apt卸载已有的驱动,命令如下。apt-get purge nvidia*#进入驱动所在路径,赋予执行权限,并执行安装命令chmod +x NVIDIA-Linux-x86_64-535.86.05.run./NVIDIA-Linux-x86_64-535.86.05.run

3、安装cuda

#下载cudawget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run#安装cuda./cuda_12.4.0_550.54.14_linux.run

设置环境变量

vim ~/.bashrc

在文件最下面加上这些

PATH=$PATH:/usr/local/cuda/bin  LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

使生效

source ~/.bashrc

4、安装cudnn

下载cudnn(需要自己注册用户),下载地址如下:

cuDNN Archive | NVIDIA Developer

安装cudnn

xz -d cudnn-linux-x86_64-8.9.4.25_cuda12-archive.tar.xztar -xvf cudnn-linux-x86_64-8.9.4.25_cuda12-archive.tarcp /root/cudnn-linux-x86_64-8.9.4.25_cuda12-archive/include/cudnn.* /usr/local/cuda/include/cp /root/cudnn-linux-x86_64-8.9.4.25_cuda12-archive/lib/* /usr/local/cuda/lib64/chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

5、安装python环境

apt-get install python3 python3-pip

6、安装ollama

curl -fsSL https://ollama.com/install.sh | sh

二:配置ollama跨域访问

vim /etc/systemd/system/ollama.service

修改成下面这样

[Unit]Description=Ollama ServiceAfter=network-online.target[Service]ExecStart=/usr/bin/ollama serveUser=ollamaGroup=ollamaRestart=alwaysRestartSec=3Environment="OLLAMA_HOST=0.0.0.0"Environment="OLLAMA_ORIGINS=*"[Install]WantedBy=default.target

可以使用ollama --version再次确认安装是否成功。

重新加载systemd守护进程并启用Ollama服务

sudo systemctl daemon-reloadsudo systemctl enable ollamasudo systemctl start ollama

三:Ollama基本操作

1、下载模型

ollama run llama3.1:8b

 仅拉取镜像,但不运行

ollama pull llama3.1:8b

2、删除模型

#显示安装的模型列表ollama list#删除指定的模型ollama rm llama3.1:8b

3、卸载ollama

删除systemd中创建的ollama服务

sudo systemctl stop ollamasudo systemctl disable ollamasudo rm /etc/systemd/system/ollama.servicesudo systemctl daemon-reload

删除ollama的二进制文件

sudo rm /usr/local/bin/ollama

删除用户和组

sudo userdel ollamasudo groupdel ollama

 


点击全文阅读


本文链接:http://zhangshiyu.com/post/181275.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1