下载并安装ollama
1、项目地址
https://github.com/ollama/ollama
2、直接使用脚本安装(推荐)
curl -fsSL https://ollama.ai/install.sh | sh
3、下载后解压并运行
tar zxvf ollama-linux-arm64.tgz
cd bin/
./ollama serve
4、拉取deepseek模型
ollama pull deepseek-r1:1.5b
5、在ollama.com的网站上支持的模型
https://ollama.com/search/
输入【deepseek】
监控推理速度
ollama run <model_name> --verbose
参数:verbose输出
查看某个进程资源的占用情况
apt-get install sysstat
pidstat -p 进程号 时间间隔 次数
1、显示当前时间毫秒数:
date +%s
2、查看rk芯片的npu的占用率
cat /sys/kernel/debug/rknpu/load
实时显示该监控过程
watch -d "cat /sys/kernel/debug/rknpu/load"
6、访问ollama的api
root@linaro-alip:/home/linaro# curl http://localhost:11434/api/generate -d '{
"model": "deepseek-r1:1.5b",
"prompt": "Hello"
}'
修改ollama存放模型的位置
mkdir ollama_models
chown -R ollama:ollama /sata/ollama_models/
# vim /etc/systemd/system/ollama.service