使用 Docker Model Runner 在本地构建 GenAI 应用程序
moboyou 2025-07-16 19:53 3 浏览
想要在本地运行大型语言模型 (LLM)?以下是在您自己的桌面上设置 Docker Model Runner 并访问 LLM 的方法。
Docker Model Runner 是 Docker Desktop 的一项新功能,旨在简化在 Docker 生态系统中本地运行和测试 AI 模型的过程。它解决了开发人员在将生成式 AI 和大型语言模型集成到其工作流程中时面临的长期挑战,例如碎片化的工具、复杂的环境设置和不一致的模型管理。
通过将主机原生推理引擎直接嵌入到 Docker Desktop 中,Model Runner 无需容器化每个 AI 工作负载,这不仅提高了性能,还简化了用户体验。推理引擎目前构建在 llama.cpp 之上,在主机上作为本机进程运行。这种方法可确保模型权重得到有效加载,并且系统可以充分利用本地硬件,包括 Apple Silicon 系统上的直接 GPU 加速。这种原生执行绕过了与在容器或虚拟机内运行模型相关的传统开销,从而实现了更快的推理和更顺畅的开发周期。
Docker Model Runner 的先决条件
要运行 Docker Model Runner,您需要满足与 Docker 环境和硬件相关的几个先决条件。首先,您必须安装 Docker Desktop 版本 4.41 或更高版本。Docker Model Runner 作为一项功能集成到 Docker Desktop 中,因此早期版本不支持它。如果您计划将 Model Runner 与多容器应用程序或 Compose 文件一起使用,您还需要 Docker Compose 版本 2.35 或更高版本。
硬件兼容性至关重要。在 Mac 上,Docker Model Runner 需要 Apple 芯片(M1、M2 或更高版本)。在 Windows 上,您需要一个具有 NVIDIA GPU 的系统才能利用本地推理加速。该功能目前不适用于 Linux 或基于 Intel 的 Mac。
启用 Model Runner
如果您运行的是最新版本的 Docker Desktop,则可以访问 Dashboard 设置以启用 Model Runner。
在命令行中,运行以下命令以启用相同的功能:
docker desktop enable model-runner --tcp 12434
现在,您有一个在 macOS 上运行的 llama.cpp 推理引擎。您可以使用以下命令验证相同的内容:
docker model status
启用后,您可以按照熟悉的命令来拉取和运行模型。与 docker images list 命令类似,您可以运行 docker model list 列出所有下载的模型。
拉取和运行 Gemma LLM
与容器注册表类似,Docker 有一个用于生成式 AI 模型的注册表,可以在 hub.docker.com/u/ai 访问。模型以与容器映像相同的 OCI 格式存储。
让我们在本地拉取并运行 Gemma3 模型。
docker model pull ai/gemma3
下载模型后,您可以通过以下命令确认其可用性:
docker model list
现在,我们可以使用 cURL 命令通过兼容 OpenAI 的 API 终端节点访问模型。
curl http://localhost:12434/engines/llama.cpp/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "ai/gemma3",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "Who was the captain of the Indian cricket team during the 1983 World Cup?"
}
]
}'
从 Hugging Face 拉取和运行嵌入模型
Docker Model Runner 支持直接从 Hugging Face 模型存储库中提取模型,前提是模型与 llama.cpp 兼容。在此示例中,我将从 Hugging Face 中提取 mxbai-embed-large-v1 嵌入模型。
docker model pull hf.co/mixedbread-ai/mxbai-embed-large-v1
由于它具有针对 CPU 优化的模型的 GGUF 风格,并且与 llama.cpp 引擎完全兼容,因此 Docker 成功下载了该模型。
您可以使用如下所示的命令对其进行测试。
curl http://localhost:12434/engines/llama.cpp/v1/embeddings \
-H "Content-Type: application/json" \
-d '{
"model": "hf.co/mixedbread-ai/mxbai-embed-large-v1",
"input": "Embeddings made easy"
}'
您还可以在 Docker Desktop 控制面板中查看下载的模型。
通过在本地运行文本嵌入模型和 LLM,我们可以在开发计算机上开发 RAG 和代理应用程序,而无需使用远程推理引擎或终端节点。
Docker Model Runner 通过快速、简单和 Docker 生态系统集成,标志着本地 AI 开发的重大进步。它使开发人员能够直接在他们的机器上拉取、运行和管理 AI 模型,而无需复杂的传统基础设施设置或容器化推理的开销。通过利用主机原生推理引擎并支持直接 GPU 加速(尤其是在 Apple 芯片上),Model Runner 可提供高性能和高效的资源使用。模型作为 OCI 构件分发,支持标准化打包、版本控制以及与现有 Docker 工作流的无缝集成。使用与 OpenAI 兼容的 API 可确保轻松采用并与现有应用程序兼容。
相关推荐
- C#与Docker完美结合:容器化部署实战,让你的应用秒级上线!
-
在当今快速迭代的软件开发环境中,高效的部署流程对于产品的成功至关重要。容器化技术,尤其是Docker,已成为实现快速、可靠部署的首选方案。对于C#开发者而言,将C#应用与Docker相结合,能够显著提...
- 我找到了最适合NAS的记账应用,开源自托管,适合国人的记账方式
-
「亲爱的粉丝朋友们好啊!今天熊猫又来介绍好玩有趣的Docker项目了,喜欢的记得点个关注哦!」引言其实记账软件熊猫之前也发过几个,不过使用起来都不是很理想,要么界面设计不太好看,要么就是项目过于复杂了...
- 手搓各种软件!手把手教学!(如何搓手)
-
shocked!太炸裂了!大家看下这个星标就知道了,youdefinitelyneedtoputittoyourfavorites!这是GitHub上排名第二的开源项目,它能手把手教你...
- 看了《碟中谍8》之后,才发现特工们的黑科技我们NAS用户也能拥有
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:Stark-C#头条兴趣联欢会#哈喽小伙伴们好,我是Stark-C~最近《碟中谍8:最终清算》正在热播,作为碟中谍的老粉,我前几天带着家人...
- NAS原来这么有用:利用docker 一键部署mstream私人云音乐
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:熊猫不是猫QAQ前言你是否面临以下困扰:曾经想听以前某首音乐,但在网上已经找不到了;即使找到了,因版权原因无法在线听,甚至无法下载;有些曲子...
- 一见钟情!这就是你在寻找的Docker界面!优雅而不简单—Arcane
-
「亲爱的粉丝朋友们好啊!今天熊猫又来介绍好玩有趣的Docker项目了,喜欢的记得点个关注哦!」引言要说DockerUI项目,知名的其实就那么几个,目前感觉备用的比较多的还是老牌的portainer,...
- 大神级产品:手机装 Linux 运行 Docker 如此简单
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:灵昱Termux作为一个强大的Android终端模拟器,能够运行多种Linux环境。然而,直接在Termux上运行Docker并不可行,需要...
- 在 Docker 中运行 Mac OS 是什么样的体验
-
大家好,我是你们的章鱼猫。Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器或Windows机器上,也可以实现...
- Docker 容器的 5 个实践案例(每天5分钟玩转docker容器技术)
-
Docker是一个开源平台,可以轻松地为任何应用创建一个轻量级的、可移植的、自给自足的容器。大多数Docker容器的核心是在虚拟化环境中运行的轻量级Linux服务器。DockerLinu...
- 使用 Docker Model Runner 在本地构建 GenAI 应用程序
-
想要在本地运行大型语言模型(LLM)?以下是在您自己的桌面上设置DockerModelRunner并访问LLM的方法。DockerModelRunner是DockerDeskt...
- docker部署一个证件照工具HivisionIDPhotos,非常好用!
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:略懂的大龙猫今天给大家推荐一个很好玩的开源应用HivisionIDPhotos。这个工具原理是利用AI模型对照片进行一系列处理:智能抠...
- 好好看,好好学!Docker玩法深度教学,小白也能轻松上手
-
Docker对于大多数NAS玩家来说想必都非常熟悉,即便没用过,也应该接触过相关的一些内容。就我个人来说,对于评价一台NAS是否好用,Docker功能占据了不小的比重。8月份终于是又更新了一个大版本,...
- 开源&Docker:自动录制小姐姐,docker部署各平台的自动录制工具
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:可爱的小cherry前言大家好,这里是可爱的Cherry。今天给大家分享一下小姐姐们录屏工具,配置完成以后可以自动监听直播并实现自动录播。支...
- 目前发现的一些有趣的docker容器—第十一弹
-
前言本期又是整理汇总的文章,依然是针对NAS下可搭建的一些docker容器的汇总,涉及可能会有介绍过的容器和没介绍过但不太好用的容器,感兴趣的可以翻翻之前的文章哦!!!也欢迎留言你发现的一些有趣的或者...
- 数人科技王璞:Docker与Mesos的结合应用
-
2015年4月16-18日,由CSDN主办、CSDN专家顾问团支持的OpenCloud2015大会将在北京国家会议中心拉开帷幕。为期三天的大会,以推进行业应用中的云计算核心技术发展为主旨,聚焦技术...
- 一周热门
- 最近发表
-
- C#与Docker完美结合:容器化部署实战,让你的应用秒级上线!
- 我找到了最适合NAS的记账应用,开源自托管,适合国人的记账方式
- 手搓各种软件!手把手教学!(如何搓手)
- 看了《碟中谍8》之后,才发现特工们的黑科技我们NAS用户也能拥有
- NAS原来这么有用:利用docker 一键部署mstream私人云音乐
- 一见钟情!这就是你在寻找的Docker界面!优雅而不简单—Arcane
- 大神级产品:手机装 Linux 运行 Docker 如此简单
- 在 Docker 中运行 Mac OS 是什么样的体验
- Docker 容器的 5 个实践案例(每天5分钟玩转docker容器技术)
- 使用 Docker Model Runner 在本地构建 GenAI 应用程序
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- oracle安装补丁 (19)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- html5和css3新特性 (19)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- 网站管理平台php源码 (19)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)