发布公告

在 GTC 2026 上，黄仁勋发布了 NemoClaw——Nvidia NeMo 框架与 OpenClaw 的合作项目，让用户在消费级 Nvidia 硬件上运行优化的 AI 代理。公告在一周内让 OpenClaw 的 GitHub 星标突破 200,000。

NemoClaw 是什么

NemoClaw 是预优化部署包：Nvidia 的 TensorRT-LLM 量化 + OpenClaw 代理框架，打包成单个 Docker 容器。自动检测 GPU（RTX 4060 及以上）并配置最优模型加载、内存分配和批量大小。

NemoClaw 底层原理

魔法在于 Nvidia 专门为 OpenClaw 代理工作流设计的三层优化：

TensorRT-LLM 量化

模型自动量化为 INT4/INT8。Llama-3-8B 从 16GB 缩小到 4.5GB VRAM，保留 MMLU 基准 98.7% 的质量。

KV-Cache 优化

代理工作流涉及长对话。分页注意力和动态 KV-cache 管理减少 60% 内存碎片。

投机解码

小型草稿模型（Llama-3-1B）生成候选 token，主模型并行验证。典型代理输出吞吐量翻倍。

性能基准测试

GPU	模型	基线 (tok/s)	NemoClaw (tok/s)	加速
RTX 4060 (8GB)	Llama-3-8B (INT4)	18	52	2.9x
RTX 4070 (12GB)	Llama-3-8B (INT4)	34	87	2.6x
RTX 4070 (12GB)	Mixtral-8x7B (INT4)	8	22	2.8x
RTX 4080 (16GB)	Llama-3-8B (FP16)	45	94	2.1x
RTX 4090 (24GB)	Mixtral-8x7B (INT8)	19	48	2.5x
RTX 4090 (24GB)	Llama-3-70B (INT4)	4	14	3.5x

所有基准使用 OpenClaw 标准代理提示词（平均 800 输入 token，200 输出 token）。RTX 4070 上 Llama-3-8B 首 token 延迟：120ms（基线 340ms）。由 Nvidia 实验室测试，MLPerf 独立验证。

快速开始——3 条命令

terminal

# 安装 NemoClaw（需要 Docker + Nvidia Container Toolkit）
curl -sSL https://get.nemoclaw.dev | bash

# 启动（自动检测 GPU 优化）
nemoclaw start --model llama3:8b

# 完成。OpenClaw 运行在 http://localhost:18789
# TensorRT 优化在首次运行时自动完成 (~5分钟)

# 检查状态
nemoclaw status
│ GPU: NVIDIA RTX 4070 (12GB VRAM)             │
│ 模型: llama3:8b (INT4, TensorRT 优化)         │
│ VRAM: 4.5GB / 12GB (37%) | 吞吐: 87 tok/s    │

为何重要

个人 AI 成为硬件优先级

正如游戏在 2010 年代推动 GPU 创新，个人 AI 代理可能推动下一个消费硬件周期。

开源再赢一局

Nvidia 选择 OpenClaw 而非 AutoGPT 等封闭替代品，因为 IDENTITY.md 架构能完美映射到优化管道。

4000 万潜在用户

全球约有 4000 万 RTX 40 系列 GPU。每一个都可能成为个人 AI 代理平台。

个人 AI 的 Red Hat 时刻

黄仁勋的 Linux/Red Hat 类比是刻意的。OpenClaw 是社区项目；NemoClaw 是企业优化发行版。

更大的图景：OpenClaw 的定位

这次合作加上 OpenAI 收购（保持开源独立），将 OpenClaw 置于独特的十字路口：最受欢迎的开源代理框架（270K+ 星标）、被全球最大 GPU 厂商官方优化、并由领先 AI 实验室支持——同时保持完全自托管和隐私。

OpenClaw 大事记

2025年9月OpenClaw v1.0 在 GitHub 发布

2025年12月100K GitHub 星标

2026年1月OpenAI 收购 OpenClaw（保持开源）

2026年3月GTC 发布 NemoClaw，270K 星标

TensorRT-LLM

GPU-optimized inference

87 tok/s

RTX 4070 Llama-3-8B

40M Users

Potential market size

常见问题

Q1. 必须用 NemoClaw 才能在 Nvidia GPU 上用 OpenClaw 吗？

不需要。OpenClaw 通过标准 Ollama 可在任何 GPU 上使用。NemoClaw 通过 TensorRT-LLM 提供 2-3 倍速度优化。可以理解为可选的涡轮增压模式。

Q2. NemoClaw 支持 AMD GPU 吗？

目前不支持。NemoClaw 使用 TensorRT-LLM 和 CUDA 内核，仅限 Nvidia。AMD 用户继续使用 Ollama + ROCm。

Q3. NemoClaw 是开源的吗？

部分开源。CLI 和集成层是 Apache 2.0 开源。Nvidia 的 TensorRT-LLM 组件是源代码可用。整个包免费使用。

Q4. 数据还是本地的吗？

是的。100% 本地运行。无遥测、无云调用。唯一网络请求是检查更新（可关闭）。

「OpenClaw 之于个人 AI，就如同 Linux 之于服务器。NemoClaw 是那个 Red Hat 时刻——企业与社区的交汇。」——黄仁勋，GTC 2026