NVIDIA Cosmos 3 开源,Nemotron 3 Ultra 发布

AI摘要
NVIDIA 开源了全栈物理世界模型 Cosmos 3,包含四个变体,在多项基准测试中取得开源模型第一,并联合合作伙伴成立生态联盟。同时发布了550B参数的Nemotron 3 Ultra开源模型,被认为是美国最强开源模型。此外,MiniMax发布多模态Agent模型M3,阿里发布Qwen3.7-Plus,Perplexity推出新搜索架构,Anthropic秘密提交IPO申请,OpenAI Codex登陆AWS Bedrock,NVIDIA发布个人AI计算机RTX Spark,JetBrains发布低延迟开发者模型Mellum2。这是一篇关于AI领域最新技术动态和产品发布的知识分享。

NVIDIA Cosmos 3 开源,Nemotron 3 Ultra 发布

1. NVIDIA Cosmos 3 开源:首个全开放物理世界模型

NVIDIA 在 GTC 台北期间迎来了一场「开源周」,核弹级发布 Cosmos 3——一个全栈开源的 omnimodal 世界模型家族,专为物理 AI 设计。不是单一模态,而是将语言、图像、视频、音频和动作统一到一个 Mixture-of-Transformers 架构中,由自回归推理器(reasoner)配对扩散生成器(generator)组成。

本次发布包含四个变体:Nano(16B: 8B+8B)、Super(64B: 32B+32B),以及 Super 的 Text2Image 和 Image2Video 精调版。权重、代码、精选数据集、微调配方全部开放,采用 OpenMDW 1.1 许可证,同步在 HuggingFace 上线。

Artificial Analysis 排行榜上,Cosmos 3 Super 在 Text-to-ImageImage-to-Video 两项均夺得开源模型 #1,超越了 HiDream-O1-Image-Dev、Qwen Image Max、FLUX.2 [dev] 和 LTX-2、Wan 2.2 等对手。生成器接收结构化 JSON prompt,可外接 prompt-upsampling harness 或由模型自身 reasoner 分支驱动。

NVIDIA 同时宣布成立 Cosmos Coalition,联合 Runway 等合作伙伴共建开放世界模型生态。

1/ NVIDIA just open-sourced Cosmos 3 at GTC Taipei! It's the first fully open "omnimodel" for physical AI - one model that understands the real world, predicts what happens next, and generates the actions a robot should take. Weights, code, datasets. All open.
— @kimmonismus

NVIDIA 在 GTC 台北开源了 Cosmos 3!这是首个完全开放的物理 AI "全模态模型"——一个能理解现实世界、预测下一步发生什么、并生成机器人应采取动作的模型。权重、代码、数据集,全部开放。

NVIDIA's Cosmos 3 lands at #1 among open weights models in both Text to Image and Image to Video on the Artificial Analysis Leaderboards! Cosmos 3 unifies language, image, video, audio and action in a single Mixture-of-Transformers architecture pairing an autoregressive reasoner with a diffusion generator.
— @ArtificialAnlys

NVIDIA Cosmos 3 在 Artificial Analysis 排行榜的文本到图像和图像到视频两项均夺得开源模型第一名!Cosmos 3 将语言、图像、视频、音频和动作统一到单一的 Mixture-of-Transformers 架构中,由自回归推理器与扩散生成器配对驱动。

2. NVIDIA Nemotron 3 Ultra:550B 参数美国最强开源模型

在 Cosmos 3 的聚光灯之外,NVIDIA 还投下另一枚重磅炸弹:Nemotron 3 Ultra,一个 550B 总参数、约 55B 激活 的 MoE 开源模型。社区评价这是 美国最强开源模型,Artificial Analysis 评分 48,略低于前沿闭源模型但已与 MiniMax 2.7 持平。

技术细节上,Nemotron 3 Ultra 的稀疏度明显低于 DeepSeek/Kimi 等亚洲竞品——约 10% 激活 vs 约 3%,这可能意味着不同的经济学和行为特性。部分部署环境下达到 300+ tok/s 的推理速度,比大型 DeepSeek/Kimi 类模型快得多。NVIDIA 已在 GitHub 提供官方使用 cookbook。

Nvidia announcing a 550B model wasn't on my bingo card. They are now the strongest american open-source lab.
— @scaling01

NVIDIA 发布 550B 模型不在我的预期之内。他们现在是美国最强的开源实验室了。

3. MiniMax M3:开源多模态 Agent 模型,1M 上下文

MiniMax 发布了 M3,一个开源的多模态 Agent/编程模型,具备 1M token 上下文(最低保证 512K)、原生多模态视觉能力、以及完整的 agent 能力。官方公布的基准成绩包括 SWE-Bench Pro 59.0%Terminal Bench 2.1 66.0%MCP Atlas 74.2%

M3 在前端生成、视觉/游戏任务和性价比方面收获好评,但评测者也指出其 token 消耗偏高、存在冗长的自我检查循环、长任务中偶有需求漂移。多家基础设施厂商(Novita、Vercel AI Gateway、Cloudflare AI Gateway 等)在发布当天即提供支持,生态采用速度异常迅猛。

不过社区仍有疑虑:虽然宣称为「开源」,但权重、参数规模等核心信息尚未公开,部分用户怀疑这可能是远大于传闻 250B 的模型,或是高度针对 benchmark 优化的产物。

Video control + gaming + M3. Open weights + massive context + strong coding. Canceling my weekend plans now.
— @MiniMax_AI

视频控制 + 游戏 + M3。开源权重 + 超大上下文 + 强编程能力。现在取消我的周末计划。

4. Qwen3.7-Plus:阿里多模态 Agent 基础模型

阿里巴巴发布了 Qwen3.7-Plus,定位为多模态交互式混合 agent 模型,统一了 GUI 与 CLI 操作、视觉推理、编程和搜索增强问答。一个模型覆盖「看、想、编程、行动」全链路。目前已通过阿里云 Model Studio 提供 API,并迅速被 Cline 等工具集成。

这一发布强化了一个趋势:亚洲开源实验室不再只发布「聊天模型」,而是交付具备完整 agent 能力的多模态系统。

Introducing Qwen3.7-Plus — a multimodal agent model that unifies vision and language into one versatile agent foundation. One model. Sees, thinks, codes, acts. Now available via API on Alibaba Cloud Model Studio.
— @Alibaba_Qwen

推出 Qwen3.7-Plus——一个多模态 agent 模型,将视觉与语言统一到一个通用的 agent 基础中。一个模型,看、想、编程、行动。现通过阿里云 Model Studio 开放 API。

5. Perplexity「Search as Code」:搜索架构的范式转变

Perplexity 推出了 Search as Code,一种全新的 AI agent 搜索架构。核心理念是让模型直接编写 Python 代码来调用搜索栈,而不是逐个循环调用搜索工具。这使得自定义排序管道、索引 map-reduce、批处理和聚合成为可能,同时大幅降低 token 开销。

Perplexity 内部 WANDR 基准得分从 0.152 跃升至 0.386,效果显著。这一设计折射出更广泛的行业趋势:工程杠杆正从模型本身转移到 agent 运行时(harness)层。

Introducing Search as Code, our new search architecture for AI agents. It writes Python that calls our search stack directly, instead of looping through function calls one at a time.
— @perplexity_ai

推出 Search as Code,我们面向 AI agent 的全新搜索架构。它直接编写 Python 来调用搜索栈,而非逐一循环调用函数。

6. Anthropic 秘密提交 IPO 申请

Anthropic 宣布已向 SEC 秘密提交 S-1 注册草案,为潜在的首次公开募股铺平道路。这标志着 Anthropic 从纯 AI 研究实验室向公众公司的关键一步,也意味着这家 OpenAI 最强竞争对手即将进入资本市场,等待 SEC 审查完成后即可推进 IPO。

Anthropic has confidentially submitted a draft S-1 registration statement to the SEC. Pending completion of SEC review, this gives us the option to pursue an initial public offering.
— @AnthropicAI

Anthropic 已向 SEC 秘密提交 S-1 注册草案。待 SEC 审查完成后,这将使我们具备推进首次公开募股的选择权。

7. Claude Code Opus 4.8 故障:并行子 Agent 耗尽配额

Anthropic 遭遇了一次真实的运维事故:部分 Claude Code 使用 Opus 4.8 的会话会生成 过多并行子 agent/工具调用,导致用户在不知情的情况下迅速耗尽使用配额。受影响用户报告 Max 计划会话限额被两次烧穿,部分人周配额消耗超过 70%。

作为补救,Anthropic 对 Pro 和 Max 用户的 5 小时及周限额进行了重置。这一事件提醒行业:编程 agent 的产品质量正越来越多地取决于编排行为,而非单纯的模型智商。

We've reset 5-hour and weekly rate limits for all users on Pro and Max plans. We fixed an issue that caused some Claude Code sessions to spawn excessive parallel subagents, burning through usage faster than expected.
— @ClaudeDevs

我们已重置所有 Pro 和 Max 计划用户的 5 小时和周限额。我们修复了一个导致部分 Claude Code 会话生成过多并行子 agent、以超出预期的速度消耗用量的 bug。

8. OpenAI Codex 登陆 AWS Bedrock

OpenAI 宣布前沿模型和 Codex 现已通过 Amazon Bedrock 全面开放,目标直指需要将 OpenAI 能力嵌入 AWS 现有安全/合规/治理流程的企业用户。同时,OpenAI 还发布了 Codex Python SDK,支持线程、多轮对话、流式、断点续传、图像和沙箱控制。

这是 OpenAI 从自有平台向多云企业生态扩展的标志性动作,AWS 上也规划了更多 OpenAI 能力,包括未来的网络安全能力 Daybreak。

9. NVIDIA RTX Spark 进军个人 AI 计算

在硬件侧,NVIDIA 发布了 RTX Spark——一款与微软合作的「个人 AI 计算机」,基于 Grace + Blackwell 架构,配备最高 128GB 统一内存,声称达到 1 PFLOP FP4 算力。战略信号十分清晰:NVIDIA 不再仅仅销售加速器,而是要端到端地与 Apple Silicon、x86 PC 和高通同时竞争个人计算市场。

同期,Dell 在 Computex 确认将推出搭载 NVIDIA N1X 平台的 XPS 笔记本,进一步验证了 NVIDIA ARM/客户端 PC 战略的 OEM 落地。

10. JetBrains Mellum2:12B MoE 专为低延迟开发者工作流

JetBrains 发布了 Mellum2,一款 12B MoE 模型(2.5B 激活参数),在约 11T token 上训练,采用 RLVR 后训练,同时发布 base/SFT/RL 检查点和完整技术报告。其定位非常精准:超低延迟推理,面向路由、RAG、子 agent 和 IDE 场景,并已在 vLLM 即时上线。

这不是一个追求 benchmark 的「前沿」发布,而是一个认真打磨的「小型快速开源模型」——专为开发者工作流量身打造。在模型规模军备竞赛之外,这种务实的工程定位值得关注。

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!