[每周AI简讯]OpenAI推出王炸文生视频模型Sora

OpenAI推出王炸文生视频模型Sora

OpenAI 宣布推出名为 Sora 的新型文本到视频模型。Sora 能根据用户的文本提示,生成长达一分钟的逼真视频。它可以创造出细节丰富的场景、复杂的摄影机运动以及表情丰富的多个角色。Sora 是一种扩散模型,能从类似静态噪声的序列开始,通过多次迭代去除噪声,制作完整视频。Sora目前小范围开放给AI专家,以测试其安全性,未对公众开放。

Google推出Gemini 1.5 模型

Google 推出新的 Gemini 1.5 模型,以对抗 OpenAI 的 GPT 4 Turbo。这款模型采用新的专家混合(MoE)架构,提升了计算效率,能以较低的计算功率运行。Gemini 1.5 Pro 拥有 128,000 个令牌的标准上下文窗口,并为部分用户和企业客户提供高达 100 万令牌的上下文窗口。此外,该模型在处理大型数据集方面表现出色,如一小时视频、11小时音频、超过 30,000 行代码的代码库或超过 700,000 字的文档。Gemini 1.5 Pro 还通过了“海底捞针”测试,显示出在大型数据集中准确检索文本的能力。

Stability AI 发布图像生成模型 Stable Cascade

Stability AI 推出了新型图像生成模型 Stable Cascade,这是开源模型 Stable Diffusion 的继任者。Stable Cascade 拥有多种新特性,如改变已创建图像、提高现有图像分辨率、内部填充和外部延伸。它使用三种基于 Würstchen 架构的大型语言模型,分阶段处理文本提示,并将其转换为紧凑的代码片段,进而生成图像。与 Stable Diffusion 相比,它能在更短的时间内(仅需10秒)生成图像,而且更准确、更吸引人。

OpenAI 推出新型网络搜索产品,挑战 Google

OpenAI 正在开发一款新型网络搜索引擎产品,旨在挑战 Google 在搜索引擎市场的地位。这款产品可能部分依赖于 Microsoft 的 Bing 搜索引擎,考虑到 Microsoft 是 OpenAI 的最大投资者。目前,OpenAI 的 ChatGPT 通过提炼网页内容为约 100 字的摘要来进行网络搜索,但这种方式在捕捉页面完整信息方面存在性能慢和不可靠的问题。OpenAI 正考虑推出专门的搜索服务,以实现更快速、更准确的搜索能力,可能成为 Google 先进的生成型 AI 搜索工具的竞争对手。此外,OpenAI 正在探索将其网络搜索技术与其他创新项目整合的可能性。

GPT-5 将更快更智能,具备多模态功能

OpenAI 的 CEO Sam Altman 在世界政府峰会上透露,即将推出的 GPT-5 模型将比 GPT-4 在所有方面都表现更好。GPT-5 将更智能、更快速,并且可能具备多模态功能。这意味着 AI 将来可以接收更多类型的输入。Altman 强调了这款模型广泛应用性是其最迷人的特点,它在众多任务中都有细微的改进,而非仅在某单一领域突出。尽管 Altman 没有具体说明发布时间表,但他之前已经指出预测 GPT-5 将带来的进步存在挑战。此外,有传言称 GPT-5 可能被命名为 “Gobi”,它是一款正在开发中的多模态 AI 模型,预计将于 2024 年春季亮相。

Nvidia 推出可本地运行的 AI 聊天机器人 Chat with RTX

Nvidia 推出了一款名为 Chat with RTX 的新 AI 聊天机器人,可以在设备上本地运行,无需互联网连接。这款产品面向拥有 GeForce RTX 30 系列和 40 系列显卡的用户。Chat with RTX 允许用户定制生成 AI 模型,类似于 OpenAI 的 ChatGPT,可以与用户的文档、文件和笔记集成以检索信息。此外,它支持 Mistral 的开源 AI 模型和 Meta 的大型语言模型 Llama 2。Chat with RTX 能处理多种文件格式,包括文本、PDF、.doc、.docx 和 .xml,甚至可以导入 YouTube 播放列表的视频转录。但是,它无法像 ChatGPT 那样保留上下文信息,这可能限制了其某些用途的有效性。

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 2

感觉ai发展错了方向,以前我们人类劳动,本想着解放劳动力让机器人做菜、洗菜、拖地、做饭这些无关紧要的活、再或者做一下人类力所不能及的事情,让人类更专注精神建设、学术研究或者别的做一下更有意义的事情。结果发展到现在,让机器人创作艺术,那我们人类在干嘛?噢,我们人类只能做做饭、洗洗碗、拖拖地、因为已经失去了创作能力,机器人把人类养成废物了

2个月前 评论
liang2024 (楼主) 2个月前

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!