本周的大型人工智能活动:黄仁勋直接向马斯克透露 OpenAI 已“批准”成人内容

1.重型工具:克劳德获得“技能”的祝福,装载“瑞士军刀”。新闻:Anthropic 为其 Claude AI 模型推出了一项名为“技能”的新功能。这是一种可按需加载的自定义指令和工作流程的打包机制。克劳德可以在相关场景中动态调用“技能”来处理专门的任务,而无需广泛的上下文。新的技能功能支持编码和存储代码规范、特定于团队的工作流程(例如报告和分析格式),并通过配置界面和 SDK 进行集中管理。 “技能”是可配置和可移植的。开发人员可以将多种“技能”集成到自定义工作流程中,并通过 Claude 应用程序、Claude Code 及其 API 无缝调用它们。 Anthropic同时发布了实施指南和UA资源库。它包括创建自定义“技能”的说明,并提供预构建的“技能”,可以轻松处理 Excel 和 PPT 等任务相关资源库。这一新功能补充了MCP(模块化组件协议),有效扩展了AI模型的代理能力。由于“技能”资源库是开源的,因此有望作为MCP被广泛采用。技能功能现已作为功能预览提供给拥有 Pro、Max、Team 和 Enterprise 订阅计划的用户。点评:就像给了克劳德一把瑞士军刀,可以让他随时改变能力。 2. AI技术和产品发布:从Sora知道如何拍电影到Haiku知道如何打工,软件和硬件正在以多种方式爆发。 1. 消息:Anthropic 正式发布 Claude Haiku 4.5。它是一种快速、低成本的模型,支持大规模智能代理系统和复杂的思维链。编码和代理任务库在资格测试中,Haiku 4.5 表现出色,在 SWE 工作台上通过率为 73.3%,在终端工作台上通过率为 41%h.整体性能接近Claude Sonnet 4。其优越的性能、高速度和合理的成本使其成为智能AI应用的理想选择。 Anthropic 强调:“Sonnet 4.5 擅长将复杂问题分解为多步骤计划,并且可以协调 Haiku 4.5 的多个实例并行执行子任务。”批判性评论:俳句4.5似乎是一个“廉价、高质量”的内在,特别是对于Sonnet 4.5的“项目经理”来说。 2.新闻:Google发布Veo 3.1和Veo 3.1 Fast,添加了原生音频改进、coPrecise叙事控制、参考图像引导以及对长视频场景的改进。 Veo 3.1 中引入的第一帧和最后一帧过渡以及“材质混合”功能支持从多个参考图像合成动态视频。行业评论认为,Veo 3.1 在音频质量、图像和视频兼容性以及图像一致性方面提供了改进。该模型的付费预览,哪个用户目前可以通过Gemini API进行体验,支持AI Studio、Vertex AI、Gemini apps和Flow平台。
点评:谷歌立志成为人工智能行业的“万能主宰”。 3.消息:OpenAI发布Sora 2更新,默认视频长度增加至15秒,可生成的最长视频为25秒。 Pro订阅用户拥有全新的“S”featuretoryboard”,可以让他们在几秒内规划自己的视频,对制作过程有更精确的控制。然而,《空空2》最近因涉及名人的视频生成而引发了版权和道德争议。OpenAI强调,公众人物及其家人应该有权在AI生成的内容中控制自己的形象。锐评:AI剧越来越好,但名人不应该 轻松用作字符。 4.新闻:百度MuseStreamer现在可以生成长度超过20秒的视频。该型号苏支持实时生成交互式长视频,允许用户动态重写帧和缩放过渡。芮平:如果时间延长了,可以随时换场景。国家视频AI也亮相。 5.新闻:World Labs推出RTFM,一种实时生成世界模型,可以交互式地创建一致的3D场景。官方技术博客解释说,该模型侧重于三个目标:效率、可扩展性和时间一致性,并展示了如何在单张 H100 显卡上实现密集世界模型。公开演示允许用户实时探索生成的世界。尽管RTFM现阶段仍处于概念验证阶段,但它已经越来越接近商业化。芮点评:RTFM想要使用H100是因为它的“普遍适用性”。 6、新闻:OpenAI旨在优化ChatGPT的内存管理机制,通过自动内存管理解决“存储满”问题,提高系统可靠性,减少内存占用用户存储限制。锐评:系统不再因为内存满而经常卡顿,用户体验轻松很多。 7、新闻:以“让每一台Win11电脑都变成AI PC”为目标,微软在操作系统层面推出了Copilot语音智能。这种安全沙箱技术内置于系统的最底层,支持在后台执行语音控制任务,并在并行多任务场景中提供智能。专为复杂的工作流程而设计。该公司表示:“Copilot视觉和音频能力的创新价值在于交互的便捷性。用户可以通过唤醒词‘Hey Copilot’使用自然语言发出指令,视觉模块在获得授权后可以实时分析屏幕内容,提供应用指导、项目建议或操作指导。”锐评:微软坚决推荐Copilot语音助手。 8. 新闻:Cognition 宣布推出 SWE-grep 和 SWE-grep-mini,这是两个经过强化学习训练的多轮上下文搜索代理,专门从事 AI 代码搜索。这些模型可以快速表示相关代码段,为 Windsurf Fast Context 子代理提供核心功能,并通过高度并行架构显着减少查找延迟。芮平:这次,AI配备了“代码搜索引擎”,这是程序员的“工具箱”。 9. 新闻:Facebook推出了AI照片自动选择功能,允许用户从相册中选择最好的照片和视频来生成更新和帖子,有效简化内容创建过程。批判性评论:专为解决“选择困难症”而设计,以后再也不用担心圈子发帖了。 10. 公告:为了回应公众对人工智能内容激增的反馈,Pinterest 增加了内容控制。我们增强了内容标记具有工具的功能,可让您将人工智能生成的内容限制在特定部分(例如美容和艺术)的显示。这种用户驱动的AI联系人管理机制值得其他社交媒体平台学习。 11.新闻:谷歌在Gemini API中引入了“Grounding with Google Maps”。地图功能允许模型根据新的地理数据生成更准确的本地化响应。该功能可以与搜索引擎结合使用,进一步保证了信息的可靠性。发布了相关的demo案例,在AI Studio中进行测试。批判性评论:Gemini 连接 Google 地图,准确回答问题:“最好的餐厅在哪里12。新闻:Google 更新了 AI Studio,以优化开发者和用户的体验。新版本推出 Playground,这是一个集成工作台,汇集了 Gemini、生成媒体模型、语音合成和实时模型。简化模型切换过程d 优化聊天界面的一致性。 Rui评论:开发者不必再担心从一侧切换到另一侧。 13. 新闻:对于通过 API 构建云代理的开发人员,AWS 已将最新的 Opus 云模型集成到 Amazon Bedrock 4.1、Sonnet 4.5 和 Haiku 4.5 中。 Haiku 4.5 API 的定价为每百万输入/输出代币 1/5 美元。锐评:巨头云AI资源库主打“我全都要”。 14. 新闻:NVIDIA 开始发货 DGX Spark。这款桌面级AI超级工作站专为推理本地和原型设计而设计,发布后很快就被抢购一空。独立的 LMSYS 审查列出了其规格和性能亮点。 GPU(GB10)最高性能达到1 PFLOP(FP4张量),整体算力介于RTX 5070和RTX 5070之间。5070Ti;其革命性的进步是采用128GB统一内存架构,实现CPU和GPU内存池的无缝共享s。这种统一的架构允许 DGX Spark 直接加载和运行大型模型。 DGX Spark 完全避免了系统内存和显存之间数据传输的开销,并且可以在 DGX Spark 上运行的 AI 模型规模远远超过传统桌面计算机。 Nvidia首席执行官范仁勋在Starship第11次试飞前后亲自将DGX Spark交付给马斯克。点评:可以说它是AI电脑界的赫尔墨斯。 15.消息:OpenAI首席执行官Sam Altman表示,从今年12月开始,ChatGPT的内容限制将放宽,成人内容将提供给经过认证的成人用户。此举旨在创建一个类似于GPT-4o风格的可定制和个性化系统,在保证安全性的同时,为不同年龄段的用户提供差异化​​的服务。点评:兜兜转转,我们还是没有克服人的本能。 3. AI研究洞察:从“破译癌症”到“控制细胞核”r fusion,谷歌的“炼金术”更进一步 1、新闻:谷歌推出开源癌症突变分类模型 DeepSomatic。准确区分基因突变和体细胞突变,通过测试复杂样本,超越现有解决方案。批判:AI 再次扮演医学领域显微镜和第二只眼的角色。 2、新闻:谷歌与耶鲁大学合作推出癌症研究模型 Cell2Sentence-Scale 27B 基于 Gemma 架构。该模型使用超过 10 亿个转录组和生物数据进行训练,可以将 RNA 序列信息表示为文本“细胞短语”。研究人员使用 C2S 量表进行单细胞分析,并成功确定了潜在的癌症治疗途径,并在湿实验中得到了验证。该研究文章的预印本和模板同时出版。瑞平:科学家的解码器又更新了。 3.新闻:Google DeepMind ha与 Commonwealth Fusion Systems 合作,实现深度学习等离子体控制,以加速聚变能源的研究和开发。该人工智能系统结合了深度强化学习和 TORAX 模拟器,以优化等离子体控制和托卡马克装置性能,使清洁、无限的聚变能源更接近现实。锐评:AI不仅要仰望天空,还要创造星星。 4. AI政策与业务:各大厂商芯片表现良好,高盛敦促“继续投资” 1. 新闻:OpenAI宣布与博通合作开发定制AI芯片。 OpenAI将负责加速器设计和系统架构,博通计划于2026年下半年开始量产部署。该项目的目标是实现10GW算力规模,为下一代边缘模型和大规模推理提供关键支撑。此次合作标志着OpenAI战略的转型ic 向开放基础设施迈进,通过博通以太网技术使其计算架构多样化,同时也凸显了人工智能专用芯片在推理阶段的重要性。芮成钢评论:计算世界出现了新的参与者和新的规则。 2. 消息:NVIDIA透露Meta和Oracle将采用Spectrum-X以太网架构来标准化AI数据中心网络。训练效率和可扩展性是选择这种开放加速解决方案的主要原因。犀利点评:老黄不仅卖“算力”,还搞“网线”生意。 3. 新闻:苹果推出M5芯片,声称峰值AI性能是M4的4倍,专为下一代设备端AI工作负载而设计。 M5 将首次出现在新款 MacBook Pro、iPad 和 Vision Pro 中,预计将在未来几周内上市。点评:如果 Siri 还是弱智的话,这种 4 倍的性能也只有大约 4 倍的人才能享受到t P 图像。 4. 新闻:英特尔宣布推出具有 160GB 内存的节能数据中心 GPU,增加其人工智能加速器产品组合,以推进英特尔专注于开放系统和软件架构的新人工智能战略。这款GPU的代号是“新月岛”。英特尔表示,它是为运行推理工作负载的风冷企业级服务器而设计的,重点是“成本和功耗优化”。 Crescent Island采用Xe3P微架构,包含160GB LPDDR5X内存,支持多种数据类型,为大型语言模型提供充足的执行空间。尖锐评论:英特尔想用“盈利逻辑”来“把诱饵从你嘴里拿走”5。消息:Spotify 已与各大唱片公司达成协议,共同开发“负责任”的 AI 产品系统,以确保持续遵守版权,保护艺术家的收入,并保留音乐家选择是否允许 AI 工具使用其作品的权利。同时,公司CR吃了一家AI研究所,专注于开发关注艺术家权益的技术解决方案。点评:Spotify率先行动,带领唱片公司膜拜这座山。 6.消息:谷歌母公司Alphabet计划两年内在印度南部投资超过100亿美元,在安得拉邦港口城市维沙卡帕特南建设一座1GW数据中心。这表明谷歌正在押注印度市场,或者将其作为其全球扩张战略的一部分。芮平:“三哥”电网还能活下去吗? 7、消息:中国工程院《工程》杂志评选的“2025年世界十大工程成就”在“2025世界工程联合会大会暨世界工程技术大会”上正式揭晓。其中包括NVIDIA Blackwell GPU架构和开源的DeepSeek大规模语言模型。瑞平:技术来自洛杉矶是很自然的事大型制造商均在名单上。 8、消息:苹果正在进行重要战略调整。我们将停止开发低成本、轻量级的Vision耳机(内部代号Vision Air),并将资源集中在智能眼镜的研发上。多年来关注Ap moveple的高级分析师马克·古尔曼(Mark Gurman)表示,在亲身体验了竞争对手Meta推出的新型屏幕内置智能眼镜后,他认为苹果此举是明智之举。评论:库克先生明白,没有人戴着“滑雪镜”出门。 9.新闻:近期人工智能领域的巨额资本投资正在引发市场对其可持续性的担忧。高盛的最新研究报告清楚地表明,目前人工智能的投资规模远未过热,而且这种投资水平是可持续的。这意味着人工智能基础设施建设的宏观形势保持稳定。根据这项研究,与人工智能相关的投资现在代表了与历史上任何其他技术周期相比,其在美国 GDP 中所占的比例要小得多。瑞平:泡沫在哪里?高盛表示不存在这样的事情。 10、消息:中国互联网络信息中心(CNNIC)正式发布《城市人工智能应用发展报告(2025)》。 《报告》显示,截至2025年6月,我国生成式人工智能用户规模已达5.15亿,较2024年12月增加2.66亿,用户数量六个月内翻倍,渗透率为36.5%。重点应用场景包括答疑解惑、日常办公、休闲娱乐、内容等。其中,80.9%的用户使用生成式人工智能产品来回答问题。路易斯先生的解释:日本的人工智能正在从“可用”走向“好用”,从“试用版”走向“大众版”。 11. 新闻:加州颁布人工智能在线安全规则,要求查tbots 在与未成年人互动时清楚地揭示人工智能的身份。加州州长纽瑟姆签署了SB243,要求人工智能在用户处于危险情况的情况下主动识别自己的身份。当他们与人类交谈时,他们听不懂。此外,主要规定企业层面合规义务的《加州人工智能透明度法案》也将得到实施。批判性评论:加州还要求“AI聊天”需要“运营证书”。 5.人工智能观点和文章:微软定义了“人机协作”,但你的同事可能不是人类。新闻:微软人工智能业务首席营销官贾里德·斯帕塔罗(Jared Spataro)在《人工智能正在重塑商业》一文中解释说,各大公司正在转向一种新的“以人为主导、人工智能驱动”的组织结构。他总结了三个关键趋势: 获得经验的成本大幅下降:“企业可以根据产品、市场或专有知识快速部署代理并将它们直接集成到组织的数据、系统和安全防护系统中。” 人机协作:“数字化劳动力正在扩展。当与 Link 集成时,组织从“为人员设计信息流程”转向“优化代理执行效率”。 “知识的复利效应:“智能体以人类系统无法比拟的速度创造新的知识循环。”斯帕塔罗的上一篇文章《打造尖端公司的首席执行官指南》更详细地解释了优先考虑人工智能的含义。总而言之,这些讨论的前瞻性思维值得认可,因为它们描绘了企业层面人工智能的基本的、应用驱动的组织变革的图景。 瑞品:说实话,你的同事可能不是人,但你的老板还是应该是人。(陈晨)

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注