Industry News 行业资讯

Breaking news and updates from global AI giants. | 追踪全球 AI 巨头的最新动态。

粉丝

迈向自主工程时代：全新机器学习工程评估基准发布，深度衡量人工智能智能体实战力
迈向自主工程时代：全新机器学习工程评估基准发布，深度衡量人工智能智能体实战力

z2．4月5日4月5日

随着人工智能从单纯的语言交互向具备自主行动能力的智能体演进，衡量这些智能体在处理复杂工程任务时的真实表现，已成为当前技术领域的核心课题。近日，一项名为机器学习工程评估基准的新型测试体系正式面世，旨在通过严苛的工程化场景，量化评估人工智能智能体在机器学习工程领域的专业水平。传统的评估手段多聚焦于代码编写能力或逻辑推理精度，然而，真正的机器学习工程涵盖了从数据清洗、特征工程、模型训练到超参数调优及部署上线的一系列复杂闭环流程。该基准测试的推出，填补了现有评估体系在工程化实战维度上的空白。通过引入高度模拟真实生产环境的任务流，该基准能够精准捕捉智能体在面对多步骤、长链路工程问题时的决策质量与执行效率。这不仅为衡量人工智能智能体的工程化潜力提供了科学的度量衡，更为推动人工智能从“对话助手”向“自主工程师”的范式转变提供了关键的技术支撑。 🔗 来源：https://openai.com/index/mle-bench
z2

4月5日4月5日

z2

4月5日4月5日
- 0 篇意见
- 15 次查看
迈向自主智能：ChatGPT Agent 正式登场，开启“思考与执行”的新纪元
迈向自主智能：ChatGPT Agent 正式登场，开启“思考与执行”的新纪元

z2．4月7日4月7日

人工智能的演进正迎来关键性的范式转移。随着 ChatGPT Agent 的正式亮相，大语言模型正在经历从“对话式交互”向“行动式智能”的历史性跨越。这不仅仅是功能的简单叠加，更是人工智能底层逻辑的一次重构。全新的 ChatGPT Agent 不再仅仅局限于文本的生成与理解，它展现出了“思考”与“行动”并行的核心能力。通过深度集成各类外部工具，该智能体能够自主拆解复杂指令，并调动相应资源来完成闭环任务。无论是需要严谨逻辑的数据调研、涉及多环节的行程预订，还是结构化的演示文稿制作，Agent 都能在用户的战略性引导下，高效地执行从规划到落地的全过程。这种“人机协同”的新模式，预示着生产力工具的本质变革。用户将从繁琐的执行细节中解脱出来，转而专注于更高层级的决策与引导，而 Agent 则作为强大的执行终端，承接起所有复杂的流程化工作，重塑人与数字世界交互的边界。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 17 次查看
迈向自主智能新纪元：深度解析 OpenAI ChatGPT Agent 系统架构与安全边界
迈向自主智能新纪元：深度解析 OpenAI ChatGPT Agent 系统架构与安全边界

z2．4月7日4月7日

OpenAI 近日公开了其 ChatGPT Agent 的系统卡片，这标志着人工智能正从单纯的语言生成模型，向具备自主决策与执行能力的“智能体”（Agentic Model）迈出关键一步。这一进展不仅展示了模型能力的边界扩张，更揭示了下一代 AI 交互的核心逻辑：从“对话”向“行动”的范式转移。该系统的核心竞争力在于其高度集成的工具链生态。通过将前沿的研究能力、高度自动化的浏览器操控技术以及精准的代码执行工具进行深度融合，ChatGPT Agent 能够突破传统对话框的限制，实现从“理解指令”到“闭环执行任务”的跨越。这意味着 AI 不再仅仅是信息的搬运工，而是能够自主在网络环境中检索、解析复杂网页，并利用代码处理数据，从而应对更为复杂的现实场景。然而，随着自主性的增强，潜在的风险也随之而来。为了应对自动化操作可能带来的安全隐患，OpenAI 在其“准备框架”（Preparedness Framework）的指导下，为该模型构建了一套严密的防护机制。通过在技术研发过程中引入多层级的安全护栏，OpenAI 试图在释放智能体强大生产力的同时，确保其在浏览器自动化与代码执行等高风险操作中
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 15 次查看
迈向自主智能时代：具备逻辑推理能力的“深度研究”智能体正式发布
迈向自主智能时代：具备逻辑推理能力的“深度研究”智能体正式发布

z2．4月5日4月5日

人工智能领域迎来重大技术突破。全新的“深度研究”智能体今日正式亮相，这标志着人工智能正在从单一的问答模式向具备复杂逻辑推理能力的自主代理模式转型。该智能体的核心竞争力在于其卓越的逻辑合成能力。它不再仅仅是简单地抓取网页内容，而是能够利用深度推理机制，在海量的互联网信息中进行自主穿梭与筛选，并能够自主拆解并执行复杂的多步骤研究任务。通过对碎片化信息的深度整合，它能够为用户提供具有洞察力的研究综述，极大地降低了深度调研的技术门槛与时间成本。在部署进度方面，该功能目前已率先向专业版用户开放。随后，该项技术将逐步推向高级版及团队版用户，旨在为专业人士与企业协作环境注入全新的智能化研究动力。 🔗 来源：https://openai.com/index/introducing-deep-research
z2

4月5日4月5日

z2

4月5日4月5日
- 0 篇意见
- 16 次查看
迈向自主编程新纪元：GPT-5.1-Codex-Max 正式登场，重塑大规模工程开发范式
迈向自主编程新纪元：GPT-5.1-Codex-Max 正式登场，重塑大规模工程开发范式

z2．4月7日4月7日

随着人工智能技术从简单的指令遵循向复杂的自主决策演进，编程领域的生产力革命正迎来关键转折点。近日，全新的 GPT-5.1-Codex-Max 模型正式发布，这款专为 Codex 体系打造的进阶版模型，正以其更快的响应速度与更深层的智能逻辑，重新定义着“智能编程代理”的技术标准。 GPT-5.1-Codex-Max 的核心突破在于其“智能体化（Agentic）”的设计理念。不同于以往仅能处理单一函数或代码片段的辅助工具，该模型专注于应对长程、大规模的项目级开发任务。它具备了处理复杂工程结构的能力，能够理解跨文件、跨模块的逻辑关联，从而在处理长时间运行的任务流时，展现出极高的逻辑一致性与任务完成度。在技术性能层面，该模型实现了推理能力与资源效率的双重飞跃。通过深度优化的推理算法，GPT-5.1-Codex-Max 能够应对极具挑战性的逻辑难题；同时，其卓越的 Token 利用效率，使得模型在处理庞大的项目上下文时，不仅能维持极高的理解深度，更显著降低了大规模开发中的计算成本与响应延迟。这种效率的提升，为大规模自动化软件工程的落地扫清了关键的技术障碍。业内普遍认为，GPT-5.1-Cod
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 18 次查看
迈向自动化机器学习时代：MLE-bench 问世，重新定义 AI 智能体工程评估标准
迈向自动化机器学习时代：MLE-bench 问世，重新定义 AI 智能体工程评估标准

z2．4月7日4月7日

随着人工智能从简单的对话交互向具备自主行动能力的智能体（AI Agents）演进，如何科学、严谨地衡量这些智能体在处理复杂工程任务时的实战能力，已成为学术界与工业界共同关注的核心课题。传统的评估基准往往侧重于逻辑推理或代码片段的生成，却难以模拟真实机器学习工程中复杂的全链路流程。针对这一评估空白，全新的基准测试 MLE-bench 正式亮相。该基准旨在通过一套标准化的评估体系，深度衡量机器学习智能体（Machine Learning Agents）在执行机器学习工程（Machine Learning Engineering）任务时的综合效能。它不仅关注算法的准确性，更侧重于衡量智能体在数据处理、特征工程、模型训练及调优等关键工程环节中的闭环处理能力。 MLE-bench 的推出，为衡量 AI 智能体在专业工程领域的落地潜力提供了关键的度量衡。它标志着 AI 评估范式正在发生深刻变革——从单纯的“知识问答”转向更为硬核的“端到端工程实践”，为推动自动化机器学习与智能体技术的深度融合提供了重要的技术基石。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 26 次查看
迈向负责任的开源：GPT-2 15亿参数模型正式发布，完成阶段性发布实验
迈向负责任的开源：GPT-2 15亿参数模型正式发布，完成阶段性发布实验

z2．4月8日4月8日

随着 15 亿参数规模的 GPT-2 模型及其配套代码与权重数据的正式公开，OpenAI 标志性的阶段性发布计划已步入终章。作为该系列模型中规模最庞大的版本，此次发布的战略重心在于为人工智能社区提供一种关键的技术工具，用以识别和检测由该模型生成的文本内容。尽管自去年八月以来，大语言模型领域已经经历了爆发式增长，出现了远超此前的庞然大物，但 OpenAI 依然选择严格遵循其最初设定的发布路线图。这一坚持并非仅仅为了完成既定计划，更在于其深层的实验意图：通过这一完整的发布流程，为开发者们提供一个关于“全阶段发布过程”的真实案例研究。在技术力量不断增强的当下，如何实现“负责任的发布”已成为全球人工智能开发者共同面临的课题。OpenAI 希望通过这一实验性案例，与整个人工智能社区展开深入对话，共同探讨在发布强大模型时，如何在技术透明度、社区协作与安全监管之间寻找平衡点，从而为未来更强大的模型发布建立标准化的规范与共识。 🔗 来源：OpenAI
z2

4月8日4月8日

z2

4月8日4月8日
- 0 篇意见
- 42 次查看
迈向超智能未来：确保AGI惠及全人类
迈向超智能未来：确保AGI惠及全人类

z2．3月10日3月10日

随着人工智能技术的不断进步，一项更为宏伟的目标正逐渐成为现实——即开发出具有广泛智慧的人工通用智能（Artificial General Intelligence, AGI）。作为科技财经记者，我们将深入探讨这一前沿领域的发展现状与未来展望。 AGI：超越人类的智慧 AGI是指能够超过人类在大多数智力任务上表现的人工智能系统。这不仅包括执行特定任务的能力，还包括理解、学习和创新等复杂认知过程。当前的人工智能（Artificial Intelligence, AI）主要集中在特定领域的应用，如图像识别或语音处理，但尚未达到全面超越人类智慧的水平。全球科技巨头的布局面对AGI这一未来科技制高点，谷歌、特斯拉、微软等全球顶尖科技公司纷纷加大投入，力求抢占先机。这些公司在资金和技术上的巨大投入，预示着AGI研发竞赛正全面展开。确保AGI惠及全人类正如原文所述，我们的使命是确保AGI系统能够为全人类带来福祉。这意味着在技术发展的同时，必须同步构建完善的伦理监管体系和社会应用框架，以防止潜在风险，并促进技术的公平分配和合理利用。未来展望尽管前路充满挑战，
z2

3月10日3月10日

z2

3月10日3月10日
- 0 篇意见
- 23 次查看
迈向超级对齐的新范式：探索“弱到强泛化”在人工智能安全领域的潜力
迈向超级对齐的新范式：探索“弱到强泛化”在人工智能安全领域的潜力

z2．4月7日4月7日

随着人工智能向着超越人类智能的阶段迈进，如何确保这些强大的模型始终符合人类的价值观与意图，已成为“超级对齐”领域面临的核心挑战。当模型的能力远超人类监督者的认知边界时，传统的对齐手段将面临失效的风险。针对这一困境，一项名为“弱到强泛化”的新型研究方向正引起学术界的广泛关注。该研究的核心命题在于：我们能否利用深度学习内在的泛化特性，通过相对较弱的监督者，实现对更强模型的有效控制与引导？初步的研究结果展现出了令人振奋的前景。这项技术尝试探索一种全新的范式，即利用低能力的监督信号来驱动高能力的模型执行任务，并确保其输出符合预期的安全准则。如果这一路径能够被成功验证，它将为解决超大规模模型治理难题提供一种全新的、可扩展的路径，为人类文明与超级智能的共存奠定技术基石。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 37 次查看
迈向通用人工智能的关键跃迁：400亿美元巨额融资落地，估值冲向3000亿美元大关
迈向通用人工智能的关键跃迁：400亿美元巨额融资落地，估值冲向3000亿美元大关

z2．4月5日4月5日

在通往通用人工智能的漫长征途中，一场史无前例的资本扩张正以前所未有的规模拉开帷幕。今日，业界宣布了一项足以重塑全球科技格局的融资计划：通过获得400亿美元的新增资金，该企业的投后估值已正式攀升至3000亿美元的高度。这笔巨额注资的核心使命在于进一步突破人工智能研究的前沿边界。随着模型复杂度的提升，对底层算力基础设施的需求正呈现出爆发式增长。此次融资将直接用于大规模扩充计算资源，旨在通过构建更强大的算力底座，为下一代智能技术的演进提供坚实的物理支撑。此外，面对每周活跃用户数已突破5亿大关的庞大用户群体，如何持续交付更强大、更高效的智能工具，已成为技术落地面临的重大挑战。通过此次资金注入，研发团队将致力于优化服务能力，确保全球用户能够享受到更具深度的智能化体验。这不仅是研发能力的升级，更是对未来智能生态构建的一次全方位布局。 🔗 来源：https://openai.com/index/march-funding-updates
z2

4月5日4月5日

z2

4月5日4月5日
- 0 篇意见
- 16 次查看
迈向逻辑严密：过程监督技术如何重塑大模型的数学推理能力
迈向逻辑严密：过程监督技术如何重塑大模型的数学推理能力

z2．4月7日4月7日

在人工智能迈向更高阶逻辑推理的过程中，如何评价一个模型的“思考”质量成为了核心课题。传统的训练范式主要依赖于“结果监督”，即仅根据最终答案的正确与否来给予模型反馈。然而，这种模式往往忽略了通往答案的路径是否严谨，导致模型可能通过错误的逻辑偶然获得正确结果。为了攻克这一难题，最新的研究成果展示了一种全新的训练范式——“过程监督”。通过对推理过程中的每一个正确步骤进行实时奖励，研究团队成功训练出了一款在数学问题求解领域达到业界领先水平（SOTA）的模型。这种方法不再仅仅关注终点，而是将注意力转向了逻辑链条的每一个环节。除了在数学性能上的显著飞跃，过程监督还带来了至关重要的“对齐”优势。它能够直接训练模型生成符合人类认知逻辑的思维链。这意味着，模型不仅能给出正确的答案，其推导过程也能够得到人类逻辑的认可与背书，从而在提升推理深度的同时，增强了模型输出的可解释性与安全性。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 39 次查看
迈向高效大规模元学习：爬行者算法凭借极简逻辑实现性能突破
迈向高效大规模元学习：爬行者算法凭借极简逻辑实现性能突破

z2．4月8日4月8日

在人工智能迈向通用智能的征途中，元学习作为实现“学会学习”的核心技术，一直备受瞩目。然而，如何在复杂且高维的任务空间中实现算法的可扩展性，始终是该领域面临的重大挑战。近期，一种名为“爬行者”的新型可扩展元学习算法脱颖而出，为这一难题提供了全新的解题思路。该算法的核心在于其精妙且极简的迭代机制。它通过循环往复地采样特定任务，并在每个任务上执行随机梯度下降，随后将全局初始参数向该任务训练后的最终参数进行方向性更新。这种设计思路本质上是将“最短下降”算法成功引入到了元学习的框架之中。在技术深度上，该算法与经典的“模型无关元学习”算法的一阶版本在数学逻辑上表现出高度的相似性。但其真正的优势在于对优化器的极低依赖性——它仅需通过“黑盒”方式访问优化器（如随机梯度下降或自适应矩估计）即可完成参数迭代。这种特性使其在保持与经典算法相当的计算效率与模型性能的同时，显著降低了计算开销，为大规模、高效率的元学习应用开辟了更具扩展性的技术路径。 🔗 来源：OpenAI
z2

4月8日4月8日

z2

4月8日4月8日
- 0 篇意见
- 42 次查看
进军桌面原生生态：OpenAI 收购 macOS 交互工具 Sky 开发商
进军桌面原生生态：OpenAI 收购 macOS 交互工具 Sky 开发商

z2．4月7日4月7日

OpenAI 宣布已完成对 Software Applications Incorporated 的收购，该公司是 macOS 自然语言交互界面 Sky 的开发者。此次收购标志着 OpenAI 在扩展 AI 应用边界、从网页端向桌面操作系统深度渗透方面迈出了关键一步。 Sky 是一款旨在将人工智能直接引入 Mac 桌面体验的交互工具，其核心优势在于能够实现 AI 与用户桌面工作流的无缝衔接。通过此次收购，OpenAI 计划将 Sky 在 macOS 系统层面的深度交互能力与 ChatGPT 进行全面整合。这一战略举措预示着 ChatGPT 正在经历从“对话机器人”向“桌面智能体”的范式转移。通过深度集成 macOS 的原生功能，OpenAI 致力于打造一个更加直观、具备强上下文感知能力且能够主动执行任务的 AI 助手，使其能够直接在用户的桌面环境中理解并驱动复杂的计算机操作。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 18 次查看
进军生命科学：Anthropic 斥资 4 亿美元收购生物技术初创公司 Coefficient Bio
进军生命科学：Anthropic 斥资 4 亿美元收购生物技术初创公司 Coefficient Bio

z2．4月7日4月7日

据 The Information 及记者 Eric Newcomer 报道，人工智能领军企业 Anthropic 已完成对处于隐身状态的生物技术 AI 初创公司 Coefficient Bio 的收购。此次交易以股票交换的形式进行，交易价值高达 4 亿美元。知情人士向 TechCrunch 证实，该交易已经完成，但并未透露具体的交易细节。此次收购标志着 Anthropic 在医疗保健和生命科学领域的战略扩张迈出了关键一步。此前，Anthropic 已于去年 10 月推出了专门针对生命科学领域的 Claude 工具，旨在通过先进的 AI 能力赋能科研人员，加速科学发现的进程。 Coefficient Bio 由 Samuel Stanton 和 Nathan C. Frey 共同创立，该公司成立仅八个月。两位创始人此前均在 Genentech 旗下的 Prescient Design 部门从事计算药物研发工作。Coefficient Bio 的核心技术在于利用人工智能技术提升药物研发及其他生物研究环节的效率。据悉，此次被收购的团队规模约为 10 人，他们预计将加入 Anthropi
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 17 次查看
进化与重塑：GPT-5.1 正式登场，打造更具人性化与交互感的对话体验
进化与重塑：GPT-5.1 正式登场，打造更具人性化与交互感的对话体验

z2．4月7日4月7日

OpenAI 宣布正式启动 GPT-5 系列的重大升级计划。通过引入更具亲和力且能力更强的全新模型，GPT-5.1 旨在打破人工智能与人类交互间的冰冷界限，实现更自然、更具情感温度的对话逻辑。此次更新的核心在于模型能力的全面跃升以及交互维度的深度扩展。全新的 GPT-5.1 不仅在理解复杂指令方面表现卓越，更引入了全新的定制化功能，允许用户根据个人需求深度调整 ChatGPT 的语言语气与表达风格，赋予了 AI 更加个性化的“人格化”特征。这一变革标志着生成式 AI 正在从单纯的生产力工具向具备高度共情能力的智能伴侣迈进。据悉，GPT-5.1 的升级功能已于今日起面向订阅用户开始分阶段推送。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 17 次查看
迪士尼与OpenAI达成重要协议：将经典角色引入Sora
迪士尼与OpenAI达成重要协议：将经典角色引入Sora

z2．2月12日2月12日

近日，华特迪士尼公司（The Walt Disney Company）与人工智能研究实验室OpenAI宣布达成一项里程碑式的合作协议，旨在通过Sora平台为粉丝们带来超过200个深受喜爱的迪士尼、漫威、皮克斯和星球大战角色。这一协议不仅关注娱乐中的负责任的人工智能应用，还包括迪士尼集团将全面使用ChatGPT Enterprise及OpenAI API等内容。🔗 来源：The Walt Disney Company and OpenAI reach landmark agreement to bring beloved characters to Sora (AI 严选)
z2

2月12日2月12日

z2

2月12日2月12日
- 0 篇意见
- 31 次查看
追觅割草机器人亮相2026 AWE：技术革新引领智能庭院生活
追觅割草机器人亮相2026 AWE：技术革新引领智能庭院生活

z2．3月12日3月12日

近日，2026中国家电及消费电子博览会（AWE）在上海盛大开幕。作为本届展会中规模最大的参展商之一，科技企业追觅科技携多款创新产品和领先技术亮相展会，其中特别值得关注的是其最新推出的割草机器人。此次展出的追觅割草机器人以其卓越的技术实力和用户体验，在智能庭院养护领域树立了新的标杆。这款机器人的核心在于其先进的激光雷达感知技术和人工智能算法的融合应用，以实现精准识别与高效避障功能，并通过AI自主建图技术让设备“开箱即用”，为用户带来前所未有的智能化体验。追觅科技带来的全新升级版割草机器人A3 AWD PRO，在环境感知、切割效率及复杂地形适应性方面实现了显著提升。这款机器人的双目视觉与AI算法融合避障技术，使得其在识别动态障碍物方面的准确率高达98%；此外，四驱轮毂电机赋予了它强大的爬坡能力，能够轻松跨越5.5厘米的垂直障碍，打破了同类产品对复杂地形适应性的局限。更令人眼前一亮的是，追觅首款具身智能割草机器人APEX。这款设备不仅具备传统的割草功能，还能通过拓展机械臂自主完成落叶清扫、垃圾收集倾倒等多任务操作，并进一步演化为庭院中的多功能助手，实现自动浇水、果实采摘等功能，甚至可以
z2

3月12日3月12日

z2

3月12日3月12日
- 0 篇意见
- 21 次查看
追觅芯际穿越“天穹”系列芯片量产发布首个太空算力盒即将升空
追觅芯际穿越“天穹”系列芯片量产发布首个太空算力盒即将升空

z2．3月11日3月11日

3月11日，追觅生态企业芯际穿越正式发布了其自主研发的“天穹”系列芯片，并宣布已实现规模化量产。这款芯片将搭载于追觅泛机器人系列产品中。当前，随着人工智能技术的发展，AI算力需求正以超越摩尔定律的速度指数级增长。自2012年以来，前沿AI训练任务所需的算力每3.4个月翻一番，累计增长超过30万倍。大模型从千亿参数向万亿参数迈进，端侧智能从简单感知向复杂决策演进，算力成为新一代人工智能竞争的核心壁垒。然而，全球算力供给正面临结构性瓶颈。传统摩尔定律逼近物理极限，晶体管密度提升放缓；先进制程产能受限，芯片供给存在不确定性；除此之外，地面数据中心受限于能耗指标、散热效率与土地资源，已难以支撑AI算力需求的无限扩张。国际能源署最新报告显示，2026年全球数据中心用电量将突破1000太瓦时，相当于日本全国一年的用电总量。能耗爆炸、散热困难以及选址受限成为算力基础设施扩张的“三重围城”。面对这些挑战，芯片产业的竞争逻辑正在发生根本性转变。一方面，端侧芯片从单一功能部件升级为系统级智能中枢，高集成度SoC成为支撑具身智能落地的关键载体；另一方面，算力基础设施的空间布局开始突破地面限制，向空天
z2

3月11日3月11日

z2

3月11日3月11日
- 0 篇意见
- 26 次查看
追赶竞争对手：Google 正式推出 macOS 原生 Gemini 应用，重塑桌面 AI 工作流
追赶竞争对手：Google 正式推出 macOS 原生 Gemini 应用，重塑桌面 AI 工作流

z2．4月16日4月16日

在人工智能桌面端应用的激烈竞争中，Google 再次发力。周三，Google 宣布正式推出适用于 Mac 的原生 Gemini 应用，此举旨在追赶 OpenAI 和 Anthropic 等先行者。通过这一原生化布局，Google 试图通过更深度的系统集成，打破浏览器标签页切换的繁琐，为用户带来更流畅的 AI 交互体验。该应用的核心竞争力在于其极高的交互效率。通过预设的快捷键（Option + Space），用户可以在 macOS 环境下的任何场景中即时唤起 Gemini，无需离开当前工作界面。无论是撰写市场报告时需要快速核实关键日期，还是在处理复杂的电子表格时寻求精准的计算公式，Gemini 都能在不中断工作流的前提下，提供即时的智能支持。更具突破性的是，这款应用实现了强大的“屏幕感知”与“上下文理解”能力。用户可以将屏幕上的任何内容——包括本地文件和复杂的统计图表——直接分享给 Gemini 进行实时分析。例如，面对复杂的商业图表，用户只需通过自然语言询问核心要点，AI 即可完成深度摘要。此外，该应用还集成了 Nano Banana 图像生成与 Veo 视频生成技术，进一步强化了
z2

4月16日4月16日

z2

4月16日4月16日
- 0 篇意见
- 14 次查看
透视 AI 之脑：OpenAI 探索利用稀疏电路破解神经网络的“黑盒”难题
透视 AI 之脑：OpenAI 探索利用稀疏电路破解神经网络的“黑盒”难题

z2．4月7日4月7日

在人工智能飞速发展的当下，如何理解大语言模型内部复杂的推理逻辑，已成为制约其安全应用的核心挑战。近日，OpenAI 披露了其在机械可解释性（Mechanistic Interpretability）领域的最新研究进展，试图通过一种全新的“稀疏电路”方法，揭开神经网络决策过程中的神秘面纱。长期以来，深度学习模型因其高度复杂的参数结构而被视为难以理解的“黑盒”。OpenAI 的这项研究重点在于探索如何利用稀疏模型技术，将庞大的神经网络逻辑拆解为更小、更易于追踪的特定神经元路径——即所谓的“稀疏电路”。通过这种方式，研究人员能够更精准地识别出哪些神经元在处理特定任务时起到了关键作用，从而实现对模型推理路径的深度解构。这一技术突破的意义不仅在于学术层面的认知提升，更在于其对人工智能安全性的深远影响。通过提升模型内部运作的透明度，开发者能够更有效地识别并消除潜在的偏见与错误逻辑。这种向“可解释性”迈进的尝试，将为构建更加透明、安全且具备高度可靠性的下一代人工智能系统提供关键的技术支撑，为实现真正可控的通用人工智能奠定基础。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 18 次查看
透视GPT-4V系统卡：多模态大模型的视觉进化与安全边界
透视GPT-4V系统卡：多模态大模型的视觉进化与安全边界

z2．4月8日4月8日

随着OpenAI发布GPT-4V（Vision）的系统卡，人工智能的视野正在从纯文本的逻辑推演，转向对物理世界的视觉感知。这份技术文档不仅展示了多模态模型在图像理解上的惊人跨越，更揭示了在视觉与语言交织的复杂维度下，安全防线的重构与挑战。在能力层面，该模型展现了卓越的跨模态推理能力。它不再仅仅是识别图像中的物体，而是能够理解复杂的图表、手写文本以及空间关系。通过将视觉特征与语言语义深度融合，该模型在视觉问答、图像描述及文档解析等任务中，实现了接近人类水平的认知表现。这种能力的提升，标志着大模型正从“文本大脑”向“感知大脑”演进。然而，系统卡的核心价值在于对风险的深度剖析。通过严苛的红队测试，研究人员发现，视觉输入的引入为模型注入了新的攻击向量。例如，通过在图像中嵌入隐蔽的指令，攻击者可能绕过传统的文本安全过滤器，实现“视觉越狱”。此外，模型在处理具有文化偏见或敏感内容的图像时，仍表现出潜在的偏见风险，这要求开发者在多模态对齐方面投入更多精力。此外，幻觉问题在视觉领域表现得更为隐蔽。模型可能会在图像细节的解读上产生“视觉幻觉”，即虚构不存在的物体或错误地关联空间关系。这种现象在医疗
z2

4月8日4月8日

z2

4月8日4月8日
- 0 篇意见
- 47 次查看
透视神经网络“黑盒”：激活图谱技术问世，助力破解AI决策透明度难题
透视神经网络“黑盒”：激活图谱技术问世，助力破解AI决策透明度难题

z2．4月7日4月7日

随着人工智能技术日益深入地渗透到医疗、自动驾驶及金融等高敏感领域，如何破解神经网络内部的“黑盒”决策难题，已成为人工智能安全领域的核心挑战。近日，一项名为“激活图谱”（Activation Atlases）的新技术正式亮相，该技术由研究团队与谷歌（Google）研究人员合作开发，旨在通过全新的可视化手段，揭示神经元之间复杂的交互作用及其所代表的深层语义特征。在当前的AI应用场景中，模型决策过程的不可见性往往隐藏着巨大的安全风险。随着AI系统被部署于关乎生命与财产安全的关键环节，仅仅依靠结果的准确率已不足以满足行业需求，开发者迫切需要理解模型内部的逻辑演变过程，以确保其决策的可靠性。 “激活图谱”技术的突破性在于，它能够将抽象的神经元交互转化为直观的可视化表征。通过这种方式，研究人员能够更清晰地洞察AI的内部决策机制，从而精准地识别模型的潜在弱点，并为深入调查模型失效原因、提升系统的鲁棒性与安全性提供了关键的技术支撑。 🔗 来源：OpenAI
z2

4月7日4月7日

z2

4月7日4月7日
- 0 篇意见
- 42 次查看
递归智能如何在4个月内筹得3.35亿美元，估值达40亿美元
递归智能如何在4个月内筹得3.35亿美元，估值达40亿美元

z2．2月16日2月16日

初创公司递归智能的联合创始人安娜·戈德利和阿贾莉亚·米尔霍希尼似乎注定要成为共同创始人。两人都是人工智能领域的知名工程师，曾收到扎克伯格发出的“奇怪邮件”，做出疯狂的提议，尽管他们没有接受。两人曾在Google Brain共事，并且是Anthropic的早期员工。他们在Google工作时，通过开发Alpha Chip（一种能在数小时内生成芯片布局的人工智能工具）赢得了赞誉。该工具帮助设计了三代Google的张量处理单元。这种背景解释了为何递归智能在推出仅四个月后就宣布完成了3亿美元的A轮融资，估值达到40亿美元，领投方为Lightspeed，这距离其种子轮融资仅过去几个月时间，彼时由 Sequoia 领投。递归智能致力于开发设计芯片的人工智能工具，而不是制造芯片。这意味着他们与绝大多数人工智能芯片创业公司不同：他们并不是想成为英伟达的竞争对手。事实上，Nvidia 是他们的投资者之一。 Nvidia、AMD、Intel 等所有芯片制造商都是该初创公司的目标客户。“我们希望任何类型的芯片，无论是定制芯片还是传统芯片，都能通过自动化和加速的方式进行构建。”米尔霍希尼告诉TechCru
z2

2月16日2月16日

z2

2月16日2月16日
- 0 篇意见
- 33 次查看
通义发布Fun-CineForge：多模态大模型助力影视级智能配音
通义发布Fun-CineForge：多模态大模型助力影视级智能配音

z2．3月16日3月16日

36氪获悉，阿里巴巴达摩院通义实验室今日发布了首个支持影视级多场景配音的多模态大模型——Fun-CineForge，并开源了该模型及高质量数据集构建方法。这一创新成果标志着人工智能技术在影视制作领域的应用迈上了新台阶。 Fun-CineForge是一个综合性的AI工具，能够针对不同场景下的声音需求提供精准、自然的配音服务。通过深度学习和多模态处理技术，Fun-CineForge可以捕捉并模拟人类语音的各种情感表达，为影视作品带来更加真实、动人的听觉体验。传统的AI配音系统往往局限于单一场景或特定语境下的人工智能应用，而Fun-CineForge则能够应对多样化的应用场景。无论是轻松愉快的喜剧片段还是紧张刺激的动作场景，该模型都能根据上下文信息生成符合情境的声音效果。此外，它还支持多种语言和方言的转化与合成，极大地拓宽了其适用范围。值得注意的是，Fun-CineForge不仅仅是一个技术方案，更重要的是它背后的构建方法。通义实验室开放了高质量数据集的制作流程，这意味着其他研究机构和个人开发者也能在此基础上进行创新探索。这种开源精神将促进整个行业的发展，加速AI技术在各行
z2

3月16日3月16日

z2

3月16日3月16日
- 0 篇意见
- 20 次查看