Industry News 行业资讯
Breaking news and updates from global AI giants. | 追踪全球 AI 巨头的最新动态。
1844篇记录在此类别
-
即日起,申请已开放。OpenAI的人民至上AI基金是一个规模为5000万美元的计划,旨在支持在美国推进教育、社区创新和经济机会的非营利组织。有意者需在2025年10月8日前提交申请,以获取无限制拨款,帮助社区塑造有益于公众利益的人工智能技术。🔗 来源:A People-First AI Fund: $50M to support nonprofits (AI 严选)
- 0 篇意见
- 36 次查看
-
人工智能领域的领军者 OpenAI 与金融科技巨头 Intuit 正式宣布达成一项价值超过 1 亿美元的多年期战略合作伙伴关系。这一重磅合作旨在通过深度整合 OpenAI 的前沿模型,在 ChatGPT 平台内推出全新的 Intuit 应用体验,并全面升级 Intuit 的智能金融工具生态。 根据协议细节,Intuit 将进一步扩大其对 OpenAI 尖端模型的应用规模,致力于开发更具个性化的智能财务管理工具。通过将 Intuit 强大的财务数据处理能力与 OpenAI 的生成式 AI 技术深度融合,用户未来有望在 ChatGPT 的交互界面中直接调用 Intuit 的专业功能,实现更直观、更智能的财务分析与决策支持。 此次合作不仅是技术层面的深度绑定,更标志着 AI 代理(AI Agents)在垂直专业领域落地迈出了关键一步。随着 Intuit 应用体验正式进入 ChatGPT 生态,金融服务正经历从“自动化”向“高度智能化交互”的范式转移,预示着生成式 AI 将在重塑全球个人及企业财务管理模式中发挥核心驱动作用。 🔗 来源:OpenAI
- 0 篇意见
- 25 次查看
-
/* 默认白昼模式:深灰字 */ .aibing-content { font-family: -apple-system, BlinkMacSystemFont, "Microsoft YaHei", sans-serif; line-height: 1.8; font-size: 16px; color: #1f1f1f; /* 默认深色 */ } .aibing-content h2 { margin: 30px 0 15px; font-weight: 700; border-left: 4px solid #007bff; padding-left: 10px; color: inherit; /* 跟随父级 */ } .aibing-content a { colo
- 0 篇意见
- 37 次查看
-
/* 默认白昼模式:深灰字 */ .aibing-content { font-family: -apple-system, BlinkMacSystemFont, "Microsoft YaHei", sans-serif; line-height: 1.8; font-size: 16px; color: #1f1f1f; /* 默认深色 */ } .aibing-content h2 { margin: 30px 0 15px; font-weight: 700; border-left: 4px solid #007bff; padding-left: 10px; color: inherit; /* 跟随父级 */ } .aibing-content a { colo
- 0 篇意见
- 34 次查看
-
Codex 应用现已登陆 macOS,它是一个集成了多种代理、并行工作流和长期任务处理的人工智能编码和软件开发控制中心。 🔗 来源:Introducing the Codex app (AI 严选)
- 0 篇意见
- 42 次查看
-
/* 默认白昼模式:深灰字 */ .aibing-content { font-family: -apple-system, BlinkMacSystemFont, "Microsoft YaHei", sans-serif; line-height: 1.8; font-size: 16px; color: #1f1f1f; /* 默认深色 */ } .aibing-content h2 { margin: 30px 0 15px; font-weight: 700; border-left: 4px solid #007bff; padding-left: 10px; color: inherit; /* 跟随父级 */ } .aibing-content a { colo
- 0 篇意见
- 36 次查看
-
Introducing GPT-5.3-Codex-Spark—我们的首个实时编码模型。速度提升15倍,上下文长度达128k,现已面向ChatGPT Pro用户进行研究预览。🔗 来源:Introducing GPT-5.3-Codex-Spark (AI 严选)
- 0 篇意见
- 45 次查看
-
/* 默认白昼模式:深灰字 */ .aibing-content { font-family: -apple-system, BlinkMacSystemFont, "Microsoft YaHei", sans-serif; line-height: 1.8; font-size: 16px; color: #1f1f1f; /* 默认深色 */ } .aibing-content h2 { margin: 30px 0 15px; font-weight: 700; border-left: 4px solid #007bff; padding-left: 10px; color: inherit; /* 跟随父级 */ } .aibing-content a { colo
- 0 篇意见
- 39 次查看
-
长期以来,大语言模型(LLM)的交互逻辑一直局限于“文本输入-文本输出”的封闭循环。尽管它们展现出了惊人的逻辑推理与知识检索能力,但其本质仍是一个“只有大脑、没有双手”的数字化实体。然而,随着计算机使用智能体(Computer-Using Agent,简称 CUA)技术的崛起,人工智能正在经历一场从“语义理解”向“具身交互”的范式转移。 计算机使用智能体的核心突破在于其具备了对图形用户界面(GUI)的感知与操控能力。不同于传统的机器人流程自动化(RPA)依赖于预设的、结构化的 API 接口或固定的脚本逻辑,CUA 采用的是一种基于视觉感知的非结构化操作模式。它通过多模态大模型实时解析屏幕像素,识别按钮、输入框、菜单及窗口状态,并将其转化为精确的鼠标点击、拖拽及键盘输入指令。这意味着,即便是一个没有提供任何编程接口的传统软件,只要人类能够通过肉眼识别,AI 就能通过“观察”来学会使用。 这种技术进步标志着自动化领域的重大变革。在 CUA 的驱动下,AI 的任务边界从简单的信息汇总扩展到了复杂的跨软件协同。例如,它能够自主打开浏览器搜索航班信息,随后切换至 Excel 进行数据整理,最后登
- 0 篇意见
- 61 次查看
-
长期以来,如何高效地进行大规模神经网络并行训练一直是人工智能领域的核心挑战。近日,一项关键性的研究发现,通过一个简单的统计指标——梯度噪声尺度,可以精准预测神经网络在多种复杂任务中的并行化潜力。 研究指出,任务的复杂度与梯度的噪声水平之间存在显著关联。由于复杂的任务往往伴随着更高的梯度噪声,这意味着在未来的模型训练中,采用更大规模的批处理量将变得愈发有效。这一发现极具战略意义,因为它有望消除制约人工智能系统进一步扩张的一个潜在技术瓶颈,为实现更大规模的智能进化提供了新的可能。 从更宏观的视角来看,这些研究结果预示着神经网络训练正经历一场深刻的范式转变。训练过程将不再被视为一种依赖直觉和经验的“神秘艺术”,而是正在向更加严谨、可系统化预测的精密科学迈进。 🔗 来源:https://openai.com/index/how-ai-training-scales
- 0 篇意见
- 21 次查看
-
在人工智能安全领域,长期以来一直存在着“安全性”与“可用性”之间的激烈博弈。传统的安全对齐机制往往依赖于“硬拒绝”(Hard Refusals)策略,即当模型检测到潜在的违规风险时,会直接切断对话或拒绝回答。虽然这种方式在防止有害输出方面非常有效,但其副作用也显而易见:模型往往会变得过于保守,甚至在面对看似无害但涉及敏感边界的指令时,也会表现出过度防御,从而严重损害了AI的实用性与交互体验。 随着OpenAI在GPT-5研发进程中引入全新的“安全补全”(Safe-completions)方法,这一困局正迎来转机。这项新技术的核心在于实现从“防御性拒绝”向“以输出为中心的安全性训练”的范式转移。与以往仅关注输入端过滤不同,新的训练逻辑更加侧重于对输出结果的精细化控制,旨在通过更具细微差别的安全性训练,提升模型在处理复杂指令时的表现。 这种转变对于处理“双重用途”(Dual-use)提示词至关重要。这类提示词具有双刃剑属性,既可以用于合法的学术研究,也可能被用于恶意目的。通过“安全补全”技术,模型不再是简单地采取“一刀切”的拒绝态度,而是在确保输出内容符合安全准则的前提下,尽可能地提供高质
- 0 篇意见
- 32 次查看
-
在人工智能领域的技术竞速进入白热化阶段之际,月度暗(Moonshot AI)再次投下重磅炸弹。随着 Kimi 系列模型的迭代,其最新成果 K2.6 的发布,不仅标志着大模型在逻辑推理上的持续进化,更预示着大模型应用范式正从简单的“对话交互”向复杂的“自主工程”转型。在近期全球大模型厂商密集更新的浪潮中,K2.6 的出现,为行业提供了一个观察大模型如何从“语言模型”向“行动代理”跨越的典型样本。 K2.6 最核心的突破在于其工程化能力的质变。不同于以往仅能完成简单代码补全或文本生成的逻辑,K2.6 展示了处理复杂软件工程任务的潜力。通过对大规模代码库的理解与操作,它能够自主完成从需求分析、代码编写到测试修复的闭环流程。在实际的压力测试中,该模型展现出了处理超长上下文并维持逻辑一致性的惊人能力,能够针对复杂的系统架构进行深度重构,这标志着大模型正在从“辅助工具”向“数字员工”的角色转变。 这种工程能力的跃迁,在具体的应用案例中得到了有力印证。在针对底层系统优化的测试中,K2.6 能够自主识别性能瓶颈,并针对性地重写关键模块。例如,在处理高性能计算场景下的代码优化时,它不仅能完成语法层面的修
- 0 篇意见
- 56 次查看
-
长期以来,自回归语言模型的逻辑始终遵循着“从左至右”的线性范式。这种预测模式虽然在文本生成领域取得了巨大的成功,但在处理需要理解上下文全貌的任务时,却面临着天然的局限性。 传统的预测机制主要关注当前字符之后的内容,这使得模型在面对“中间缺失”的情境时显得力不从心。以编程场景为例,开发者往往需要在已有的函数定义与结尾之间插入逻辑代码,此时如果模型无法感知后文的约束条件,生成的代码将难以实现逻辑闭环,甚至会产生严重的语法冲突。 为了攻克这一技术瓶颈,“中段填充”训练技术的出现成为了关键的转折点。通过一种高效的训练策略,研究人员重新设计了数据的排列逻辑:将原始序列拆解为前缀、中间占位符与后缀,并训练模型在同时感知前后文信息的基础上,精准预测中间缺失的内容。 这种技术革新不仅显著提升了模型对非线性文本结构的理解能力,更直接赋能了代码补全等核心应用。通过在训练阶段引入这种“填空”任务,语言模型能够学习到更深层次的语义关联,从而在复杂的开发环境中提供更具前瞻性和准确性的辅助建议。 展望未来,随着中段填充技术的日益成熟,语言模型正从单纯的“文本续写者”向具备“上下文感知能力”的智能助手蜕变。这种从单
- 0 篇意见
- 64 次查看
-
在刚刚落幕的北京机器人马拉松赛场上,一个令人震撼的时刻成为了科技界的焦点:来自荣耀品牌的“闪电”机器人,以惊人的速度完成了全程挑战。这不仅仅是一场速度的竞赛,更是人工智能与机械硬件深度融合的里程参证。随着比赛进程的推进,人们发现,曾经被视为“笨拙机械”的机器人,正在以前所未有的姿态,向人类的运动极限发起冲击。 回望仅仅一年前,机器人参与此类赛事还常被视为某种“技术笑话”。那时的赛场上,机器人时常出现迷失方向、撞向障碍物或因动力不足而停滞不前的尴尬局面。然而,仅仅一年时间,从“蹒跚学步”到“疾速冲刺”,具身智能的进化速度令人咋舌。这种跨越式的进步,背后是底层算法与执行机构协同能力的质变。 这种进步并非偶然,而是资本与技术的双重共振。随着全球范围内大规模早期融资的涌入,具身智能赛道正迎来爆发式增长。从移动互联网时代的算法驱动,到如今的物理世界感知驱动,产业链的每一个环节都在经历重塑。不仅是硬件执行器的精度提升,更重要的是,机器人开始具备了理解物理规则的能力,它们不再仅仅是执行预设程序的机器,而是能够感知、决策并实时反馈的智能体。 然而,在狂欢的背后,行业也面临着深刻的“进化瓶颈
- 0 篇意见
- 29 次查看
-
科技财经记者王哲平报道 在一年前,月之暗面曾因DeepSeek的崛起陷入困境。然而,就在2026年3月中旬,这家公司却迎来了一次令人震惊的反转。据多家媒体报道,月之暗面正在进行新一轮10亿美元融资,其最新估值已达到180亿美元。 一年前,这家AI独角兽因DeepSeek的冲击不得不暂停了Kimi的多个安卓渠道投放,C端扩张战略被迫按下暂停键。当时的舆论几乎一边倒认为,“基础模型是巨头的游戏,初创公司该认清现实。” 然而仅仅过了一年时间,月之暗面就实现了惊人的反弹。 2026年3月中旬,这家AI独角兽正在进行新一轮10亿美元融资。而就在2025年12月末,其估值还是43亿美元。对于一家在行业震荡中承压的AI独角兽而言,这样的反弹幅度无疑是惊人的。 从成立到成为中国科技公司中的“十角兽”(估值突破100亿美元),月之暗面仅用了两年多时间。作为一个对比,拼多多用了三年多,字节跳动则用了四年多。月之暗面以“闪电速度”刷新了中国科技公司的成长纪录。 月之暗面成立于2023年4月,创始人杨植麟出身于清华大学,而后在卡耐基梅隆大学攻读博士,并曾在Google Brain和Me
- 0 篇意见
- 167 次查看
-
近日,研究团队采用了一种名为稀疏自编码器的新技术,成功地在人工智能模型GPT-4的计算过程中自动识别出了1600万种模式。这一突破不仅进一步展示了大型语言模型的强大能力,还为理解这些模型背后的复杂机制提供了新的视角。 传统的机器学习方法往往依赖于人工设计特征或手动标注数据,但在大规模、高维度的数据集中,这种方式显得力不从心。而稀疏自编码器通过自动学习数据结构中的关键模式和特征,极大地提升了效率和效果。 具体来说,研究团队将这种新技术应用于GPT-4的训练过程中,发现模型内部蕴含了如此之多、种类繁多的知识结构。这些模式涵盖了广泛的主题领域,从自然语言理解到专业知识,甚至包括了一些未被明确编程的隐含规则和常识。 这一发现对于科技界具有重要意义。首先,它证明了稀疏自编码器在处理复杂数据集上的有效性,为未来开发更高效的机器学习算法提供了新的思路;其次,通过对这些模式进行进一步分析,研究人员有望揭示更多关于GPT-4乃至其他大型语言模型内部工作原理的秘密。 然而,值得注意的是,虽然1600万个模式听起来令人印象深刻,但这仅仅是冰山一角。GPT-4的知识库远比这庞大得多,而且这些模
- 0 篇意见
- 28 次查看
-
如果说人工智能驱动的文字冒险游戏曾让玩家惊叹于“无限剧情”的可能性,那么现在,玩家将不再仅仅是冒险者,而是世界的创造者。 近日,凭借《人工智能地玩》(AI Dungeon)声名鹊起的初创公司 Latitude 正式推出了其全新的游戏平台——Voyage。这不仅仅是一个游戏,更是一个由人工智能驱动的角色扮演游戏创作平台。通过该平台,用户可以化身游戏设计师,利用自然语言描述场景、地标、主线任务乃至反派角色。即便玩家只是提出了一个模糊的概念,例如“一个被海怪困扰的渔村”,平台背后的技术也能自动生成相应的游戏逻辑与代码,将创意转化为可交互的现实。 Voyage 的核心魅力在于其彻底打破了传统游戏的“预设剧本”模式。在传统的角色扮演游戏中,玩家面对冲突时往往只有“战斗”或“逃跑”等有限选项;而在 Voyage 中,玩家可以尝试任何天马行事的操作,比如化身为一名“哥布林心理治疗师”,通过沟通而非暴力来解决冲突。人工智能将根据玩家的输入,实时叙述出意想不到的剧情走向,甚至可能出现极具戏剧性的反转——例如,在测试过程中,一名试图绑架玩家的巨魔甚至开始倾诉其婚姻危机。 支撑这一宏大愿景的是 Latitu
- 0 篇意见
- 23 次查看
-
构建安全人工智能系统的核心路径之一,在于摆脱对人工编写目标函数的依赖。在处理复杂目标时,若使用简单的代理指标来替代,或者对复杂目标的定义出现细微偏差,都可能诱发不可预见的、甚至具有危险性的行为。通过与DeepMind安全团队的深度协作,我们研发出了一种全新的算法。该算法能够通过人类对两种预设行为优劣的判断,实现对人类真实意图的精准推断与学习。 🔗 来源:OpenAI
- 0 篇意见
- 63 次查看
-
在打造安全的人工智能系统方面,一个关键步骤是减少对人工编写目标函数的需求。因为简单地用一个代理来近似复杂的目标或稍微错误理解了复杂目标,都可能导致不希望甚至危险的行为。 近期,在与DeepMind的安全团队合作下,我们开发了一种算法,该算法能够通过告知其在两个提议行为中哪一个更好,从而推断出人类真正的需求。这种方法有助于更准确地理解和实现人的意图,进而提高AI系统的安全性。 🔗 来源:Learning from human preferences (AI 严选)
- 0 篇意见
- 27 次查看
-
近日,一项针对774M参数量的GPT-2语言模型进行的人类反馈微调研究引起了广泛关注。这项由资深科技财经记者撰写的研究报告揭示了在不同任务中,如何通过人类直接反馈来调整该模型的行为模式。 研究团队通过对GPT-2模型进行了精细微调(fine-tuning),使之能够更好地满足外部人类标注者的偏好。然而值得注意的是,这些偏好并不总是与研究人员自身的期望相符。具体而言,在句子总结的任务中,标注者倾向于复制粘贴输入中的完整句子(尽管仅要求确保准确性)。因此,经过微调的模型学会了直接复刻。 此次研究中,总结任务共需要60,000个人类标签;而对于其他更简单、风格多样的文本延续任务,则只需5,000个标签便能完成。这种差异化的标注需求反映了不同任务对人类反馈的依赖程度。 该研究的主要动机在于将安全技术进一步融入到“机器与人交互”的广泛任务中,这被认为是提取人类价值观的关键所在。通过这种方式,机器不仅能够更好地理解并模拟人类的语言行为,更有助于在未来的智能应用中遵循更符合人类伦理和价值导向的原则。 此次研究的成功实施为后续类似技术的发展提供了宝贵的参考经验,也为人工智能领域探索更加
- 0 篇意见
- 27 次查看
-
在人工智能的发展进程中,我们正见证着一次从“工具”到“代理”的范式转移。近日,Codex 的最新演进不仅标志着其功能的扩张,更预示着一种全新交互模式的诞生:人工智能不再仅仅是等待指令的文本生成器,而是开始具备了观察、理解并直接操作数字世界的“手”与“眼”。 这次变革的核心在于交互维度的跃迁。传统的应用程序接口(API)依赖于预设的逻辑路径,而全新的 Codex 正在尝试突破这种束缚。通过直接感知用户界面并模拟人类操作,它能够理解复杂的视觉逻辑,并像人类一样在软件之间穿梭。这意味着,它不再局限于处理结构化的数据,而是能够理解那些原本难以被机器触达的非结构化界面,实现了从“理解指令”到“理解环境”的跨越。 更深层的变革在于工作流的重构。Codex 正在从一个单纯的代码生成工具,进化为一个能够自主驱动任务的智能中枢。它不再仅仅是编写一段逻辑,而是能够接管从项目管理工具到协作平台的完整链路。无论是跨越不同办公软件进行信息汇总,还是在复杂的开发环境中自主执行任务,它正在构建起一种跨越软件边界的“数字粘合剂”。它能够识别任务的上下文,并在不同的应用生态之间建立起逻辑上的连续性。 此外,
- 0 篇意见
- 29 次查看
-
在具身智能(Embodied AI)的研究前沿,如何让机器人具备类人的快速学习能力,始终是学术界与工业界共同攻克的难点。近日,一项突破性的机器人系统研究成果引起了广泛关注。该系统展示了一种革命性的学习路径:通过在虚拟仿真环境中进行大规模、高强度的预训练,并成功将学习成果无缝迁移至物理实体机器人上,实现了从“数字孪生”到“现实操作”的跨越。 该系统的核心技术突破在于其卓越的“单次学习”(One-shot Learning)能力。不同于传统机器人学习算法往往需要成千上万次重复实验的局限,这套系统在仅通过观察一次任务演示后,便能迅速理解并掌握全新的操作逻辑。这种极高的学习效率,极大地降低了机器人部署新技能的门槛与时间成本。 这种基于“仿真训练、实机部署”的闭环模式,不仅有效解决了物理世界数据采集难、成本高的痛点,更为通用人工智能(AGI)在物理世界的落地提供了新的技术路径。随着该技术的进一步成熟,未来机器人将在面对复杂、多变的非结构化环境时,展现出更强的自主适应与技能习得能力。 🔗 来源:OpenAI
- 0 篇意见
- 60 次查看
-
亚洲AI数据中心供应商Firmus本周宣布,在由Coatue领投的新一轮融资中成功筹集5.05亿美元,公司投后估值已飙升至55亿美元。在短短六个月内,该公司已累计融资达13.5亿美元,展现出极强的资本吸引力。 这家总部位于新加坡的数据中心公司此前曾以12亿美元的估值融资约2.15亿美元,其中英伟达(Nvidia)也是其重要的投资者之一。资本的持续涌入,标志着Firmus正迅速从一家区域性服务商转型为全球AI基础设施领域的关键参与者。 Firmus目前正致力于其名为“Southgate项目”的宏大计划,旨在澳大利亚和塔斯马尼亚建立一个高效能的“AI工厂”数据中心网络。该项目强调能源效率,旨在应对大规模AI训练带来的巨大能耗挑战。 在技术架构层面,Firmus深度绑定了英伟达的生态系统。公司正采用英伟达的参考设计来构建这些高效能中心,并计划在未来的基础设施中部署英伟达下一代AI计算平台——Vera Rubin。作为Blackwell架构的继任者,Vera Rubin预计将于2026年下半年开始交付,这将为Firmus的数据中心提供顶尖的算力支撑。 Firmus的成长轨迹也反映了当前科技投资
- 0 篇意见
- 70 次查看
-
生产力工具的范式正在发生剧变。Notion 近日宣布,通过深度集成 GPT-5 的底层能力,其 AI 架构已完成大规模重构,正式迈入 Notion 3.0 时代。这一变革的核心标志着 Notion 正在从一个被动响应指令的协作平台,转型为能够自主驱动任务的智能生态系统。 此次架构重构的技术亮点在于构建了一套具备“推理、执行与自适应”能力的 AI 智能体(Agents)系统。不同于传统的生成式 AI 仅能完成文本润色或简单问答,全新的架构赋予了 AI 跨越不同工作流的逻辑思考能力。这些智能体能够理解复杂的业务逻辑,在多任务场景中自主采取行动,并根据工作流的动态变化实时调整执行策略。 随着这种自主 AI 工作流的解锁,Notion 3.0 将为用户带来前所未有的生产力飞跃。通过将 AI 从“副驾驶”角色提升为“自主执行者”,用户能够构建起更加灵活、高效且自动化的自动化流程,彻底打破传统文档协作的边界,实现从人工驱动到智能驱动的生产力革命。 🔗 来源:OpenAI
- 0 篇意见
- 23 次查看