AIGC 观察 - 页 4

小鹏汽车董事长兼CEO何小鹏近日在媒体体验日上宣布，公司即将推出第二代VLA（视觉-语言-动作）模型，并表示未来将不再纠结于L3级有条件自动驾驶，而是直接跳过，直奔L4级自动驾驶。
第二代VLA相比第一代最核心的区别在于技术架构的“颠覆性重构”：它开创性地去掉了中间的“语言翻译”环节，让系统从“思考后再行动”进化为“直觉式反应”。这标志着车辆将更加接近人类驾驶员在驾驶过程中的自然反应。
摩根士丹利、美国银行等国际投行纷纷发布研报给予小鹏汽车“买入”评级，并指出，第二代VLA是“一次大胆的飞跃”，并且小鹏在自动驾驶领域的技术进展使其具备与特斯拉在全球市场正面竞争的能力。这背后蕴藏着小鹏更大的野心——不再简单造一台车，而是要打造一个超级智能体。
何小鹏认为，中国应该一个是L2级自动驾驶，另一个是L4级自动驾驶。他认为从L2直接跨越到L4，在技术突破和责任主体划分方面更具优势。小鹏选择了从L2直接跨越到L4的路径，其最本质的改变就是重构模型范式。
第二代VLA已经在广州的小鹏全新P7车型上得到了初步应用，并在实际驾驶中展现了出色的性能，全程零接管。此外，该技术对于用户来说还带来了两大维度的提升：安全性提高和全场景可用性增强。
小鹏整个研发体系也完成了一次跨越式升级，不仅在模型层面集成了“看、听、读”为一体的大模型，还在算力层面坚持软硬一体的研发，并通过大量训练数据支持其技术进步。这标志着小鹏正在构建底层通用能力体系，以期实现真正的代际差。
何小鹏还宣布了更长远的计划：不仅将在海外推广自动驾驶技术，还将推动L4级Robotaxi的发展，并将该技术应用于Robotaxi、人形机器人和飞行汽车等多个领域。他认为，这将推动小鹏从一家传统车企转变为面向全球的具身智能公司。
在何小鹏看来，“我们该怎么能够跨过上一个时代，到达下一个时代”已经不仅仅是技术问题，而是需要创新与探索新的商业模式。他的行动证明了这一理念，并激励着更多科技创业者去尝试从未有人走过的新道路。
🔗 来源：别认为小鹏还只是个造车的 (AI 严选)

由 z2，在Industry News 行业资讯， · 周三 01:143天前

0篇意见
2次查看

近日，一家以人工智能（AI）赋能新材料研发的初创企业——索格智算宣布完成超过一千万元人民币的种子轮融资。此轮融资由启高资本领投，交大菡源资产、紫竹小苗和紫竹科投跟投。
索格智算成立于2025年9月，其创始团队成员皆来自上海交通大学，包括数学学院特聘教授徐振礼教授等。这支拥有跨学科背景的团队致力于通过AI技术解决新材料研发周期长、成本高的行业痛点。
针对材料模拟中的长程相互作用这一难题，索格智算提出了新型神经网络描述子——SOG-Net算法。该算法能够将总势能分解为短程与长程项独立建模并高效耦合，并通过引入可训练的高斯和函数自适应拟合库仑、色散等长程作用。
为了实现这一技术在实际应用中的落地，索格智算还开发了随机分批分子动力学模拟软件RBMD以及软硬件一体化的专用模拟器——纳泰（NanoTitan）。该设备可在单GPU卡上完成千万原子模拟，并且计算速度比主流软件快数十倍。
目前，索格智算已将RBMD算法接入国家超算互联网平台并通过了市场验证。其产品已经投入市场并服务于多家高校院所及研发机构。除了纳泰一体机外，公司还提出了一种名为R2D的多场耦合模型，用于精准预测电池材料失效机制。
索格智算正积极拓展业务模式，计划在新材料、稀土永磁以及半导体等关键领域发挥更广泛的影响。其与多家知名企业建立了合作关系，包括与天和磁材共同构建人工智能研发系统，并与宁德时代未来能源研究院合作开发高精度电化学建模框架。
在资金支持方面，本轮投资将主要用于持续研发原创AI计算引擎、扩充研发团队以及建设算力基础设施。投资方认为索格智算不仅具备强大的技术实力，还具有广阔的市场前景，在电池、稀土和半导体等关键赛道上有望释放重要价值。
🔗 来源：上海交大教授创业，用AI研发新材料，交大系基金投资｜36氪首发 (AI 严选)

由 z2，在Industry News 行业资讯， · 周三 01:043天前

0篇意见
2次查看

近日，国家互联网应急中心发布了一项关于OpenClaw安全应用的风险提示。这项公告提醒用户注意在使用相关应用程序时可能遇到的安全问题。
作为一位资深的科技财经记者，我们有必要深入了解这一事件背后的技术与市场动向。首先，让我们回顾一下原文信息。
视觉中国发布公告称：其实际控制人廖道训、吴玉瑞和柴继军在2026年3月2日至9日期间通过集中竞价减持了112.35万股公司股票，占总股本的0.16%，剔除回购专用账户股份后的比例亦为0.16%。此次权益变动触及了1%的整数倍标准，符合其已披露的减持计划以及监管规定。
然而，本文的重点并不在于视觉中国股东减持的信息，而是关于OpenClaw安全应用风险提示的内容。在当今互联网时代，用户数据保护和网络安全成为了重中之重。
国家互联网应急中心提醒广大用户，在使用任何AI技术相关应用程序时，尤其是那些宣称能够快速提升内容播放量或热度的应用程序，要注意潜在的安全隐患。
“3000块钱做出5亿播放量”，这似乎是一个夸张的数字，但确实揭示了当前短剧市场中的一种乱象。最近，一部名为《霍去病》的AI生成短视频以其惊人的传播速度和巨大的观看量引起了广泛关注。这部作品成为了短剧行业开年的“闹剧”。
这一事件不仅反映了技术在内容创作中的巨大潜力，也暴露了其背后可能存在的风险。OpenClaw作为市场上的一款热门AI应用，或许正是此类事件的幕后推手。这款应用程序被广泛用于生成高质量的内容，并迅速获得了市场的认可。
但是，对于用户而言，在享受技术带来的便利时，也应该警惕潜在的安全和隐私问题。国家互联网应急中心建议大家在使用相关应用前仔细阅读服务条款，确保个人信息安全。
综上所述，OpenClaw等AI技术的应用虽然带来了诸多创新与变革，但同时也需要我们保持警惕。未来，在推动科技进步的同时，如何保障用户权益和数据安全将成为一个关键议题。
🔗 来源：国家互联网应急中心发布OpenClaw安全应用风险提示 (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 19:063天前

0篇意见
2次查看

作者｜黄楠
编辑｜袁斯来
编者按：
当出海越来越成为一家中国公司核心战略时，如何征战全球市场就成为一个极其专业的话题。在全球化的演变中，已有不少中国品牌站立潮头。
鉴于此，硬氪特推出「Insight全球」专栏，从品牌成长与变迁，探索中国品牌出海的前沿方向与时代契机，为出海玩家与行业提供思考与启发。
这是我们专栏第61期——
拿火音乐（LAVA MUSIC）从广州起步，以“材料创新+智能交互”模式，于2017年推出全球首款一体成型碳纤维吉他LAVA ME，在智能吉他赛道中迅速破局。经过数年的技术积累与市场开拓，拿火音乐在2024年发布无弦吉他“精灵”，进一步降低用户上手门槛；2025年则推出了个人音乐创作平台LAVA STUDIO，并通过海外众筹平台成功筹得超过226万美元，刷新了品类纪录。目前全年营收已达数亿元。
拿火音乐创始人陆子天，这位从独立音乐节后台走出的乐手，以其独特的创业经历和创新精神引领着智能音乐产业的发展。他曾在9岁时开始学习弹吉他，并在大学期间赴美深造，在全球最大的乐器零售店Guitar Center试玩各类顶级乐器设备。
谈及创业初衷，陆子天直言：“传统乐器几十年来似乎从未有过实质性突破。材料的固有局限、笨重不便的形态以及高昂的学习门槛，使得整个行业陷入了停滞状态。”
2013年，刚毕业的陆子天与两位合伙人共同成立了拿火音乐，开始制作自己的品牌吉他。2017年，他们推出了全球首款一体成型碳纤维智能吉他LAVA ME。
到了2024年，拿火发布了无弦吉他“精灵”，旨在解决用户上手难度高的问题；同年发布的LAVA STUDIO则集成了AI模拟效果器和专业级混音监听系统，使得音乐创作变得更为便捷。
从碳纤维一体成型到无弦交互再到集成化工作室，拿火的产品节奏显得很克制。这或许与陆子天本身的专业背景有关。拿火的产品主要针对的是专业音乐人，直到2024年推出的“精灵”产品才真正面向大众市场。
尽管如此，在过去一年中，拿货的营收增速连续突破50%，增长势头强劲。它以尊重音乐本身的姿态，建立起了护城河，一直细水长流地成长。
2017年夏天，广州一间湿热的工作室里，陆子天和他的团队又一次拆开了手上的吉他。他们发现传统木吉他的音质高度依赖其共鸣箱体，生产一致性低且木材易受温湿度影响而变形。拿火的新产品设想正是向这一物理局限发起挑战。
经过多次尝试，最终拿火将目光锁定在碳纤复合材料上，并成功研发出全球首款一体成型的碳纤维吉他LAVA ME。随后，在2021年发布的LAVA ME 3版本中，他们首次在吉他的触控屏和音频系统上整合了多种专业音色模块。
但拿火一直未能突破单一品类限制，直到2022年开始投入研发更硬核的产品——LAVA STUDIO。这款产品通过AI模拟近百款经典效果器、音箱及具备AI音轨分离能力的迷你DAW（数字音频工作站），并集成用于精准监听的音响系统等。
“我们不只是把原材料堆进去，而是根据想呈现的最终效果，去倒推应该如何录制采样、如何编排。”陆子天解释道。
通过AI技术对各种昂贵硬件设备进行数字复刻，LAVA STUDIO成功降低了音乐创作门槛。这一设计源于陆子天对用户需求的深入理解：第一类是基数最大的“体验入门型”用户；第二类则是“进阶创作型”用户。在欧美市场，“进阶创作型”和“深度文化型”用户构成了核心市场需求。
未来，智能乐器市场的增长将源于对爱好者全生命周期的重新想象。拿火音乐凭借其独特的技术和产品优势，在全球范围内开拓了多元化的市场，并不断引领智能音乐产业的发展潮流。
🔗 来源：用智能吉他起家后，这家公司又用AI音乐工作站拿下百万美元众筹，营收数亿｜Insight全球 (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 19:023天前

0篇意见
2次查看

近日，多家中国科技公司相继宣布在人工智能（AI）领域的最新进展。
腾讯已经初步形成了覆盖个人、开发者及企业级部署的智能体“养虾”矩阵。继3月9日发布WorkBuddy后，腾讯进一步完善了国民级应用场景中的AI生态支持。目前，企业微信官方已正式降低接入标准，并通过API“长连接”模式将智能体无缝接入企微。
芒果TV近日宣布成立AIGC创新内容中心，该团队已在市场上获取了一批原创剧本与动漫IP，并计划在下一阶段进行深度开发。此次行动标志着芒果TV正逐步探索AI技术在影视制作领域的应用。
百度则已启动面向2027届在校生的暑期实习招聘项目，开放超过5000个实习offer，超九成岗位与AI相关。此外，百度还宣布，其无人驾驶出行服务平台萝卜快跑已于近日恢复在迪拜与阿布扎比的全无人测试与运营服务。
蚂蚁集团也启动了2026年度春季校园招聘，并计划招募超过85%的技术岗位，其中超70%聚焦于人工智能领域。
抖音小火人的日活用户规模已经突破1亿。该平台的游戏业务在2025年实现了显著增长，预计未来几年将继续扩大市场规模。这表明短视频平台正积极探索AI技术在游戏领域的应用。
其他科技巨头也纷纷布局AI领域。例如，英伟达计划推出面向企业的开源智能体平台NemoClaw；联想开天正式推出了全场景“开天Claw”信创AI一体机解决方案；华为则将于3月20日发布数据存储新品。
此外，中国政府也在积极引导和支持相关产业发展。江苏提出设立脑机接口产业投资基金，旨在吸引社会资本参与，并助力种子期、初创期企业发展壮大。
🔗 来源：氪星晚报｜腾讯：目前已初步形成覆盖个人、开发者及企业级部署的智能体“养虾”矩阵；芒果TV AIGC创新内容中心正式成立；52条中日航线2月取消全部航班 (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 19:003天前

0篇意见
2次查看

近期，Google为美国用户推出了AI模式下的Canvas功能，这一创新工具不仅能够帮助人们整理长期的计划和项目，还支持更广泛的创意创作和编码任务。
借助于Canvas的功能，用户现在可以直接在搜索引擎中撰写文档、创建自定义互动工具。这种前所未有的高效便捷方式将开启全新的工作与学习体验。
早些时候，有测试者分享了一个令人惊叹的想法——一个用于可视化和跟踪奖学金信息的仪表盘，其中包括了多种要求、截止日期及金额等细节。用户只需选择AI模式下的Canvas选项，并详细描述自己的需求，就可以获得一个包含最新网络数据和Google知识图谱信息的工作原型。
接着，用户可以测试该工具的功能性，查看底层代码并进行对话式的调整，直到完全满足自身需要为止。无论是构建个性化的工具、备考考试还是规划旅行等，Canvas在AI模式下都能让您的项目启动变得轻松自如。
总之，这一新功能为用户带来了前所未有的便利与高效，让我们拭目以待它在未来将如何改变我们的工作和生活方式。
注：要获取更多关于Google的最新资讯，请关注官方渠道并订阅邮件通知。
🔗 来源：Use Canvas in AI Mode to get things done and bring your ideas to life, right in Search. (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:583天前

0篇意见
2次查看

在科技与财经的交汇点，我们迎来了一次激动人心的技术革新。以阿里巴巴云Qwen为背景的创新工坊——NotebookLM，在其AI驱动的视频创作能力上推出了重大更新：Cinematic Video Overviews（电影级视频概述）。这一新功能不仅超越了传统的叙述式幻灯片展示，更打造了一系列独一无二、充满沉浸感的视频内容。
Cinematic Video Overviews运用了我们先进的AI模型组合——包括Gemini 3、Nano Banana Pro和Veo 3。通过这些模型的协同工作，Cinematic Video Overviews能够自动生成流畅的动画效果以及丰富的详细视觉元素，帮助用户更深入地理解和互动于他们所关心的主题。
更重要的是，Gemini在此过程中扮演了创意导演的角色，它将做出数百项结构和风格上的决策，以最恰当地呈现您的来源信息。无论是选择最佳叙述方式、确定视觉风格还是格式设定，甚至是自我优化确保一致性，Gemini都在幕后为Cinematic Video Overviews提供了强大的支持。
当前，Cinematic Video Overviews已在英文版中面向Google AI Ultra订阅用户（18岁以上）开放。无论是通过网页还是移动设备，您都可以体验到这一创新功能带来的独特魅力。如果您是科技财经领域的关注者或从业者，不妨加入我们的行列，共同探索这场视觉与思维的盛宴。
我们期待与您的每一次交流。请订阅最新消息，获取更多来自Google的资讯。
🔗 来源：Generate your own Cinematic Video Overviews in NotebookLM. (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:583天前

0篇意见
2次查看

2月份，谷歌在人工智能领域的多个重要动态再次引起了广泛关注。从印度的‘AI影响峰会’到多项新技术的发布，Google通过一系列举措展示了其在全球范围内的影响力。
全球视野下的AI影响
在2月举办的AI Impact Summit上，谷歌不仅展示了最新的技术成果，还宣布了多个新的合作伙伴关系和投资计划。此次峰会聚集了来自世界各地的行业领袖和专家，共同探讨人工智能如何解决现实生活中的问题。
Nano Banana 2：速度与质量兼备
在峰会上，谷歌发布了Nano Banana 2，这款产品结合了专业级图像质量和快速处理能力。用户现在可以在Gemini应用和Google Search等产品中获得高质量的图像生成结果，并且享受更快的速度。
此外，谷歌还继续优化SynthID工具，以帮助识别AI生成的内容。开发者可以利用Nano Banana 2构建复杂的视觉创作，并在不牺牲性能的情况下大规模部署。
音乐创作的新利器：Lyria 3
Lyria 3是谷歌最新发布的音乐生成工具，用户可以通过描述一个想法或上传图片/视频来创建30秒的原创曲目，并自动生成定制封面艺术。谷歌还分享了六项使用技巧以帮助用户更好地掌握这项技术。
此外，ProducerAI也加入了Google Labs平台，它可以帮助用户从创意到完成音乐作品。
Flow中的创新应用
在流媒体编辑工具Flow中，谷歌整合了多项顶级的人工智能技术。现在，用户可以在同一个工作空间内生成、编辑和动画化图像与视频，从而创建高质量的图像，并将其用作视频生成的基础。
通过这些创新成果，谷歌不仅展示了其在人工智能领域的最新进展，同时也强调了AI如何为不同行业带来积极影响。无论是科研人员、创业者还是奥运运动员，都可以借助这些技术实现自己的目标。
🔗 来源：The latest AI news we announced in February (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:573天前

0篇意见
2次查看

摘要
随着科技的不断进步，人工智能（AI）在游戏开发中的作用日益显著。在今年的Google I/O 2026开发者大会上，AI技术将成为游戏展示的核心元素之一。本次报道将深入探讨AI如何通过Gemini模型影响游戏设计与内容创作，并介绍在“Save the Date”活动中是如何利用这些技术来提升玩家体验。
一、AI在Google I/O 2026中的重要性
Google I/O大会是谷歌展示最新技术和产品的重要平台。今年的会议将于5月19日至20日在硅谷举行，众多开发者和科技爱好者将汇聚一堂。为了进一步提升参会者的体验，在活动启动之前，主办方特别安排了“Save the Date”谜题游戏。
二、AI融入游戏设计
在这些游戏中，Gemini模型发挥了关键作用。从代码生成到实时内容创作，Gemini通过多种方式助力游戏开发。例如，“Supersonic Bot”是一个基于语音控制的游戏，玩家通过调整音量帮助Android Bot飞行。而在“Hole in one”迷你高尔夫游戏中，AI caddy会根据玩家的打法提供个性化建议。
三、个人Chrome Dino奖励
完成所有五个游戏的挑战后，参与者将获得一个独特的个人奖励——一个具有个性化的虚拟Chrome恐龙。在“Dino Pal”游戏中，Gemini为每位玩家生成了独一无二的小恐龙，并根据玩家的游戏风格进行个性化调整。
四、AI Studio与开发者社区
为了鼓励更多开发者的参与和创新，“Save the Date”活动还提供了AI Studio平台。在这里，开发者可以探索游戏背后的代码，对其进行修改并创造全新的作品。这种开放性使得更多的创意得以实现。
结语: 通过这样的活动，Google不仅展示了其在人工智能领域的最新进展，也激发了更多人对创新技术的兴趣与热情。随着AI技术的不断进步，我们有理由相信，在未来的游戏中将出现越来越多令人惊叹的作品。
🔗 来源：Play AI-based games in our I/O Save the date (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:563天前

0篇意见
2次查看

2026年3月6日
自去年SpeciesNet开源以来，越来越多的人利用人工智能技术识别动物并了解其栖息地，促进全球的野生动物监测和保护。
SpeciesNet是一款开源AI模型，有助于保护区工作人员在相机陷阱照片中识别动物。自推出以来，研究团队利用它更快地分析数据。例如，Snapshot Serengeti项目和澳大利亚野生动物观测站都在使用SpeciesNet监控野生动物行为并保护濒危物种。
“如何通过开源AI模型SpeciesNet推动野生动物保护”解释了人工智能如何帮助野生动物研究。
这种AI模型能够识别几乎2,500种动物类型，大大节省研究人员的时间。例如，坦桑尼亚的Snapshot Serengeti项目使用SpeciesNet分析了1100万张照片，加速了关键的研究工作。在哥伦比亚和澳大利亚等地，SpeciesNet帮助监控野生动物的变化并保护独特的当地物种。
使用SpeciesNet工具可以研究野外相机拍摄的照片，并识别其中的动物种类。这为研究人员节省了大量的时间，使他们能够更好地了解和保护野生动物。世界各地的研究小组都在利用它来追踪动物及其行为。
从哥伦比亚森林中黎明时分徘徊的美洲豹到澳大利亚漫步的驼鸟，运动触发的相机提供了前所未有的视角，让我们了解到当人类不在场时动物的行为。但对于野生动物管理者、生物学家和保护人员来说，将数百万张这些未加工的照片转化为可操作的数据极其耗时。这就需要SpeciesNet。
SpeciesNet是经过训练自动识别近2,500种哺乳动物、鸟类和爬行动物类别的AI模型。自2019年起通过野生动物洞察平台提供使用，我们于一年前将其作为免费开源工具推出，今天，研究小组利用它比以往任何时候都更快地处理相机陷阱数据。
这些照片展示了2024年捕获的动物影像：一群夜间活动的大象、一只雄狮、一匹侧影中的斑马以及似乎在观看相机的一只疣猪。图片来源：Snapshot Serengeti；T.M. Anderson
在非洲，自2010年起， Snapshot Serengeti项目与坦桑尼亚野生动物研究所合作，在坦桑尼亚塞伦盖蒂国家公园运营着相机陷阱。起初项目招募了线上志愿者进行图像分析，但很快因照片数量过多而无法处理。项目负责人、北卡罗来纳州韦克森林大学的 Todd Michael Anderson 使用SpeciesNet对1100多万张历史数据进行了分析，在短短几天内完成了几十年的数据工作。该项目正在通过这些图像获得非洲最生物多样的地区之一的长期动物行为和丰富度视图。
这些照片拍摄于2025年3月至5月，展示了美洲豹（一种在中美洲和墨西哥南部濒临灭绝的小型野生猫科动物）和一只美洲狮（也被称为山猫或美洲虎）。图片来源：Project Lucitania/Universidad de los Andes/Red Otus
在哥伦比亚，我们长期合作的胡姆霍尔德研究所利用SpeciesNet作为野生动物洞察平台的一部分。该机构监测着许多生活在哥伦比亚亚马逊雨林中的物种，这是一个高度生物多样化的地区，正经历快速变化。最近，该团队通过启动一个全国性的网络Red Otus来扩大了规模，该网络在公共和私人土地上捕捉相机陷阱图像。
物种保护不仅需要技术的进步，还需要全球合作与努力，这些项目为实现这一目标提供了实际案例。
🔗 来源：How our open-source AI model SpeciesNet is helping to promote wildlife conservation (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:553天前

0篇意见
2次查看

3月10日，2026年，《如何利用AI提升英国乳腺癌检测》的报道揭示了人工智能（AI）在英国乳腺癌筛查中的巨大潜力。该研究由我们与伦敦帝国理工学院和英国国民医疗服务体系(NHS)合作进行。
研究表明，AI可以准确识别癌症并减轻放射科医生的工作负担。然而，要实现这一目标，需要进一步的研究来建立医疗专家与AI之间的信任。
研究发现
我们的实验表明，在一项与Google、帝国理工学院和NHS合作的项目中，AI系统能够识别出传统方法未能检测到的25%“间隔期”乳腺癌。同时，AI可以减少放射科医生的工作量约40%，使他们能够专注于复杂病例。
尽管AI在某些情况下被专家推翻了诊断结果，这表明需要进一步建立对AI诊断的信任机制。此外，AI系统需根据每个医院的流程、设备和患者的具体情况进行精细校准。
乳腺癌的影响
英国大约每八名女性中就有一人会患上乳腺癌。早期发现对于提高治愈率至关重要。近日，在Nature Cancer上发表的研究结果显示，通过AI技术可以显著改善乳腺癌检测方法，并进一步推动筛查技术的发展。
研究细节
在一项包含125,000名女性的实验中，我们的AI系统成功识别了之前常规筛查未能发现的25%“间隔期”乳腺癌。此外，AI还发现了更多的侵袭性癌症和总体更多数量的癌症，并且减少了初次筛查中的假阳性结果。
通过证明AI单凭自身即可实现高精度后，我们进一步研究了AI能否帮助放射科医生节省时间用于患者护理的问题。通过对超过50,000名女性的乳腺扫描进行测试，结果显示在工作流程中使用AI作为“第二阅读者”可以减少约40%的工作量。
这项研究强调了AI辅助筛查的优势，但真正考验在于医疗专业人员如何实际对待由AI驱动的诊断结果。为解决这一问题，我们需要深入了解整个临床路径，并进一步探索和优化AI与人类专家之间的协作机制。
🔗 来源：How AI can improve breast cancer detection in the UK (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:543天前

0篇意见
3次查看

2026年3月10日
对于使用Google AI Ultra和Pro订阅的用户来说，一项新的创新正在到来——Gemini正在与Google的文档(Docs)、电子表格(Sheets)、幻灯片(Slides)和云端存储(Drive)集成，使您的工作更加高效。
无论是起草报告还是组织活动，开始总是最困难的部分。现在，Gemini在Docs、Sheets、Slides和Drive中的新功能将帮助您更快地完成任务，并且更个性化、更有协作性。
Gemini in Docs：写作伙伴
Gemini in Docs不仅能够帮助您根据文件和电子邮件中的相关资料创建文档，还能让您使用新的编辑功能进行润色。通过“Match doc format”功能，您可以自动将文档风格统一到参考文档中。
例如，您可以从上一季的笔记转化出一个现成的教练计划，并调整引言部分的语气以使其更加温暖和欢迎。
Gemini in Sheets：协作伙伴
Gemini在Sheets中的表现达到了最新技术水平。它可以帮助您构建自定义、可视化的电子表格，从基础任务到复杂的数据分析，只需描述您的需求即可。
“Fill with Gemini”功能可以让您更快地填充表格，甚至可以自动填充汇总的、分类的信息或全新的数据，例如将财务数据进行分类以更轻松地跟踪收入和支出。
Gemini in Slides：设计伙伴
Gemini在Slides中的新功能让设计变得更加简单。它可以根据您提供信息生成专业的布局、可编辑的图表以及完整的演示文稿，帮助您专注于讲述故事。
例如，您可以要求Gemini根据提供的信息起草一张新的幻灯片——比如一个“生活更新”幻灯片，用以下次闺蜜聚会。
Gemini in Drive：您的智能文件助手
Google Drive不仅仅是存储文件的地方，它现在还可以帮助您从文件中获取洞见。使用“Ask Gemini”，您可以快速找到所需的内容，并立即理解信息的含义。
无论是准备研究论文还是组织小组项目，Gemini都可以帮助您定位文件并回答复杂的问题。
这些新功能将首先向Google AI Ultra和Pro订阅用户推出。现在就尝试这些新功能吧！
🔗 来源：New ways to create faster with Gemini in Docs, Sheets, Slides and Drive (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:543天前

0篇意见
2次查看

今天，我们宣布了谷歌Sheets中Gemini的新Beta功能。这些新特性旨在帮助用户从基本任务到复杂数据的分析，只需描述您的需求即可进行创建、组织和编辑工作表。
Gemini在Sheets中的最新进展尤其值得关注。它已经达到了业内顶尖水平，在处理“SpreadsheetBench”公开基准测试集中的复杂真实世界电子表格时自主操作表现卓越。这一基准测试集评估模型在实际场景中修改电子表格的能力，Gemini实现了70.48%的成功率，不仅超越了竞争对手，甚至接近人类专家的能力。
“我们期待看到您如何使用这些新功能。”谷歌表示，并邀请用户探索更多关于Gemini在Sheets、Drive、Docs和Slides中的全面更新。欲了解更多信息，请参阅我们的关键词文章和Google Workspace公告。
这一进展标志着智能办公技术的新时代，让我们保持联系，获取来自Google的最新资讯，让创新引领未来。
🔗 来源：Gemini in Google Sheets just achieved state-of-the-art performance. (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:533天前

0篇意见
2次查看

3月10日，谷歌宣布推出Gemini Embedding 2，这是首个原生多模态嵌入模型。它能够将文本、图像、视频、音频和文档映射到单一的嵌入空间中，实现不同媒介类型的跨媒体检索与分类。
该模型基于Gemini架构，在公开预览版中通过Gemini API及Vertex AI提供服务。相较于之前的纯文本基础模型，Gemini Embedding 2能够将多种模态的数据（包括文本、图像、视频、音频和文档）整合到一个统一的嵌入空间，并且涵盖超过100种语言的语义意图。
这种单一嵌入空间的设计简化了复杂的工作流，并增强了各种多模态下游任务的表现，比如检索增强生成（RAG）、语义搜索、情感分析和数据聚类。模型的核心理念是能够同时理解和处理多种信息输入，这意味着用户可以在一次请求中传递多个模态的数据（例如：图像+文本），从而更好地捕捉不同媒介之间的复杂关系。
此外，Gemini Embedding 2采用了名为Matryoshka Representation Learning (MRL)的技术，该技术通过动态调整维度实现信息的嵌套式表示。这使得开发者可以根据性能和存储成本的需求选择不同的输出维度：默认为3072维度，也可选1536或768维度以获取最高质量的结果。
为了直观展示模型的功能，谷歌提供了轻量级多模态语义搜索演示应用。此外，Gemini Embedding 2在技术上不仅超越了现有的单一模态嵌入模型，在文本、图像和视频任务中也表现出更强的语音处理能力，并在多项指标上领先于竞争对手。
借助这一创新技术，谷歌合作伙伴已经能够开发出高质量的多模态应用程序。Gemini Embedding 2的应用范围广泛，从检索增强生成到大规模数据管理以及经典搜索和分析任务中都能发挥重要作用。用户可以通过Gemini API或Vertex AI开始使用该模型，并通过互动式Gemini API和Vertex AI Colab笔记本进一步学习其用法。
目前，Gemini Embedding 2已经集成到了多个开发框架中，包括LangChain、LlamaIndex、Haystack、Weaviate、QDrant、ChromaDB以及向量搜索工具等。通过赋予我们周围各种数据以语义意义，Gemini Embedding 2为下一代高级AI体验奠定了必要的多模态基础。
更多关于谷歌最新动态，请关注我们的邮件通知。
🔗 来源：Gemini Embedding 2: Our first natively multimodal embedding model (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:523天前

0篇意见
2次查看

OpenAI，一家非盈利的人工智能研究公司，自成立以来便秉承着为全人类谋福利的理念。其主要目标在于推动数字智能的发展，在不追求财务回报的前提下开展研究工作。
与其他可能受到商业利益驱动的研究机构不同，OpenAI的运作模式更加灵活、开放。由于无需承担任何财务负担，该组织可以更专注于对人类社会产生积极影响的研究方向。这不仅有助于促进技术创新，还有助于确保技术进步能够惠及所有人群，而非仅仅少数几家大公司或特定国家。
总之，OpenAI致力于通过负责任地开发和应用人工智能技术来推动全人类的福祉和发展。
🔗 来源：Introducing OpenAI (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:523天前

0篇意见
2次查看

在科技与财经交汇的前沿，一项具有划时代意义的技术正逐渐走近我们——开放人工智能研究中心（OpenAI）宣布推出其公共测试版工具包Gym。这一工具包旨在为开发和对比强化学习（Reinforcement Learning, RL）算法提供一个标准化平台。
什么是OpenAI Gym？
Gym并非一项单一的技术突破，而是一个囊括了多种环境的综合实验平台。它包含了从模拟机器人到Atari游戏的各种挑战性任务，为研究人员和开发人员提供了一个理想的场所来测试他们的算法，并在广泛的场景中进行比较。
强化学习的重要性
强化学习是一种机器学习方法，通过让智能体与环境互动并在过程中不断学习和改进策略。这一领域不仅涉及游戏、机器人技术等应用层面的突破，还推动了人工智能理论的进步。OpenAI Gym的推出，标志着在这一领域的研究迈出了重要一步。
开放与合作
Gym的一个显著特点是它的开放性。通过提供一个统一的平台来比较不同算法的结果，它鼓励了学术界和工业界的广泛参与与合作。不仅限于此，Gym还为研究人员提供了丰富的资源库，包括各种预设环境以及详细的文档说明。
未来展望
随着OpenAI Gym正式进入公共测试阶段，我们有理由相信，这一工具包将在促进强化学习技术进步方面发挥关键作用。它不仅将加速现有算法的发展和完善，还可能催生新的研究方向和应用领域。
总之，OpenAI Gym的发布标志着人工智能研究的一个重要里程碑，它为深化对强化学习机制的理解、推动技术创新乃至最终实现更为智能的社会系统提供了前所未有的机会。
🔗 来源：OpenAI Gym Beta (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:513天前

0篇意见
2次查看

本文将介绍四个具有共同主题的项目，这些项目都涉及到增强或利用生成模型。生成模型是机器学习中无监督学习技术的一个分支，在数据建模和创意生成方面展现出巨大潜力。通过这篇文章，我们将深入探讨生成模型的本质、重要性及其未来的发展方向。
首先，让我们来了解一下什么是生成模型。生成模型是一种能够创建与训练集中分布相似的新样本的机器学习方法。它不同于传统的分类或回归任务，而是专注于从给定的数据分布中生成新的数据实例。这种模型在图像、文本和音频等领域的创新应用尤为突出。
接下来，我们来看一下这些项目是如何利用生成模型进行创新的。第一个项目旨在通过生成模型优化虚拟现实体验，为用户提供更加逼真的视觉效果；第二个项目致力于使用生成模型提高医疗影像诊断的准确性和效率；第三个项目则探索了如何将生成模型应用于创意产业，以创造出独特的艺术作品；最后一个项目则是针对环境科学领域，利用生成模型进行气候变化预测和生态系统的模拟。
为什么生成模型如此重要？一方面，它能够帮助我们更好地理解和建模现实世界的数据分布。另一方面，在人工智能的诸多应用场景中，生成模型可以为用户提供更加丰富多样的选择，并推动创意产业的发展。未来，随着技术的进步和研究的深入，生成模型有望在更多领域发挥重要作用。
总之，通过这些项目的探讨，我们可以看到生成模型在多个领域的创新应用前景广阔。从虚拟现实到医疗诊断，再到艺术创造与环境科学等领域，生成模型正逐步改变我们对世界的认知方式。未来，随着技术的不断进步和研究的深入发展，生成模型将在更多领域发挥更大的作用。
🔗 来源：Generative models (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:503天前

0篇意见
2次查看

在科技与经济交织的今天，人工智能（AI）技术的发展正以前所未有的速度改变着人类社会。作为全球领先的非营利性研究组织之一，OpenAI自成立以来便致力于探索并实现其独特的技术目标。
OpenAI的技术目标可以概括为两个核心方面：
安全至上: 在AI研发过程中，OpenAI始终将“安全性”放在首位。这不仅意味着确保AI系统本身的安全性（如防止意外伤害或误操作），还涵盖了对社会层面的潜在风险进行深入研究和管理。通过严格的伦理审查、透明度原则以及与其他组织的合作，OpenAI努力构建一个可靠且负责任的人工智能生态系统。普惠共享: OpenAI致力于让人工智能技术惠及尽可能广泛的人群，并确保其利益能够公正地分配给社会各个阶层。这意味着在推动技术创新的同时，也会积极寻求降低技术门槛、提高可访问性的方法，使得不同背景的个体和组织都能够从中受益。总之，OpenAI的技术追求体现了对未来科技发展负责任的态度：致力于打造既安全又公平的人工智能世界，让科技进步真正造福全人类。
🔗 来源：OpenAI technical goals (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:503天前

0篇意见
2次查看

近日，我们（及其他来自加州大学伯克利分校和斯坦福大学的研究人员）与谷歌大脑团队共同撰写了一篇重要论文——《AI安全中的具体问题》。这篇研究文章深入探讨了确保现代机器学习系统按预期运行的一系列关键性科研难题。
随着人工智能技术的迅猛发展，其在各个领域的应用越来越广泛。然而，随之而来的安全性和可靠性问题也引起了广泛关注。本文的核心在于识别并分析当前机器学习系统中存在的潜在风险与漏洞，并提出可能的解决方案。
具体而言，《AI安全中的具体问题》一文详细列举了以下几方面的研究重点：
偏见和不公平性: 现代机器学习模型有时会因训练数据的偏见而产生不公平的结果。文章探讨了如何通过改进算法设计来减少此类偏差。对抗样本攻击: 机器学习系统的防御能力成为研究热点之一，尤其是对抗那些精心设计的小扰动输入（即对抗样本）以误导模型的行为。该文提出了多种检测和防范策略。可解释性与透明度: 提高AI决策过程的可理解性和透明度是构建公众信任的关键。文章探讨了不同方法如何增强模型的解释性。鲁棒性问题: 针对环境变化或意外输入，机器学习系统的稳定性成为关键考量因素。本文研究了提升系统鲁棒性的策略与技术。总之，《AI安全中的具体问题》不仅为学术界提供了宝贵的参考材料，也为工业界和政策制定者提出了切实可行的建议。随着人工智能技术不断进步，此类研究对于确保其长期健康发展具有重要意义。
🔗 来源：Concrete AI safety problems (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:493天前

0篇意见
2次查看

在当今科技日新月异的背景下，人工智能（AI）领域的研究正在不断突破传统界限。一项来自国际顶尖科研团队的研究成果——RL²，正引领着强化学习技术的新方向。

强化学习是一种机器学习方法，通过让算法在特定环境中执行任务并根据其行为的后果进行奖励或惩罚来训练模型。传统的强化学习面临着一个显著挑战：当环境复杂度增加时，学习过程往往变得缓慢且容易陷入局部最优解。RL²正是针对这一问题提出的一种创新解决方案。
RL²：慢中求快的新策略

RL²的核心理念是通过“缓慢强化学习”的方式来加快整体的学习速度。具体而言，它并不是直接在主任务上进行快速迭代优化，而是先在一个简化版的环境中或使用一种更简单、参数较少的模型进行长时间的训练。这种策略看似与直觉相悖——为何要选择一个更为简单的环境和模型？但实际上，通过这种方式，学习过程能够更加稳定，并且能从更多样化的角度探索潜在解空间。
当主任务中遇到复杂情况时，RL²会将之前在简化环境中学到的知识迁移到主任务上。在这个过程中，虽然初始阶段看起来进展缓慢，但长期来看，这种方法能够显著提高学习效率和成功率。

这一研究不仅展示了强化学习技术的新颖应用路径，也为解决复杂问题提供了一种全新的思考角度。从自动驾驶、机器人控制到游戏策略优化等领域，RL²都有广阔的应用前景。
值得注意的是，尽管RL²已经在多个模拟实验中取得了令人鼓舞的结果，但其实际应用尚需进一步验证和完善。未来的研究方向将不仅限于算法本身的优化，还包括如何在具体应用场景中更好地结合和利用这一方法。
总之，RL²的出现为强化学习领域带来了全新的可能性。我们有理由期待，在不久的将来，这项技术将在更多实际问题上展现出其独特的优势，并推动整个AI行业向前发展。

🔗 来源：RL²: Fast reinforcement learning via slow reinforcement learning (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:483天前

0篇意见
3次查看

在当今快速发展的科技和财经领域，人工智能（AI）技术正以前所未有的速度改变着我们的生活。而在众多的AI分支中，生成对抗网络（GANs）、逆强化学习（IRL）以及能量模型（Energy-based Models, EBM）尤其引起了广泛关注。本文将深入探讨这三者之间的联系及其在实际应用中的潜力。
1. 生成对抗网络（GANs）
生成对抗网络由Ian Goodfellow等人于2014年提出，是一种基于博弈论原理的深度学习模型。其核心思想是通过两个神经网络之间的竞争来生成逼真的数据样本。一个生成器负责创建尽可能接近真实数据的新样本；另一个判别器则评估这些样本的真实性。两者的较量使得生成的数据质量不断提高。
2. 逆强化学习（IRL）
逆强化学习是机器学习领域中的一个分支，专注于从观察到的行为中推断出奖励函数或目标函数的过程。这种技术常用于解决那些缺乏明确奖励信号的任务环境下的问题，如游戏策略研究或是复杂行为的模拟。
3. 能量模型（EBM）
能量模型是一种基于概率模型的方法，通过定义一个能量函数来描述样本数据之间的差异和相似性。这类模型通常用于图像识别、语音处理等任务中，因其能够提供对模型内部状态的直观理解。
三者的关系
虽然GANs、IRL和EBM看似是独立的技术领域，但它们之间存在着密切的联系。例如，在使用逆强化学习时，有时会结合能量模型来定义奖励函数；而生成对抗网络也可以通过引入能量概念进行改进。
应用前景
这些技术在多个行业都有着广泛的应用前景，包括但不限于：医疗健康（如疾病诊断、个性化治疗计划）、金融服务（风险评估与预测模型构建）、自动驾驶汽车（环境感知和路径规划）等。随着研究的不断深入和技术的进步，未来它们将在更多领域展现出巨大的价值。
总之，生成对抗网络、逆强化学习以及能量模型是当前AI研究中的重要组成部分，它们之间的相互作用和发展趋势将对整个技术生态产生深远影响。
🔗 来源：A connection between generative adversarial networks, inverse reinforcement learning, and energy-based models (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:483天前

0篇意见
2次查看

在当前人工智能飞速发展的时代，解码生成（Decoder-Based Generative Models）作为生成对抗网络和变分自编码器等领域的关键技术，正逐渐成为研究热点。本文将基于On the quantitative analysis of decoder-based generative models一文，对这类模型进行深度剖析。
1. 解码生成模型的定义与分类
解码生成模型是一种通过学习从潜在空间到观察空间的映射来生成数据的技术。这类模型通常包括编码器和解码器两大部分，其中解码器负责将潜在向量转换为真实样本。
2. 解码生成模型的关键技术
潜在空间：潜在空间的结构与维度直接影响着模型生成数据的质量。深入研究不同潜在空间的设计，可以提升生成模型的表现力。解码器设计：优秀的解码器设计能够有效提高生成样本的真实性和多样性。文中介绍了几种常见的解码器架构及其优缺点。损失函数选择：合理的损失函数能够更好地指导模型学习，包括像素级损失、对抗损失等，均在文中进行了详细探讨。正则化技术：为了防止过拟合和提高生成样本的一致性，研究者们提出了多种正则化方法，如数据增广、噪声注入等。 3. 定量分析的意义与挑战
定量分析对于解码生成模型而言非常重要。通过数学手段对模型性能进行评估，有助于发现现有方法的不足之处，并为后续研究提供依据。
然而，在实际操作中，仍面临许多挑战：
- 数据集选择与标注
- 评估指标的选择和优化
- 实验设计的复杂性
4. 结语
综上所述，《On the quantitative analysis of decoder-based generative models》一文为解码生成模型的研究者们提供了一个全面而深入的认识框架。通过不断探索和优化，我们有理由相信，在不久的将来，解码生成技术将更好地服务于实际应用。
🔗 来源：On the quantitative analysis of decoder-based generative models (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:473天前

0篇意见
2次查看

近日，科技和财经界的瞩目焦点再次聚焦于人工智能领域。OpenAI与全球领先的云计算服务提供商微软（Microsoft）携手宣布，将开始在其主要的实验中使用微软的Azure云平台。
1. 合作背景
自2019年成立以来，OpenAI一直致力于推动人工智能技术的发展。近期，随着大型语言模型和生成式人工智能的发展，对计算资源的需求急剧增加。此时，微软作为云服务的领导者，成为OpenAI的理想合作伙伴。
2. Azure平台的优势
Azure提供了一流的基础设施和服务，能够满足大规模实验的要求。包括高扩展性、高性能和高度的安全性，确保用户在进行复杂计算时能够保持数据安全与稳定运行。
3. 合作的意义
此次合作不仅标志着OpenAI在其技术开发过程中迈出了关键一步，也是微软进一步巩固其在人工智能和机器学习领域的领先地位的重要举措。通过这次合作，Azure云平台将能够进一步积累大规模模型训练的经验，并优化相关服务。
4. 展望未来
随着更多创新技术的出现，OpenAI与微软的合作将继续推动人工智能领域的发展。双方计划共同探索新的应用场景和技术解决方案，为全球科研机构和企业提供更强大的技术支持和服务保障。
此次合作不仅将加速人工智能技术的进步，也为云计算服务提供商带来了更多展示自身实力的机会。在未来的日子里，我们可以期待看到更多类似的跨界合作，共同推动科技与经济的繁荣发展。
🔗 来源：OpenAI and Microsoft (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:463天前

0篇意见
2次查看

近日，一个旨在衡量和训练人工智能（AI）普遍智能能力的新平台——Universe宣布面世。该平台将使开发者能够将其算法应用于各类游戏、网站及其他应用程序中。
随着人工智能技术在各个行业中的应用越来越广泛，如何准确地评估AI的通用智能成为了业界关注的一个焦点问题。Universe正是在这个背景下诞生的。
据开发团队介绍，Universe平台的核心优势在于其能够跨越各种类型的应用环境进行测试和训练，这包括但不限于游戏、网络应用以及其他形式的互动软件。通过这种方式，开发者可以更全面地评估AI系统的综合性能，并针对不同的应用场景优化算法。
“我们相信，只有在一个多样化的环境中对AI进行广泛的测试与训练，才能真正实现其通用智能的发展。”Universe的项目负责人表示，“这也是为什么我们将平台命名为‘Universe’——它意在反映我们的目标是探索和构建一个更加广泛、包容的人工智能生态系统。”
此外，该平台还采用了先进的机器学习算法来自动评估AI的表现，并提供详细的报告以供开发者参考。这不仅简化了开发流程，也为研究人员提供了宝贵的数据支持。
“我们期待与全球的研究机构和企业合作，共同推动人工智能技术的进步。”该项目负责人进一步表示，“Universe的愿景是成为连接学术界、工业界乃至公众的一个桥梁，通过开放共享的方式促进技术创新和发展。”
🔗 来源：Universe (AI 严选)

由 z2，在Industry News 行业资讯， · 周二 18:463天前

0篇意见
2次查看

AIGC Insights (AIGC 观察)

小鹏汽车：从造车企业到超级智能体的跨越

上海交大教授创业，用AI研发新材料：索格智算完成超千万元种子轮融资

国家互联网应急中心发布OpenClaw安全应用风险提示

智能音乐革命：拿火音乐如何在海外市场大放异彩

中国科技企业纷纷布局AI领域：腾讯养虾矩阵成型，百度恢复全无人测试

Google推出AI模式Canvas：创意写作与编程项目的新天地

NotebookLM推出全新Cinematic视频概述：打造沉浸式学习体验

2月全球科技焦点：Google最新AI进展与应用

Google I/O 2026: AI-Powered Games and Gemini's Role in Revolutionizing Game Design

如何通过开源AI模型SpeciesNet推动野生动物保护

AI在英国乳腺癌检测中的应用：提高早期诊断与减轻放射科医生工作负担

Gemini在Google Workspace中的新功能：加速您的文档、表格和演示

Google Sheets Gemini 达到业内顶尖水平，开启智能办公新时代

Gemini Embedding 2: 开创性多模态嵌入模型的发布

OpenAI：致力于全人类福祉的非营利人工智能研究机构

OpenAI Gym Beta发布：推动强化学习算法革新

科技财经深度解读：生成模型在四大项目中的创新应用

深度解析OpenAI的技术目标：安全至上，普惠未来

深度解析《AI安全中的具体问题》：Google脑计划与顶尖科研机构携手共探机器学习系统安全

RL²：通过缓慢强化学习实现快速学习

生成对抗网络、逆强化学习与能量模型：三者的联系与创新

解码生成模型的定量分析：揭秘AI创造力背后的数学逻辑

OpenAI与微软合作：大规模试验转向Azure云平台

Universe：打造全球通用智能的软件平台

类别

我的帐户

导航

搜索

配置浏览器推送通知

Chrome (安卓)

Chrome (台式电脑)

Safari (iOS 16.4+)

Safari (macOS)

Edge (安卓)

Edge (台式电脑)

Firefox (安卓)

Firefox (台式电脑)