Industry News 行业资讯
Breaking news and updates from global AI giants. | 追踪全球 AI 巨头的最新动态。
1089篇记录在此类别
-
周五,Peak XV 宣布其新成立的印度和亚太地区基金已筹集到13亿美元。作为一家管理超过100亿美元资产的公司,Peak XV 正在进一步加强其在人工智能领域的投入,并寻求跨境合作机会。此次资本将主要用于其印度种子期和风险投资基金以及APAC基金。 据峰维XV(Peak XV)的高级合伙人辛格表示,该公司目前管理超过450家初创企业,涵盖了金融科技、软件及消费互联网等多个领域,从种子阶段到成长阶段都有涉及。这笔新资金是在印度新德里举办的人工智能影响峰会之际筹集的,吸引了包括OpenAI、Anthropic和谷歌在内的众多科技巨头。 辛格表示,峰维XV并不试图与竞争对手进行逐美元的竞争,而是将重点放在产生强劲回报上。他强调,公司会根据最佳机会来调整基金规模,目前该公司正在美国市场建立存在感,并在竞争时采取谨慎态度。“在美国市场,我们是不被看好的一方——这是件好事。”辛格说,“我们将专注于软件、开发者工具和金融科技领域,这些是我们有优势的领域。” 峰维XV最新的基金筹集活动是在公司内部领导层调整后进行的。最近一些高级合伙人离开了公司,包括资深合伙人阿希什·阿格拉瓦尔以及投资者
- 0 篇意见
- 14 次查看
-
为了吸引更多的AI投资到该国,印度正举办为期四天的AI影响峰会。本次峰会有来自各大人工智能实验室和科技巨头的高管参加,包括OpenAI、Anthropic、Nvidia、Microsoft、Google以及Cloudflare等公司,同时还有政府领导人出席。 预计有250,000名访客参与此次活动。Alphabet CEO Sundar Pichai、OpenAI CEO Sam Altman、Anthropic CEO Dario Amodei、Reliance Chairman Mukesh Ambani以及Google DeepMind CEO Demis Hassabis都将参加此次峰会。 印度总理Narendra Modi计划在周四与法国总统Emmanuel Macron共同发表演讲。 以下是峰会的关键更新: 12月14日:模型、产品、影响——今天带来一些不同且非常不同的内容。我们正在推出Sarvam Kaze,这是我们向您提供本地化AI模型的尝试——这些设备在这里印度设计和制造! 其他新闻包括: Meta的研究表明:家长监督并不能有效遏制青少年沉迷社交媒体。 Ricursi
- 0 篇意见
- 68 次查看
-
全球最大的创投基金之一,总部位于硅谷的General Catalyst,在过去两年不到的时间里,刚刚合并了本地创投公司Venture Highway之后,便宣布将在接下来的五年中投入50亿美元进入印度市场。 这一承诺是在新德里举行的India AI Impact Summit上宣布的。General Catalyst的投资将覆盖人工智能、医疗健康、国防技术、金融科技和消费科技等领域。相较于此前为其在印投资预留的资金量(5亿至10亿美元),本次的投入可谓是大幅增加。 印度,作为世界上人口最多的国家之一,并且拥有超过10亿的互联网用户,正逐渐成为全球重要的AI投资目的地;而新德里也计划在未来两年内吸引200多亿美元的AI基础设施投资额。General Catalyst的首席执行官Hemant Taneja表示:‘印度将培育出下一代全球平台公司’。 在演讲中,Taneja还提到:General Catalyst认为印度最大的AI机会在于大规模的实际应用,而不是所谓的前沿模型;这主要是因为其政府建设的支持性数字基础设施、庞大的本土市场和深度的服务人才库。而这一投资计划也印证了全球科技巨头们对印
- 0 篇意见
- 56 次查看
-
Nvidia 正在加大努力,更早在初创企业的生命周期内接触印度的人工智能公司。本周宣布的一系列合作伙伴关系旨在让潜在客户与该公司建立联系,这些潜在客户正来自世界最快增长的开发市场之一。 最新的举措是通过与早期风险投资公司 Activate 的合作实现的,该合作计划从 7500 万美元首期基金中支持约25到30家人工智能初创企业,并为初创企业提供优先访问 Nvidia 技术专长的机会。这项合作紧随本周其他印度市场重点工作的发布之后,包括与非营利组织 AI Grants India 的合作以支持早期创始人以及与专注于南亚国家的风投公司建立新的联系。 这些举措正值印度在新德里举办人工智能影响峰会(AI Impact Summit),吸引了包括 OpenAI、Anthropic 和 Google 等顶级科技公司的参与。Nvidia 首席执行官 Jensen Huang 本应参加此次事件,但由于公司所说的不可预见的情况未能出席。一位高级代表团由执行副总裁 Jay Puri 领导代替出席,在现场与人工智能研究者、初创企业、开发人员和合作伙伴进行了会面。 印度已成为最快增长的人工智能开发
- 0 篇意见
- 55 次查看
-
Google 在本周四发布了其最新版本的 Gemini Pro,这是一款强大的语言模型(LLM)。新推出的 Gemini 3.1 版本目前仅作为预览版提供,不久将正式发布。据 Google 称,这款新版模型可能是迄今为止最强大的 LLM。 观察者们指出,Gemini 3.1 Pro 在功能上比其前一个版本 Gemini 3 显著提升,后者在去年十一月推出时已经被认为是一款非常有能效的人工智能工具。本周四,Google 还公布了来自独立基准测试数据(如 Humanity’s Last Exam)的统计结果,显示新模型的表现远远超过了之前的版本。 AI 初创公司 Mercor 的 CEO Brendan Foody 也对 Gemini 3.1 Pro 表示赞赏。其公司的基准系统 APEX 是为了衡量新 AI 模型在现实专业任务中的表现而设计的。Foody 在社交媒体上表示,Gemini 3.1 Pro “现在位于 APEX-Agents 领导板的首位”,并强调这一模型取得的出色成绩表明“代理人工智能正在迅速提高其实际知识工作的能力。” 如今,随着 AI 模型之间的竞争愈演愈烈,科技公司们继
- 0 篇意见
- 60 次查看
-
在客厅内的对话式AI竞赛中,YouTube成为最新一家将其工具扩展到智能电视、游戏机和流媒体设备上的公司。 这项实验性功能此前仅限于移动设备和网页,现在可以直接将对话式AI带到家庭中的大屏幕上,让用户无需离开正在观看的视频即可询问内容相关的问题。根据YouTube的支持页面,符合条件的用户可以点击他们在电视屏幕上的“问”按钮来召唤AI助手。此功能会基于当前播放的内容提供推荐问题,或者用户可以通过遥控器的麦克风按钮直接提问与视频相关的任何信息。 例如,他们可能会询问食谱所需的原料或歌曲歌词的背后故事,并且可以在不暂停或离开应用的情况下立即获得答案。目前,该功能仅对18岁及以上的部分用户可用,并支持英语、印地语、西班牙语、葡萄牙语和韩语。 YouTube最初于2024年推出了这一对话式AI工具,旨在帮助观众更深入地探索内容。随着越来越多的美国人通过电视访问YouTube,这种技术变得越来越重要。尼尔森在2025年4月的一项报告显示,YouTube占据了12.4%的电视观众时间,超过了迪士尼和Netflix等主要平台。 其他公司也在其对话式AI技术方面取得了显著进展。亚马逊推出了Al
- 0 篇意见
- 59 次查看
-
随着人工智能公司价值和应用的不断增长,关于AI是否会替代人类在各种岗位上工作的争论也变得越来越频繁。研究表明,在许多可以被自动化执行的任务中,AI将对这些职位造成影响;而一些分析师则认为,AI可能也会创造新的工作岗位,并且这种替代效应只是暂时的。 在最近于卡塔尔Web Summit大会上接受TechCrunch采访时,会议记录和智能公司Read AI的CEO David Shim表示,即使有AI工具的支持,最终决定行动方案的人仍然是人类,他们的角色仍然重要。他将AI技术比作开车时使用的地图:“我认为永远会有一个人类处于中间位置,”Shim说,“我认为工作会随着时间变得更容易。以开车为例,刚开始的时候你得用手动的地图来导航,并做出决策。而现在几乎每个人都在使用Waze或Google Maps,地图在告诉你该去哪里,而你是处在中间的人,可以做出决策。” Shim承认AI会对一些工作岗位产生影响,例如广告代理商可能会减少人手,转而采用自动化工具。但他指出,技术平台也需要工作岗位来监督这一过程。Lucidya的创始人Abdullah Asiri认为,AI将替代任务但不会取代角色。他表示
- 0 篇意见
- 15 次查看
-
本文以数据为导向,探讨了企业在人工智能(AI)方面的采用情况。文章展示了组织如何从初步的试验阶段过渡到实现真正的生产效率提升和新能力开发的过程。 🔗 来源:The state of enterprise AI (AI 严选)
- 0 篇意见
- 20 次查看
-
为了加强全球努力以应对通用人工智能(AGI)的安全和安全风险,OpenAI宣布向《对齐项目》投入750万美元的资金,旨在资助独立的AI对齐研究。 🔗 来源:Advancing independent research on AI alignment (AI 严选)
- 0 篇意见
- 14 次查看
-
Newton Asare意识到,AI代理不只是工具了。他说:“它们更像是队友。”Asare和Kiran Das都是一系列创始人的成员,在一次交谈中,他们发现正在使用AI代理来完成原本会自己去做的事情。因此他相信未来在于人们如何管理这些AI员工。 “如果这是真的,那么我们就需要一种真正的系统来管理它们,包括入职、协调和监督数字工作者。”Asare说。去年,两人创立了Reload公司,这是一家提供AI劳动力管理系统平台的公司。 本周四,该公司宣布推出其首款产品Epic,并获得227.5万美元的融资,领投方为Anthemis,跟投方包括Zeal Capital Partners、Plug and Play、Cohen Circle、Blueprint和Axiom。Reload提供一个平台,让组织能够跨团队和部门管理AI代理。公司可以将这些代理连接起来(无论是第三方还是内部开发),分配给他们角色和权限,并跟踪他们的工作。 “Reload就像AI员工的记录系统,为各功能中的代理提供可见性、协调和监控。”Asare说,他担任公司的CEO。目前,团队使用多个代理同时进行代码编写、调试和重构等任
- 0 篇意见
- 27 次查看
-
据《 bloomberg》报道,知情人士透露,OpenAI 正在接近达成一项超过 100 亿美元的融资协议,并且其估值可能超过 8500 亿美元。这笔交易正值 ChatGPT 制作商努力实现盈利之际。 为了实现这一目标,OpenAI 已经开始对 ChatGPT 免费用户进行广告测试,这是一场冒险,可能会带来更多收入,但也可能导致用户流失。 据报道,投资者似乎认为这笔交易值得这个风险。与最初预期的 8300 亿美元估值相比,公司的预估市值将提高 2000 亿美元。根据《 bloomberg》的消息来源,OpenAI 的预估前估值仍为 7300 亿美元。 据报道,这笔资金的第一部分预计将来自通常的资金提供者:亚马逊(计划投资高达 500 亿美元)、软银(准备投入 300 亿美元)、英伟达(接近投资 200 亿美元)和微软。风险投资基金和主权财富基金预计将在后期参与进来,可能会将融资总额推高。 《techcrunch》已联系 OpenAI 以获取评论。 🔗 来源:OpenAI reportedly finalizing $100B deal at more than $850B va
- 0 篇意见
- 13 次查看
-
Reddit于周四宣布正在测试一种新的AI搜索引擎,该工具结合了社区推荐和与公司部分购物及广告合作伙伴的产品匹配。一小部分美国用户将开始看到包含交互式产品轮播图、价格信息、直接购买链接的搜索结果。 这一公告反映了Reddit更广泛地将其实验性的社区驱动平台与电子商务功能相结合的战略。随着Reddit去年推出了首个可购物广告产品Dynamic Product Ads(DPA),基于用户兴趣展示个性化产品推荐,现在用户在搜索“最佳降噪耳机”或“适合大学生的电子礼品想法”时,将在结果底部看到相关产品的轮播图。 这些轮播图将展示来自相关帖子和评论中直接提及的产品。如果用户点击某个产品,他们可以查看更多详细信息并直接跳转至零售商完成购买。"此功能可根据讨论直接表面顶级推荐商品,为红迪用户提供即时的任何产品的相关信息,"公司在一个博客帖子中写道,"此次测试旨在简化 Reddit 的使用体验,同时将社区视角置于用户体验的核心位置。我们将继续学习用户如何使用这一新功能,并不断完善该体验。 尽管像 TikTok 和 Instagram 这样的平台长期以来就已整合购物功能,但 Reddit 现在也打
- 0 篇意见
- 13 次查看
-
印度信实集团董事长穆克什·安巴尼周四在新德里举办的印度人工智能影响峰会上公布了该集团在印度建设人工智能计算基础设施的10万亿卢比(约110亿美元)投资计划。在未来七年中,这项投资将用于建造兆瓦级规模的数据中心、全国范围内的边缘计算网络以及与信实Jio电信平台集成的新一代AI服务。 安巴尼表示,信实在吉马纳格尔的古吉拉特邦已经开始建设多个兆瓦级数据中心,并预计在2026年下半年有超过120兆瓦的容量上线。他的这一承诺是印度一波人工智能投资热潮的一部分。此前,阿达尼集团宣布计划投入约100亿美元在当地建立AI数据中心,而印度政府预计未来两年内会在人工智能基础设施上花费超过200亿美元。 全球科技巨头也在加大在印度的布局,例如OpenAI将与塔塔集团合作开发100兆瓦左右的人工智能容量,并计划最终扩大到1吉瓦。安巴尼表示,推进这一计划对于印度的技术自立至关重要,他说:“今天,在人工智能领域最大的限制不是人才或想象力,而是计算资源的稀缺和高昂成本。”他指出,信实将通过其绿色能源产能支持这一建设,目前该集团在古吉拉特邦和安得拉 Pradesh拥有10吉瓦的太阳能项目的盈余电力。 为了
- 0 篇意见
- 12 次查看
-
科技投资者并未放弃以与编写软件相同的速度和便捷性来生产物理产品的梦想。初创公司Freeform正致力于开发一种新的金属组件3D打印系统,其首席执行官兼联合创始人Erik Palitsch向TechCrunch透露,公司已筹集了6700万美元的B轮融资,用于扩展其制造平台。 参与投资的机构包括Apandion、AE Ventures、Founders Fund、Linse Capital、Nvidia的NVentures、Threshold Ventures和Two Sigma Ventures。Pitchbook提供的数据显示,FreeForm融资后的估值为1.79亿美元。Palitsch表示,这笔资金将用于升级其当前的GoldenEye打印系统,该系统使用18台激光器融合金属粉末,以制造精确部件。新版本命名为Skyfall,将利用数百台激光器每日生产数千公斤的金属零件。 FreeForm由Erik Palitsch和Thomas Ronacher于2018年共同创立,在SpaceX开发火箭发动机时,他们发现用于打印金属组件的工业机器价格昂贵、操作复杂,并不适合大规模制造。他们
- 0 篇意见
- 11 次查看
-
在正在进行的印度人工智能影响峰会(India AI Impact Summit)上,原本是一个展示全球技术创新团结承诺的美好瞬间,却因一个尴尬的情景而显得不那么和谐。 当印度总理莫迪在活动上敦促演讲者们握手并举起双手以示团结时,在场的所有企业高管都积极响应——除了OpenAI的萨姆·奥特曼(Sam Altman)和Anthropic的达里奥·阿莫代(Dario Amodei),他们明显保持了一定距离。 作为人工智能竞赛中的两大领军实验室负责人,Altman与Amodei之间的竞争早已十分激烈。这种紧张关系在最近几个月进一步加剧:当OpenAI表示将在ChatGPT中引入广告后,Anthropic也在超级碗期间发布了几则广告,宣称永远不会将广告引入其AI工具Claude中。面对这一挑战,Altman随后公开反击,称Anthropic“不诚实”且“专制”。他当时写道:“我们当然不会像Anthropic所说的方式那样运行广告。我们并不愚蠢,并深知我们的用户会拒绝这样的做法。” 本周,Altman和Amodei都在印度出席了在新德里举办的这场AI峰会。此次峰会上宣布了多项与人工智能相关的
- 0 篇意见
- 12 次查看
-
随着越来越强大的AI编程工具的普及,软件开发的成本似乎变得低廉——但这是否就意味着传统软件公司将会被淘汰?分析人士指出,“借助智能编码(vibe coding),初创企业可以复制复杂的SaaS平台功能。”这样的观点引发了担忧和声明:软件公司将无法幸免。 对于使用代理来弥补长期资源不足的开源软件项目来说,他们本应是受益者之一。然而,在实践中,AI编程工具对开源软件的影响远比人们预想中的复杂。行业专家表示,这些工具有时解决问题,有时也会带来麻烦。 尽管AI编程工具易于使用且普及度高,但这也导致了一大堆糟糕的代码泛滥成灾,威胁到了项目的进行。开发新功能变得更加容易,但维护起来却同样困难,并且可能会进一步分裂软件生态系统。 结果就是,开源世界的繁荣景象远比简单的软件丰富要复杂得多。或许,人工智能时代软件工程师的“末日”宣告还为时尚早。 总体而言,项目代码开放的组织都注意到提交的质量有所下降,这很可能是由于AI工具降低了门槛所致。“对于那些新加入VLC代码库的人来说,我们看到的合并请求质量令人失望。”视频软件VLC的负责人Jean-Baptiste Kempf在最近的一次采访中如
- 0 篇意见
- 12 次查看
-
当今关于人工智能的讨论大多集中在构建云计算能力和大规模数据中心来运行模型。苹果和高通等公司正在尝试使设备上的AI更加有用。然而,来自伦敦的14人技术团队——支持1000万美元种子轮融资的Mirai正在努力改进如何在手机和平板电脑上运行这些模型。 Mirai由Dima Shevts和Alexey Moiseenkov创立于去年,他们曾共同创立过两款受欢迎的应用:Reface(一家脸换脸应用)和Prisma(一款基于AI的滤镜应用)。在构建能够处理复杂任务的应用程序过程中,Shevts表示,他们在生成式人工智能流行之前就开始思考设备上的AI和机器学习问题。 Mirai正在开发一种框架来优化模型运行在设备上的性能。公司为苹果硅芯片开发了一个推理引擎,并提供了仅需几行代码就能集成到应用中的SDK。Shevts表示,公司希望建立一个类似于Stripe的平台,让开发者只需八行代码就能实现与Mirai平台的集成并开始处理文本或分类等各种任务。 为了能够提高模型生成速度37%,公司使用了Rust编程语言构建了这个引擎。Shevts表示,在调整模型以适应特定平台时,他们没有改变模型权重来确保
- 0 篇意见
- 12 次查看
-
OpenAI正与Reliance联手,在印度综合性企业集团的流媒体服务JioHotstar上添加基于AI的对话式搜索功能。该功能由OpenAI的API驱动,允许用户使用多种语言的文字和语音提示搜索电影、电视剧以及现场体育赛事,并根据用户的喜好和历史记录接收推荐。 OpenAI近期在印度扩展了足迹,据称有超过1亿周活跃ChatGPT用户。该公司计划今年晚些时候在孟买和班加罗尔开设办公室,加入其在新德里的现有办事处。此次合作是在德里举行的印度人工智能影响峰会上宣布的,当时OpenAI首席执行官阿尔特曼(Sam Altman)与行业领袖们一同出席,包括Anthropic的达里奥·阿莫迪(Dario Amodei)和谷歌的 Sundar Pichai。 双方还计划将此合作扩展到直接在ChatGPT内展示JioHotstar推荐,允许通过ChatGPT搜索娱乐内容的用户获得上下文建议,并链接至平台的内容库。此举将使该集成成为双向发现层,而不是独立的应用内功能。随着流媒体和电视平台越来越多地试验对话式界面,这一举措显得尤为重要。 今年5月,Netflix表示正在测试新的搜索体验,利用O
- 0 篇意见
- 11 次查看
-
随着印度致力于将其打造为全球应用人工智能(AI)的核心枢纽,OpenAI与Pine Labs联手,在金融技术公司Pine Labs的支付平台中整合了基于AI的技术。双方表示,该合作有望加速印度的人工智能驱动商务。 此次合作将使Pine Labs在其支付和商业基础设施中嵌入OpenAI的应用编程接口(API),以实现人工智能辅助的结算、对账及发票流程自动化。此举凸显出OpenAI正在加快其在印度市场的扩张步伐,这也是其增长最快的市场之一。OpenAI正致力于将其技术扩展到教育、企业以及基础设施领域,而不仅仅是被视为ChatGPT的制造者。 Pine Labs首席执行官B Amrish Rau指出,公司已在内部使用AI来自动化结算和对账过程的一部分,将日常结算处理时间从数小时缩短至几分钟。此前,该公司依赖数十名员工进行手动核验,以在市场开盘前处理来自多家银行的款项。 对于Pine Labs而言,此次合作旨在将这些基于AI的效率扩展到商家和企业客户,尤其是商业对商业(B2B)用例中的发票处理、结算及支付协调。Rau在接受TechCrunch专访时表示:“人们谈论的是零售人工智能,
- 0 篇意见
- 15 次查看
-
OpenAI已与印度塔塔集团达成合作,确保印度境内100兆瓦的AI专用数据中心容量,并计划逐步扩大到1吉瓦。此举是其在全球范围内加深企业及基础设施布局的一部分。 OpenAI于周四宣布了此次与塔塔集团的合作关系,该合作属于名为Stargate项目的组成部分,旨在建设AI专用基础设施并拓展全球企业采用度。OpenAI将成为Tata Consultancy Services(塔塔咨询服务公司)HyperVault数据中心业务的第一个客户,初期将提供100兆瓦的容量。双方合作还包括部署ChatGPT Enterprise以覆盖塔塔集团员工,并通过OpenAI工具实现原生人工智能软件开发标准化。 此次合作是“OpenAI为印度”计划的一部分,突显了该公司在印度的业务扩展。据CEO萨姆·阿尔特曼近期估计,印度每周有超过1亿名活跃用户使用ChatGPT,包括学生、教师、开发者和创业人士等群体。这种规模的应用使印度成为OpenAI最重要的增长市场之一,而其对企业的投资也在不断加深。 本地数据中心容量将允许OpenAI在其国内运行最先进的人工智能模型,减少用户的延迟同时满足受监管行业及政府
- 0 篇意见
- 10 次查看
-
OpenAI for印度正在扩展整个国家的人工智能访问范围——建立本地基础设施,支持企业,并提升劳动力技能。 🔗 来源:Introducing OpenAI for India (AI 严选)
- 0 篇意见
- 18 次查看
-
在TechCrunch的Equity播客中,Rebecca Bellan 采访了谷歌云全球创业公司的副总裁 Darren Mowow。讨论了当前创业生态系统中的各种趋势、谷歌云如何吸引AI初创公司以及创始人在扩展时需要考虑什么问题。 如今创业者面临着前所未有的速度要求,在使用人工智能的同时还要应对更紧缩的资金,不断上涨的基础设施成本以及早期就需展示实际成果的压力。虽然免费的云信用额度、GPU访问和基础模型让创业变得更容易,但这些早期基础设施的选择可能会在初创企业进入真正的云账单阶段时产生意想不到的影响。 Mowow 提到他在全球范围内观察到的各种情况,并讨论了谷歌云如何与AI初创公司竞争以及创始人在扩展过程中应思考的问题。TechCrunch 的音频制作人 Theresa Loconsolo 详细介绍了她的背景和联系方式,同时提醒听众不要错过 TechCrunch 年度活动中的特别优惠。 🔗 来源:Is your startup’s check engine light on? Google Cloud’s VP explains what to do (AI 严选)
- 0 篇意见
- 13 次查看
-
初创企业创始人正被逼迫比以往任何时候都更快地行动,同时利用AI技术,面对越来越紧张的资金、不断上涨的基础设施成本以及更早展示实际进展的压力。云信用额度、访问GPU和基础模型让起步变得更加容易,但那些早期基础设施的选择可能会在企业超出免费额度进入真正的云账单阶段时产生意想不到的后果。 在这期TechCrunch的Equity播客中,TechCrunch资深记者Rebecca Bellan与Google Cloud全球初创企业的副总裁Darren Mowow进行了交谈。他们讨论了Mowow在创业生态系统中所见的趋势、Google Cloud如何争夺AI初创企业以及创始人在扩展时应该考虑的问题。 通过完整的播客,听众可以了解以下内容: 订阅Equity Podcast可以在YouTube、Apple Podcasts、Overcast、Spotify和其他平台收听。 您还可以在X和Threads上关注EquityPod,关注@EquityPod。 Rebecca Bellan是TechCrunch的资深记者,专注于报道塑造人工智能业务、政策和新兴趋势的人工智能。她的作品还
- 0 篇意见
- 17 次查看
-
谷歌周三宣布,在其 Gemini 应用中新增了音乐生成功能。该公司正使用 DeepMind 的 Lyria 3 音乐生成模型来支持这一特性,该功能目前仍处于测试阶段(beta)。要使用此功能,用户只需描述他们想要创作的歌曲类型,应用将会自动生成一曲并附上歌词。 例如,你可以要求 Gemini 创作一首“滑稽的 R&B 慢歌,讲述袜子找到另一半的故事”,应用将生成一段 30 秒的曲目,并配有 Nano Banana 设计的封面图。谷歌表示,用户甚至可以上传照片或视频,AI 驱动的工具将会根据媒体文件的情绪来创作歌曲。 Lyria 3 相较于之前的模型有所改进,能生成更逼真和复杂的音乐片段。用户还可以更改并控制其他元素如风格、人声和节奏。除了将 Lyria 3 集成到 Gemini 应用中之外,谷歌还通过 YouTube 的 Dream Track 功能向创作者开放了这一模型,帮助创作者制作 AI 生成的曲目。该选项之前仅限美国地区的 YouTube 创作者使用,现在全球范围内的创作者都可以访问。 “音乐生成以 Lyria 3 为驱动,并旨在促进原创表达,而不是模仿现有
- 0 篇意见
- 21 次查看