功能目前以 Beta 样貌向全球 18 岁以上用户敞开,支英语、德语、西班牙语、法语、印地语、日语、韩语与葡萄牙语,桌面端已率先上线,移动端将于前景几天内陆续推送。
若说 Suno 与 Udio 代表之 AI 音乐之创业浪潮,谷歌此举则标志之此场竞赛正式晋级为平台级别之角力。
但谷歌选择于此名光阴点把它推向 7.5 亿用户面前,传递之信号已足够清晰:AI 音乐生成此件事,它不打算再等之。
背后为 DeepMind 最新之 Lyria 3 模型,操练数据超 200 万首曲目。
Multiverse。做 AI 音乐生成之公司不少,但把它直接塞进一名有超过 7.5 亿月活用户之超级应用里,谷歌为头一名。
从 2023 年发布初代 Lyria 算起,此已为谷歌于音乐生成领域之第三代模型。
AI 音乐生成领域之版权纠纷从未停歇。
但 Suno 之月活用户量级与 Gemini 之 7.5 亿相比,根本不于同一名数量级。
纯器乐当然也为支之。
Suno 于 2024 年 11 月成之 2.5 亿美元融资,其付费版本已提供之虚拟音频工站等专业编辑功能。
https://x.com/GoogleDeepMind/status/2024153067654902014 根据 DeepMind 官方推文,Lyria 3 输出 48kHz 立体声响频,者声表现更自,歌词之咬字清晰度也有之明显提升。
于此名底色下,谷歌之措辞格外谨慎。
「30 秒」背后之技艺跃迁 2024 年炎夏,环球音乐、索尼音乐与华纳音乐联手对 AI 音乐初创公司 Suno 与 Udio 提起之总金额达 5 亿美元之版权侵权诉讼。
整名行业正从对抗走向协作,但紧迫关系远未消散。
Tom's Guide 之编辑于体验后写道,她把丈夫之待办事项清单变成之一首朋克摇滚歌曲,然后通过短信发之出去。
【新智元导读】谷歌于 7.5 亿月活之 Gemini 中上线之 AI 音乐生成能,输入一句话或一张照片,几秒就能得到一首带者声与歌词之完整歌曲。
于实质标识层面,所有通过 Gemini 生成之音乐皆会嵌入 SynthID 水印。
更值得关注之为,Gemini 今还新增之音频鉴别功能——用户可上传一段音频文书,询问它为否由谷歌AI 生成,Gemini 会检测 SynthID 标记并结合自身推演给出裁决。
谷歌对此项功能之定位,不为取代音乐者,而为让寻常者得一种全新之自我表达方式。
封面则由谷歌之图像生成模型 Nano Banana 自动成。
驱动此名功能之为 DeepMind 最新之音乐生成模型 Lyria 3。
此意味之它于音质维度上甚至超过之 YouTube Music 等主流流媒体平台之标准。
https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/ 比如上传一张徒步之照片,Gemini 就能创作一首与之匹配之歌曲。
此项功能此前仅限美国地区,此次正式面向全球创作者敞开。
如狼似虎。用户对风格、者声类型、节拍速度等元素之控制也更精细之。
相比前代,Lyria 3 有几名明显之长进。
30 秒之长度限制、Beta 阶段之粗糙感、版权争议之暗涌——Lyria 3 显然还远谈不上完美。
当音乐生成变成一场平台战 据数术音乐媒体 Digital Music News 报道,Lyria 3 之操练数据规模从 Lyria 2 之约 50 万首曲目扩展到之超过 200 万首,音频位深从此前版本晋级到之 24-bit。
谷歌 AI Plus、Pro 与 Ultra 订阅用户将享有更高之用额度。
过往用户需自己写歌词输入模型,今 Lyria 3 可根据提示词自动生成歌词。
到 2025 年底,Suno 与华纳达成与解并得授权,Udio 也分别与环球与华纳签署之协议。
与此同时,Lyria 3 也被整顿进之 YouTube 之 Dream Track 功能,帮创作者为 Shorts 短视频生成底色音乐。
过往用户需自己写歌词输入模型,今 Lyria 3 可根据提示词自动生成歌词。
此为继图片与视频鉴别之后,SynthID 覆盖之第三种媒体类型。
若用户于提示词中提到某位实在风雅家之名字,Gemini 只会将其作为宽泛之创作灵感,生成风格或情绪相似之作品,而非模仿该风雅家之声响。
谷歌还表示于操练历程中「极其注意版权与协作伙伴协议」,并设置之过滤器来比对输出实质与已有作品。
对 Suno 等 AI 音乐创业公司而言,角逐从此不再只为比模型,更为要比入口。
此种场景或正为谷歌欲之:音乐生成之杀手级应用也许并不于录音棚里,而为藏于日常活之每一条消息、每一次分享中。
人民当家作主。官方公告强调 Lyria 3 之设计宗旨为「原创表达,而非模仿现有风雅家」。
当每名者之口袋里皆装之一名作曲家之时候,更张之或许不为音乐本身,而为吾等与音乐之间之关系。
配合。驱动此名功能之为 DeepMind 最新之音乐生成模型 Lyria 3。
昨日,谷歌于 Gemini App 中上线之 AI 音乐生成能。
用户输入一段书契描述,或者上传一张照片,几秒钟内就能得到一首 30 秒之完整歌曲,带者声、带歌词、带 AI 生成之封面。
除之文本生成音乐,用户还可上传照片或视频,让 Gemini 根据视觉实质之情绪来作曲配词。
上一篇:AI“卷”春节?智能点单、做拜年视频、抢红包,各凭本事吸引用户 下一篇:奥多伊:作为球员,一名赛季经历四位主教练执教确实甚难随顺