Meta发布AIGC生成式人工智能模型来生成音乐与音效——AudioCraft
moboyou 2025-09-29 07:38 7 浏览
近年来,包括语言模型在内的生成式人工智能模型取得了巨大进步,特别是ChatGPT的发布,让大家看到了大语言模型的魅力。无论是计算机视觉,还是nlp领域的文本描述生成各种图像和视频,到执行机器翻译,文本生成等等大模型上,其都取得了令人意想不到的发展。但音乐与音频上似乎总是有点落后。是否可以使用人工智能技术来合成不同的音乐或者音效?
AudioCraft 包含三个模型:MusicGen、AudioGen和EnCodec。
MusicGen:使用 Meta 拥有且专门授权的音乐进行训练,根据用户输入的文本生成音乐。
AudioGen 使用公共音效进行训练,根据用户输入的文本生成音频音效。
EnCodec 解码器,它可以用更少的音损生成更高质量的音乐,类似音频压缩技术。EnCodec 是一种有损神经编解码器,经过专门训练,可以压缩任何类型的音频并以高保真度重建原始信号。
AudioCraft 系列模型能够产生具有长期一致性的高质量音频,并且可以通过UI界面轻松交互。通过 AudioCraft,简化了音频生成模型的整体设计,我们可以直接利用开源代码进行音乐的生成。
%cd /content
!git clone https://github.com/facebookresearch/audiocraft
%cd /content/audiocraft
!pip install -r requirements.txt
!python -m demos.musicgen_app --share
我们可以直接使用以上代码生成一个可视化的UI界面,我们只需要在输入框中,输入相应的文本,就可以利用模型生成音乐了。
为了方便开发者使用AudioCraft,模型已经开源,且我们可以直接使用开源的代码进行音乐的合成。
!python3 -m pip install -U git+https://github.com/facebookresearch/audiocraft#egg=audiocraft
from audiocraft.models import musicgen
from audiocraft.utils.notebook import display_audio
import torch
model = musicgen.MusicGen.get_pretrained('medium', device='cuda')
model.set_generation_params(duration=8)
首先我们需要使用pip 来安装AudioCraft,并从AudioCraft的models导入musicgen音乐生成函数。
这里我们使用
musicgen.MusicGen.get_pretrained来加载模型的预训练模型,函数运行到此步后,会自动搜索项目文件夹中是否有模型,并自动进行下载。
Downloading state_dict.bin: 100% 3.68G/3.68G [03:42<00:00, 19.4MB/s]
Downloading (…)ve/main/spiece.model: 100% 792k/792k [00:00<00:00, 10.5MB/s]
Downloading (…)lve/main/config.json: 100% 1.21k/1.21k [00:00<00:00, 45.8kB/s]
Downloading model.safetensors: 100% 892M/892M [00:10<00:00, 46.2MB/s]
Downloading (…)ssion_state_dict.bin: 100% 236M/236M [03:45<00:00, 1.05MB/s]
res = model.generate([
'crazy EDM, heavy bang',
'classic reggae track with an electronic guitar solo',
'lofi slow bpm electro chill with organic samples',
'rock with saturated guitars, a heavy bass line and crazy drum break and fills.',
'earthy tones, environmentally conscious, ukulele-infused, harmonic, breezy, easygoing, organic instrumentation, gentle grooves',
],
progress=True)
display_audio(res, 32000)
模型下载完成后,我们就可以使用model.generate函数来生成音乐了,这里可以一次输入多个文本,模型会自动根据输入的文本,生成多个音频文件,最后,我们可以display或者下载生成好的音乐文件。
Text Prompt: Pop dance track with catchy melodies, tropical percussions, and upbeat rhythms, perfect for the beach
当然此模型已经发布在hugging face的transformers库中,我们也可以直接使用transformers库来运行此代码。
pip install git+https://github.com/huggingface/transformers.git
from transformers import AutoProcessor, MusicgenForConditionalGeneration
processor = AutoProcessor.from_pretrained("facebook/musicgen-small")
model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-small")
inputs = processor(
text=["80s pop track with bassy drums and synth", "90s rock song with loud guitars and heavy drums"],
padding=True,
return_tensors="pt",
)
audio_values = model.generate(**inputs, max_new_tokens=256)
当然,这里我们不需要安装AudioCraft,而是安装transformers库,然后从transformers库中导入相关的AudioCraft应用。然后也是加载相关的模型文件,并输入需要生成的音乐文本,最后就可以使用model.generate函数来生成音乐文件了。
from IPython.display import Audio
sampling_rate = model.config.audio_encoder.sampling_rate
Audio(audio_values[0].numpy(), rate=sampling_rate)
import scipy
sampling_rate = model.config.audio_encoder.sampling_rate
scipy.io.wavfile.write("musicgen_out.wav", rate=sampling_rate, data=audio_values[0, 0].numpy())
生成好的音乐文件,我们可以使用以上函数进行播放或者进行存储,方便后期进行处理操作。当然以上的代码都是MusicGen音乐生成的代码实现,其他AudioGen和EnCodec的代码实现过程,可以参考GitHub源码。
https://github.com/facebookresearch/audiocraft
相关推荐
- 高效有趣学Excel:从入门到精通的全面教程分享
-
在当今这个数据驱动的时代,掌握Excel不仅是提升工作效率的利器,更是职场竞争中的一项重要技能。今天,我非常高兴地与大家分享一套全面的Excel学习教程——《高效有趣学Excel:轻松入门到精通》,这...
- Excel新函数重磅来袭!告别复杂公式,效率提升200%!
-
“透视表终于不用点来点去了?”昨晚刷到这条留言,顺手把新表扔进365,一行=GROUPBY(部门,产品,销售额,SUM)回车,三秒出汇总,刷新按钮直接失业。那一刻,办公室空调声都显得多余。有人还在录宏...
- Excel 效率神器:LET 函数入门教程,让复杂公式变简单
-
您是否曾经编写过又长又复杂的Excel公式,然后没过几天自己都看不懂了?或者,同一个计算在公式里重复写了无数次,不仅容易出错,修改起来更是噩梦?Excel推出的LET函数就是来解决这些痛点...
- Excel多对多查询函数新手教程:从案例到实操
-
一、为啥要学多对多查询?举个例子你就懂!假设你是公司HR,手里有张员工技能表(如下),现在需要快速找出:"张三"会哪些技能?"Excel"技能有哪些人掌握?员工姓名...
- 14、VBA代码+excel内置函数,实现高效数据处理(零基础入门)
-
1、学习VBA的主要目的是数据处理,VBA在数据处理上展现出强大的计算实力。它不仅完美继承EXCEl内置函数的功能,还能通过编程语法实现更灵活的应用。无论是基础的加减乘除,还是复杂的统计分析、逻辑判断...
- word和excel零基础学习免费视频教程,赶紧收藏,作者将转付费课
-
亲爱的朋友们:大家好!本人是全国计算机等级考试二级MSoffice高级应用课程的在校授课老师。本人近段时间打算将wore/excel免费分享给所有有需要的朋友。知识本身无深浅,本人知识也有限,如果讲...
- excel函数从入门到精通,5组13个函数,易学易懂易用
-
对于职场中经常使用Excel的小伙伴们,最希望掌握一些函数公式,毕竟给数据处理带来很多方便,可以提高我们的工作效率。今天分享几组函数公式,适合于初学者,也是职场中经常用到的,下次碰到可以直接套用了。0...
- Excel效率神器:LET函数入门教程,让复杂公式变简单
-
写公式写到想砸电脑?教你用LET把Excel公式从“迷宫”变成“小剧本”,几步看懂又好改很多人都经历过这样的窘境:花了半小时写出一条看似厉害的Excel公式,几天后再看自己都懵了,或者同样...
- 完全免费的Excel教程大全,适合日常excel办公和技能提升
-
说明微软官方的excel文档,由于网站在国外,有时打开慢,而且应用层面介绍不够详细;这里介绍一个集齐了excel各种使用方法和说明的网站;网站名称:懒人Excel网站介绍可以看到有基础教程、快捷键、函...
- Excel 新函数 LAMBDA 入门级教程_excel365新增函数
-
LAMBDA函数的出现是Excel历史上的一次革命性飞跃。它允许用户自定义函数,而无需学习VBA等编程语言。这意味着你可以将复杂的、重复的计算逻辑封装成一个简单的、可复用的自定义函数,极大地...
- Excel新函数LAMBDA入门级教程_excel新建函数
-
把复杂公式“变成函数”后,我在Excel上的重复工作少了一半——你也能做到我一直有一个习惯:遇到每天要重复写的复杂公式,就想把它封装起来,像调用内置函数那样去用。说实话,过去没有LAMBDA,这个想法...
- Excel DROP 函数全方位教程:从基础入门到高级动态应用
-
上一篇我们学习了ExcelTAKE函数,今天我们来学习一下和TAKE函数相对应的DROP函数,它是Microsoft365和Excel2021中引入的一个动态数组函数。它的核心功能是从一...
- 学习Excel公式函数还有官方提供的教程,还是免费的!赶紧试试
-
首先声明,这不是广告,纯干货分享!除了学习Excel的基本操作之外,很多人都是冲着公式和函数才去找教程买教材的,这个结论应该不会有什么毛病。因为,Excel的公式函数真的很强大!现在的Excel教程可...
- 什么是保险员常说的“IRR”?让我们一次说明白!
-
买保险的时候,你是不是常听到销售抛出一些术语,比如“IRR很高哦,收益不错!”?听着挺专业,但“IRR”到底啥意思?想问又不好意思问,别急,它其实是个很简单的概念,咱们今天一次把它说明白。1,IRR...
- 理财型保险如何选择缴费期?_理财型保险计算方式
-
选择理财型保险(通常指年金险、增额终身寿险等)的缴费期,并非简单地看哪个年限短或长,而是需要结合自己的财务状况、理财目标和产品特性来综合决定。下面我将为大家详细解析不同缴费期的特点、适用人群和选择策略...
- 一周热门
- 最近发表
-
- 高效有趣学Excel:从入门到精通的全面教程分享
- Excel新函数重磅来袭!告别复杂公式,效率提升200%!
- Excel 效率神器:LET 函数入门教程,让复杂公式变简单
- Excel多对多查询函数新手教程:从案例到实操
- 14、VBA代码+excel内置函数,实现高效数据处理(零基础入门)
- word和excel零基础学习免费视频教程,赶紧收藏,作者将转付费课
- excel函数从入门到精通,5组13个函数,易学易懂易用
- Excel效率神器:LET函数入门教程,让复杂公式变简单
- 完全免费的Excel教程大全,适合日常excel办公和技能提升
- Excel 新函数 LAMBDA 入门级教程_excel365新增函数
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)
- linux有没有pe工具 (34)
- 可以上传视频的网站源码 (25)
- 随机函数如何生成小数点数字 (31)
- 随机函数excel公式总和不变30个数据随机 (33)
- 所有excel函数公式大全讲解 (22)
- 有动图演示excel函数公式大全讲解 (32)