MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳.doc

MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳.doc

ID:27507958

大小:134.50 KB

页数:3页

时间:2018-12-04

MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳.doc_第1页
MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳.doc_第2页
MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳.doc_第3页
资源描述:

《MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、MIT利用人工智不仅能识别多种乐器,还能过滤声音让音乐更悦耳  一般利用均衡器可以将音乐中的低音部分调出来,但是麻省理工学院的计算机科学和人工智能实验室(ComputerScienceandArTIficialIntelligenceLab,CSAIL)的研究人员发现了更好的解决方案。他们所研发的新系统PixelPlayer,能够利用人工智能来区分和过滤声音,让音乐听起来更洪亮或更柔和。  将指定视频录入经过充分训练的PixelPlayer,系统随机能够过滤伴奏,同时识别音源,接着计算图像中每个

2、像素的音量,然后通过“空间定位”确定产生相似音波的片段。  今年9月,德国慕尼黑即将举行欧洲计算机视觉会议(EuropeanConferenceonComputerVision),会议中要发表的一篇新论文则详细论述了“像素的声音(TheSoundofPixels)”。麻省理工学院计算机科学和人工智能实验室的博士生,同时也是这篇论文的合著者ZhaoHang同学表示,“最好的情况就是,我们能识别出哪种乐器发出怎样的声音。”    PixelPlayer的核心是一种基于乐器组合多模态训练的神经网络,数

3、据集采用了Youtube上714条未经修剪且未经标记的视频。其中,总时长为60小时的500条视频用于训练,剩余的则用于验证和测试。在训练过程中,研究人员分别根据原声吉他、大提琴、单簧管、长笛和其他乐器向系统馈入了算法。  这只是PixelPlayer多重机器学习框架的一个部分。经过训练后的视频分析算法将从剪辑帧中提取出视觉特征,这就是系统的第二个神经网络,即音频分析网络。音频分析网络将声音拆分为片段,并从中提取特征。最后,音频合成网络将把上述两个网络输出的特定像素和声波关联起来。  PixelP

4、layer进行完全自监督的学习,人们无需对数据注释,而且系统目前已经能识别20种乐器。ZhaoHang说,较大的数据集增强了系统的识别量,但识别乐器子类的能力却不佳。系统也可以识别音乐元素,例如小提琴的谐波频率。  研究人员认为PixelPlayer可以进行声音剪辑,或者帮助机器人理解动物、车辆和其他物体所制造的环境声音。他们写到,“我们希望我们的工作能够开辟新的研究途径,从视觉和听觉信号角度实现声源分离”。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。