Zound Industries联合Marshall Amplification成立Marshall集团
英国摇滚传奇品牌Marshall Amplification(以下称“Marshall”)和瑞典音频行业引领者Zound Industries (以下称“尚音国际”)将联合,共建Marshall 集团,携手开创声音和技术领域的新未来。该交易标志着双方过去十年高度成功的伙伴关系的新篇章。2023年3月30日,Marshall 集
更新日期:2023-02-20
来源:纯净版系统
近日,网易云音乐2篇论文《TG-Critic: A Timbre-Guided Model for Reference-Independent Singing evaluation》《TrOMR:Transformer-based Polyphonic Optical Music Recognition》入选ICASSP2023,论文提出的两种算法模型均优于现有最先进模型。
一种是歌唱评价算法模型TG-Critic,利用它可以仅依靠一段演唱音频判断歌手演唱水平,实验结果表明,算法模型评估的歌曲与人工专家评价“演唱水平好”的歌曲,相似度达91%;另一种是识别图像乐谱的算法模型,通过模型识别图片中的五线谱,实验结果在复音乐谱上的错误率最高也仅为2.1%。
据了解,ICASSP(International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是IEEE主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。此次入选,代表了网易云音乐在国际舞台上,展示出了在音乐音频领域的技术实力。
而且凭借在音乐技术领域的积累创新,网易云音乐也不断将前沿领域研究成果应用于实践。依靠目前准确率最高的歌曲质量评价算法,歌唱评价将不再依赖人力手工准备模板物料,歌手也不再需要模仿模板以获取高分,更鼓励歌手的个性化演绎。而且相比卡拉ok中的传统歌唱评价,该模型未来将用于更加丰富的使用场景,如歌曲分发、优质歌手挖掘、声音社交等等领域。而利用识别图像乐谱的算法模型,可以将模糊的图片乐谱准确识别,方便转换为利用率更高的格式,服务于音乐人、用户在欣赏、教育、创作等场景的需要。
三大技术创新拆解“开口跪”,将全球最优算法准确率至少提升4%
当歌唱老师和专家听到一首歌,就能迅速可以判断出歌手的演唱水平,而普通人则会用“开口跪”表达夸赞。当人们评价歌声质量时,人声的音色是影响判断的重要因素。受其启发,网易云音乐首创提出了一个音色为指导的歌唱评价模型:TG-Critic,将全球最优算法准确率提升4%以上。
据介绍,网易云音乐音频实验室在歌唱评价模型的设计过程中引入了三个主要创新点:
1.首次在模型中显式引入音色信息辅助歌声评价:研究表明,歌手的"音色"是影响人们对于歌声感受的重要因素。但不同于音准、节奏等较为简单的属性,音色是一系列复杂而抽象的感受的集合,因此其提取过程更为复杂,更难被模型直接捕捉到。至今为止的歌声自动评价系统中,还没有研究聚焦音色特征对于模型预测的影响。 为了填补这一空缺,团队创新性地使用原本为“歌手识别”任务设计的预训练模型,提取与音色相关的高级特征,并将其用作歌声评价模型的输入。尽管这些特征原本并非为歌声质量设计,但是来自质量标签为“好”和“差”的样本的特征,在高维空间中分别呈现出较明显的聚集现象,证明了其与歌声质量的相关性。
2.迁移高分辨率网络结构处理声谱特征:除了音色特征输入,团队从音频样本中提取CQT声谱特征作为模型的主要输入。为了解决卷积网络局部性带来的问题,团队将图像分割领域较为常用的“高分辨率网络”迁移到歌声评价任务中,分别通过高、中、低三个不同的分辨率分支分别处理特征。通过高分辨率特征捕捉局部信息(如演唱技巧、小瑕疵等)、低分辨率特征捕捉长距离信息(气息稳定性、音准等),从而实现保持高效性的同时,提升模型提取有用信息的能力。
3.提出循环自动数据标注降低人工成本: 对于一个模型的训练,可靠的标注数据尤为重要。团队收集了3万余条歌声数据样本,以及其对应的机器打分(针对音准、节奏等)、红心数、评论数等可以一定程度反映歌声质量的元数据。通过一个循环迭代过程,只需要人工标注其中小部分样本,便能获得足够可靠的自动数据标签,大大降低了标注所需的人工成本。
实验结果表明,在各类公开数据集上,网易云音乐提出的TG-Critic均达到国际最先进水平,相比已有算法,准确率提升至少4%,部分数据集提升10%以上。而且应用于网易云音乐业务测听的结果显示:在音乐人业务:运营评估歌曲推荐值≥3共159首歌曲中,算法评价为“演唱水平好”共144首,准确率达90.5%;在直播业务:运营提供100首算法判定“演唱水平好”歌曲的人工验证,准确率91%;在500+全演唱水平分类实验中,准确率81.2%。
据了解,TG-Critic歌曲质量评价模型将进一步减少人力依赖并扩大应用场景在直播、音乐人等内容分发场景,可协助人工挑选优质内容,可服务于作品审核、分发或推荐,优质歌手挖掘在社交、游戏等C端场景,可提供“开口跪挑战”等运营玩法。
懂AI又懂乐理,看图识谱技术上的又一次突破
随着深度学习方法的应用,OCR(图像文字识别 )近年得到了长足的进步,而OMR(图像乐谱识别)却始终处于研究应用的初级阶段。由于这个方向属于交叉学科,既要懂视觉算法又要懂乐理。目前市面上的商业或开源软件都不具备可用的准确率。
因此,网易云音乐音视频实验室采用基于端到端的算法识别路线,优化识别流程:1)拿到一个乐谱图片,检测图片中的曲谱位置坐标;2)提取曲谱区域,进行曲谱识别,识别出乐谱中的内容信息,如下图:
针对该乐谱识别模型,网易云音乐音频实验室也做了多方面的创新,大大提高了准确性。例如,将Transformer引入到乐谱识别任务中,通过该结构可以实现更大的感受野,有利于对长序列进行预测,提升识别准确率;同时,将乐谱的信息维度将乐谱符号分为:乐谱符号全局表征+乐谱符号局部表征+音符音高。这样的拆分方式更利于机器理解和学习。
值得注意的是,团队还精心设计了一套乐谱图片拍摄的方案。为了收集大量真实的数据,使用手机作为拍照工具,模仿最真实的拍照场景,对明、暗光场景的纸质乐谱进行拍照,以及对显示在显示屏上的乐谱进行拍照。
实验结果表示,网易云音乐的乐谱识别算法的准确性已经超过目前最好的端到端音乐谱识别方法,大幅降低错误率。下图中第一行为正确的乐谱识别结果,第二行为目前最好的复音乐谱识别方法的识别结果,第三行为本技术提出方案的识别结果,红框标记的为错误区域。
据介绍,该方法可以准确地将图片乐谱转换为midi、musicxml等格式,未来可用于音乐辅助教育、听歌搜谱等场景中,致力于在音乐欣赏、教育、创作等场景上,为音乐人、用户提供更好的服务。
Zound Industries联合Marshall Amplification成立Marshall集团
英国摇滚传奇品牌Marshall Amplification(以下称“Marshall”)和瑞典音频行业引领者Zound Industries (以下称“尚音国际”)将联合,共建Marshall 集团,携手开创声音和技术领域的新未来。该交易标志着双方过去十年高度成功的伙伴关系的新篇章。2023年3月30日,Marshall 集
用中国移动号码,解锁你的海量数字生活特权
如今,多设备办公已经成为职场人士的日常。但是,每次更换设备就要重新登录,极大降低了办公效率,再遇到上传下载网速慢、存储空间不足等问题,更是令人极度无奈。职场白领吴森(化名)就曾深受其苦,“在日常的办公中,手机、电脑需要随时切换,更何况,我有两台手机以及三台电脑,
动力电池”顶流“问世 中创新航行业首发
2023年4月2日,中创新航在电动汽车百人会论坛上首次正式公开发布“顶流”圆柱电池。“顶流”圆柱电池是基于中创新航One-Stop(OS)极简设计的又一次创新,通过自研结构创新与化学体系创新研发而成。采用了行业首发顶流结构与原创“极质”电解液技术,结构内阻相较于全极耳
天猫优品200款趋势新品重磅首发,给中国消费电子行业再添新动力
3月31日在安徽省合肥市举办的天猫优品2023春季趋势新品发布会上,天猫优品携近百家品牌商和现场1300家优品门店、线上过万家店主,一次性发布近200款新潮家电、趋势科技新品,为逐渐复苏的线下家电市场注入新活力。现场发布会以“新潮来电,智享优家”为主题,聚焦家电、
科技助力金融服务更多可能 马上消费致力实现深层消费公平
作为我国经济发展的基础构成,居民消费在中国经济进入高质量发展阶段背景下扮演着更加重要的角色,而金融消费更是我国消费的重要组成部分。数字经济时代,金融消费者群体的数量也在日渐扩大。与此同时,数字金融正利用云计算、大数据、人工智能等各项技术在促进公平与可
前所未有的安全感,华为云为网站安全保驾护航
如今互联网时代的迅速发展,致使网站增长速度加倍,无论是政府、中小企业乃至个人都会有网站。网站在我们生活中起到的作用很大,不仅起到宣传的作用还能给我们带来收益,也帮助了很多人寻找到想要了解的信息。既然网站那么重要,对于网站安全你又了解哪些呢?本文将以华
泡泡玛特王宁紧握发展机遇 持续加快“走出去”步伐
近年来,随着国内经济的快速发展,越来越多的国产企业开始将目光投向海外市场,加速了“走出去”的步伐,积极开拓海外市场,推动中国品牌向全球范围内扩张。不久前,泡泡玛特法国首家线下门店在巴黎沙特莱广场Forum des Halles正式开业。开业期间,泡泡玛特为欧洲粉丝准
中国移动云盘 X 苏炳添,引领速度时代
“这是一场关于速度的双向奔赴。”速度之间的激情碰撞,中国移动和苏炳添强强联手。春节过后,“中国移动官宣苏炳添”的话题直冲热搜榜。作为中国速度的代表,男子60米、100米亚洲纪录保持者,苏炳添一直在超越自我中刷新着自己的纪录,完成新的自我突破。在这个以速度
海信家电年报:营收创记录!每分钟3个欧洲家庭选择海信洗衣机
3月30日,海信家电发布2022年年报,公司营业收入达到741.15亿元,同比增长9.7%,销售规模创下历史新高,归母净利润达到14.35亿元,同比增长47.54%;其中除传统强势品类持续保持高速增长以外,海信洗衣机在海外市场取得快速突破,销售大幅提升45%,特别是在欧洲市场更是成绩斐然。
腾讯多媒体实验室AIGC能力助力数据万象开启智能剪辑大门
AIGC正从效率、质量、创意、多样性各方面革新内容生产流程,伴随firely、midjourney等现象级的产品出现,AIGC将逐步广泛服务于内容生产的各类场景与内容生产者,随着AIGC在内容生产的需求场景不断增加,腾讯多媒体实验室也在AIGC领域持续发力,并通过数据万象将能力成功
【鲁大师实验室】我失去的东西一定要拿回来 魅族20 PRO流畅度重夺第一
2009 年2月18日,魅族第一部手机M8正式发布。2021年9月22日,魅族18s系列在珠海发布。等了一年半,我们终于等来了魅族20系列。魅族20 PRO正面采用了6.81英寸的2K 120Hz E6屏幕,背面为高雾AG玻璃,配合高亮的铝合金中框,质感拉满。7.8mm的机身、209g的重量和50:50的重
运动和睡眠是好CP?网友分享75派睡眠自测报告解决睡眠“困”扰
近日,75派在今年3月21日“世界睡眠日”当天,面向用户发起的“2022年,我睡得咋样?“睡眠质量自测活动圆满收官,共有超过5000人参与了此次睡眠质量自测活动,并在微博、小红书等社交平台积极分享自己的自测报告和运动之后的睡眠体验。网友热热(化名)提到“去年从3月到1
科技创新 · 绿色引领--润迅数据生态合作大会在合肥召开
3月30日上午,润迅数据生态合作大会在合肥隆重举行。本次大会围绕“科技创新 · 绿色引领”核心主题进行开展,润迅数据紧跟国家数据中心政策方向,结合安徽省合肥市IDC产业带动企业数字化转型、数字经济发展,以提高企业创新、绿色运营及生态聚合能力为目标,携手全国渠
区块城市并购天涯社区会不会是炒作?
(原标题:区块城市并购天涯社区会不会是炒作?)最近,随着ChatGPT的不断升温,AIGC行业的被关注度迅速超过了元宇宙,加上国内外大厂在XR设备上的退缩表现,很多人认为元宇宙风口已过,遇冷是自然的事情。可就在日前,国内元宇宙初创公司区块城市(BlockCity)将并购天涯社
霍格沃滋领衔!3A大作频出!准备迎接狂奔而来的游戏浪潮!
沉寂已久的游戏市场,在近几个月可谓是卯足了力量。各类3A游戏可谓是层出不穷,领衔的自然是哈利波特迷不可不玩的IP作品——霍格沃兹之遗。对于怪物猎人的爱好者来说,不可不玩的必然是狂野之心。而原子之心等佳作也陆陆续续登录了各类平台。这个月不用说,也绝对是游戏玩家