编辑推荐:
为解决在线钢琴学习中的音频检索问题,研究人员开展了基于新指纹(NF)算法的钢琴伴奏系统研究。结果显示,NF 算法性能优异,该系统准确率高,适用性良好。这为钢琴学习者提供了高效的学习辅助,降低成本,提升学习体验。
在当今时代,随着物质生活水平的不断提高,人们对精神层面的追求也日益提升,音乐素养逐渐成为一项重要的评价标准。钢琴,作为西方古典音乐中的键盘乐器,凭借其宽广的音域、清脆响亮的音色和强大的表现力,深受众多家庭的喜爱,成为学习乐器的热门之选。然而,在钢琴学习过程中,却面临着诸多难题。
一方面,家长往往因缺乏时间和专业音乐技能,难以辅助孩子完成钢琴老师布置的任务,使得伴奏这一角色逐渐演变成一种社会职业。但线下教学受多种因素限制,尤其是近年来受新冠疫情影响,线下钢琴教学受阻。另一方面,虽然线上练习伙伴蓬勃发展,在线伴奏分为伴奏教师远程服务和人工智能辅导两种方式,但前者受限于伴奏教师的专业水平和课时,存在诸多不足;后者虽然能提供标准化服务,但现有相关应用智能程度较低,难以识别用户弹奏的曲目,操作复杂,无法很好地满足用户需求。
为了解决这些问题,推动钢琴教育的发展,研究人员开展了基于新指纹(NF)算法的钢琴伴奏系统的研究。
研究人员为实现这一目标,运用了多种关键技术方法。首先,在音乐信号分析方面,通过傅里叶变换(FT)等技术,对音频信号进行处理,提取合适的音乐特征。其次,采用机器学习(ML)技术构建钢琴转录模型,如基于神经网络进行训练,实现从原始音频中推断音符。同时,利用隐马尔可夫模型(HMM)进行音频分数对齐,以提高匹配精度。此外,设计了 NF 算法,结合钢琴音频特征,解决钢琴音频与原始歌曲的匹配问题 。
下面来看看具体的研究结果:
- 数据集来源及应用范围:研究使用了两个主要数据集,其中 MAESTRO 数据集包含大量高质量钢琴演奏数据,为算法训练和验证提供了丰富材料,该系统主要面向钢琴学习初级阶段的儿童和家长。
- 性能分析:通过与传统指纹算法(FA)和主流音频事件检测算法(AED)对比实验,NF 算法表现优异。其平均精度达 98.76%,比 FA 高 31.93%,比 AED 高 18.60%;平均召回率为 87.84% ;平均 F1 值为 98.53%。在检测时间上,NF 算法也明显快于其他两种算法。在与 Shazam 检索系统的对比中,基于 NF 算法的钢琴伴奏系统平均准确率(Accuracy)为 97.53% ,比 Shazam 系统高 11.86%,Accuracy N 值为 1.2,比 Shazam 系统低 2.9,表明其匹配性能更好。在对不同音乐作品的检测中,该研究方法的准确率达到 0.9872,高于 Shazam 系统的 0.9540,显示出更强的处理复杂音乐作品的能力和泛化能力。
- 应用分析:通过对 300 名用户的问卷调查发现,88% 的用户更愿意使用该系统进行钢琴学习,45% 的用户非常满意,28% 的用户相对满意。用户对系统中音乐可视化在钢琴教学中的应用、简单易懂的乐谱阅读功能、智能评分模块、反馈及操作便捷性较为满意,同时希望系统增加简单乐谱阅读功能和制定个性化教学计划。
综合来看,研究人员成功设计出 NF 算法,并基于此构建了钢琴伴奏系统。该系统在音频检索和钢琴学习辅助方面表现出色,为钢琴学习者提供了更高效、便捷的学习工具,降低了学习成本,提升了学习体验。然而,研究也存在一定的局限性,如乐谱库输入受人工限制,教学材料录制周期长,且系统目前仅适用于初级学习阶段用户。未来,研究人员计划进一步研究基于计算机的乐谱图像智能输入技术以及乐谱图像转换为电子乐谱的技术,以拓展系统功能,为更多钢琴学习者带来更好的服务。这项研究成果对于推动在线钢琴教育的发展具有重要意义,为该领域的后续研究提供了新的思路和方向,有望在未来不断完善,更好地满足人们在钢琴学习方面的需求。