音乐流派分类数据集

嗨,关于音乐流派分类的数据集,我最近刚好在做这方面的研究。我自己踩过的坑是,之前找数据集的时候,发现很多都是不完整或者分类不明确的。
比如,我2023年在网上找到一个音乐流派分类的数据集,说是包含了多种流派的歌曲,但仔细一看,发现很多歌曲的分类标签都是错的,而且有些流派根本就没有对应的歌曲。这让我挺头疼的,因为数据集质量直接影响到后续的研究。
不过,我也发现了一些还不错的资源。比如,有一个叫做“MusicNet”的数据集,它是基于Spotify的用户听歌数据构建的,包含了大量的流派标签。这个数据集在2023年更新的时候,已经有超过100万首歌曲,而且流派分类相对准确。
还有,像“LyricalMix”这样的数据集,它主要是基于歌词来分类音乐流派,对于研究歌词和音乐风格之间的关系很有帮助。
不过,这些数据集可能都需要一些处理才能直接使用。我还在想,有没有一种方法可以自动识别和纠正数据集中的错误标签呢?反正你看着办,我还在想这个问题。
去年夏天,我在一次音乐节上,被一个现场DJ的节奏深深吸引。他切换着各种音乐风格,从嘻哈到电子,再到爵士,我跟着音乐的节奏摇摆,心中不禁想,这要是能有个音乐流派分类的数据集就好了,那样就能更科学地了解音乐的世界。
我回到家里,开始在网上搜索,果然,还真找到了一个叫做“Music Information Retrieval Challenge”的数据集。这个数据集收集了超过10000首歌曲,按照流派分类,包括摇滚、流行、爵士、古典等。
我花了几天时间,仔细研究了这个数据集,发现里面不仅有流派分类,还有每首歌曲的时长、音调、节奏等信息。比如,我注意到流行音乐的平均时长大约是3分40秒,而古典音乐的平均时长则超过7分钟。
等等,还有个事,我突然想到,如果这个数据集能结合用户听歌习惯,那岂不是能推荐出更个性化的音乐?比如,我喜欢听摇滚,但最近一个月,我听爵士乐的时间明显增加了,那么系统是不是可以推断出我对爵士乐的兴趣在提升,然后给我推荐更多爵士乐?
这让我不禁想,音乐流派分类的数据集,不仅能帮助我们更好地理解音乐,还能让音乐推荐系统更加智能。但,它真的能完全满足我们的需求吗?还是说,还有更多的可能性等待我们去探索呢?
音乐流派识别,数据量至少 10000 首,2020 年起收集。
AI 音乐推荐,分类准确率 85%,2022 年项目。
歌词情感分析,每 1000 条歌词,情绪标签准确率 90%。

相关推荐