用数据挖掘来支持音乐创作

2013-04-02

一年里红起来的歌曲也就那么几首,流行音乐的风尚总在变化,想要在高度商品化的流行音乐市场里赚到钱,依赖音乐人个人的天分已经很难,如果能借助QQ音乐、百度音乐这类拥有大量用户试听及其他行为数据的平台,分析出当下的流行元素,就可以创作出一些适合传播的音乐。 先来看这类音乐平台都有什么数据可以利用:

一、用户行为及评分

类型很多,学术上通常称为显式表达和隐式表达。包括用户打分、顶踩、播放、完全播放、跳过、收藏、评论、分享、加入某个列表、删除等等。这是用户对音乐的正向或者负向反馈,通常的做法是将这些行为按不同权重映射到-1到1区间里做运算。

二、音乐自身的属性

类型可能更加复杂,要从声音的物理属性和音乐本身的文化属性来说明。

物理属性:音色、音调、节奏等,就是听起来是个什么样子。普通用户大概没法理解什么叫做音乐调式调性,但是能区分嘈杂还是安静、激昂还是舒缓,略有音乐知识的用户还能分清乐器、曲风,甚至说得出编曲的特点,任何一个可以被区分出来的属性都有可能是用户喜欢的原因。

文化属性:这可能要从音乐所表达的情感来说,歌曲的歌词是很明确的情感表达,用户的评论是很明确的情感表达,与音乐经常一起出现的文字也是情感表达的参考,那些没有歌词的经典名作,已经有过无数人做出分析,是很好的样本。另外,情感的表现方式也是要考虑的,比如愤怒是一种需要宣泄的情感,所以表达愤怒的音乐通常激昂喧闹,但慷慨激昂的音乐不一定只是愤怒,这就是为什么摇滚乐一直被误解为是一种很吵的音乐,其实它只是情感表达直接而已。

有些不太方便归类的信息(可以称之为meta信息):作曲人、作词人、编曲人、演唱者、演奏者等等

三、音乐与用户的结合

上面两点是将音乐与用户独立来看的,还有些数据是两者关联产生的。比如音乐经常被使用的场景,音乐经常被播放的时间和地域地点。

准备好了这些数据原料,有过机器学习经验的人大概会想,将这些数据作为训练集,加上播放次数作为参考,就能预测出哪些音乐可能受到欢迎,确实是这样,但是还不至于能用来指导音乐创作,有经验的乐评人的意见可能更加准确且成本更低。

音乐是一种有效期适中的信息类型,相比电影或名著而言,它失效得快,但不至于像新闻和微博一样快,所以音乐的流行程度决定于自身特征,又容易受到社会风潮的影响。因此数据要支持音乐创作,首先要预测社会风潮(也就是社会中充斥的某种情感),确定这种风潮下会流行的音乐特点,然后才是“组装”一些合适的音乐(只是提高了流行的可能性),通过渠道(大平台会自己签艺人和歌曲吗?)去推广。

最后分享一篇夏一跳同学的文字 《如何创作一首神曲》 ,看完应该会会心一笑,机器学习和神经网络技术已经可以创作宋词,创作流行神曲的日子也不远了吧。

碎语

中午吃饭前想到了这个点,于是记录下来。这里讲的音乐创作是指作为商品的音乐,是功利的,它不应该只是商品,更应该是人们与自己与外界交流的方式,有太多追求理想的音乐人在“玩”音乐,我敬仰他们。

我尽量不使用“大数据”这个词,因为我没有看过任何一本“大数据”的书,实在不知多大算大数据

<< 回首页
Power by 陆++