什么人听什么歌?
- Published on
你是一个什么样的人?
关于什么是人格,有哪些维度,怎样衡量,心理学中有很多理论以及配套的测评工具。其中一种很出名,叫作 大五人格(the Big Five),五个维度对应的英文首字母连起来正好是单词 OCEAN,包括:
开放性(Openness):个体 精神与经验生活(mental and experiential life) 的广度、深度、原创性以及复杂度
尽责性(Conscientiousness):社会规劝性的冲动控制(socially prescribed impulse control) 以促进任务与目标指向性行为的达成,如三思而后行,延迟满足,遵循规范规则,计划、组织与排序任务
外向性(Extraversion):充满活力地对待(energetic approach)社会以及物质世界,包含的特质如喜爱交际的、自信坚定的、活动积极的、正性情绪
怡人性(Aggreableness):对他人是 亲社会以及公共取向的(prosocial and communal orientation),对比对抗性,包括的特质如利他、谦虚、温柔、信任
神经质(Neuroticism):负性情绪(negative emotionality),如感到焦虑、紧张、悲伤,对比情绪稳定、心境平和
要特别说明的是这五个维度的得来并非基于研究者构建的什么人格理论,而是从人们描述自己与他人的 自然语言 词汇中提炼出来的(词法路径,lexical approach),所以它对人格心理学研究的重要贡献在于给五花八门的描述词汇提供了一个整合性的框架。
写到这里必须要先拐一个弯沿着大五人格方法论的方向再往前多走两步,因为它或者说人格与自然语言间的关系我之前也不知道,不曾想上世纪 40 年代的人格学家竟然会从字典下手,去搜罗所有用来描述人格的词汇。想想当前机器学习领域火热的自然语言研究,还有后面就会看到的对情绪类似的研究方法,这之间的暗合与呼应很有意思。
1936 年心理学家 Allport 和 Odbert 从英语辞典中识别出将近 18000 个词汇并将他们分为 4 大类,分别可按 特质(traits)、状态(state)、评价(evaluation)、活动(activities) 概括:
人格特质(personality traits),即在与周围环境交互时稳定一致的表现倾向,如社交性(sociable)、攻击性(aggresive)、害怕的(fearful)等等
短时的状态、情绪与活动(temporary states, moods, and activities),如害怕的(afraid)、欢欣的(rejoicing)、兴高采烈的(elated)
对个人行为与名誉高度评价性的判断,如卓越的(excellent)、普通的(average)、烦人的(irritating)
躯体特性、能力和天赋,以及其他与人格不太相关的词汇
面对这令人头大的 18000 个词汇,Cattell 选择从 4500 个 特质相关 的词汇下手,采用基于语义和经验性的聚类方法,结合他自己对当时已有相关文献的综述,将 4500 个词汇压缩至 35 个变量,进一步又提取出 12 个因子,这也是他 16 因素人格问卷(16 Personality Factors, 16PF)的重要组成部分。不过受当时数据分析方法的限制,他的模型以及得出过程后来都受到了质疑。
即使如此,Cattell 的工作还是刺激了更多的研究者关注人格特质的维度结构问题,大五人格就是在此基础上产生的。所谓 “大五”(Big Five)——Goldberg 1981 年所起的名字,其实是要强调这五个维度是很抽象的概括,并非是把人格缩降为五种特质,相反,每一个维度下都包含很多独特、具体的人格特点。
之所以会关注到人格是因为这似乎是心理学视角下研究音乐时常会切入的路径之一,例如下面这项研究:
"Just the Way You Are": Linking Music Listening on Spotify and Personality
这是去年发表的一篇学术文章,基于 5000+ Spotify 用户、时长 3 个月的音乐聆听数据构建音乐偏好(music preference)与聆听习惯模型,再对大五人格(the Big Five)量表得分做回归分析,结果特别是在 情绪稳定性(Emotional Stability) 与 尽责性(Conscientiousness 上发现较高预测率,即 音乐偏好与人格特质相关。
音乐偏好(music preference)与推荐算法
在前面提到的那项研究中,他们使用了 Spotify 内部定义的 66 种音乐类型(genre)和第三方公司 Gracenote 定义的 25 种音乐情绪,再根据用户三个月内的聆听记录,最终为每一个人在统一的偏好地图中找到相应位置。接下来很自然就引出至少三条线索,分别是:音乐类型的定义、音乐情绪的定义、对应推荐算法。
音乐类型(genre)
顺着上面的思路讲到利用机器学习划分音乐类型,很快就会遇到 Glenn McDonald。他建了一个叫作 Every Noise At Once 的网站,打开就能看到他们目前发现/新建的所有音乐类型名称,而且非常方便就能听到该类型对应的示例音乐以及更多相关的音乐人和作品。他曾经属于 Echo Nest 这家公司,后来 Spotify 收购了他们,所以他们现在都属于 Spotify。下面这两篇文章有介绍他们的相关工作,但都没有涉及技术细节:
How Spotify Discovers the Genres of Tomorrow
How We Understand Music Genres
下面这篇是 Wired 杂志 2014 年对 Echo Nest 公司的介绍文章,创始人来自 MIT Media Lab,除了音乐类型,他们的其他工作成果(记得还有推荐算法)在音乐技术领域似乎也有很大影响,值得了解一下。
Echo Nest knows your music, your voting choice
音乐情绪(music mood)
在看到前面研究中提到的 Gracenote 公司之前,先知道的是 MusiMap 公司,因为其中的技术核心与 Madmom 的开发者同属于维也纳深度学习圈子(Vienna Deep Learning Meetup)。
类似前面研究做的事,打开下面这个网页,上传你喜欢的一首歌或是一个歌单,就会得到关于你的音乐偏好、人格相关的反馈结果:
You Are What You Listen To by MusiMap
技术细节也是不清楚的,但下面这里可以看到他们用到的各类型标签:
下面这篇文章则是介绍前面研究中采用的 Gracenote 公司对音乐情绪的定义:
Feel like listening? Computing Musical Mood at Gracenote
推荐算法
终于有技术细节了。
下面是 Sander Dieleman 的博文,介绍了他在 Spotify 实习时的工作,使用卷积神经网络(convolutional neural networks) 基于内容的音乐推荐(content-based music recommendation)。另相关学术文章在此,相关报告 PPT 在此
Recommending music on Spotify with deep learning(2014)
下面这篇则是基于音乐相似性的推荐,ESSENTIA 核心开发者的博士论文:
再向前,2011 年 Òscar Celma 与 Paul Lamere 做的关于音乐推荐与发现的报告,幻灯在此。Paul Lamere 就是 Echo Nest 曾经的开发者平台主管,现在应该也在 Spotify 工作。
DJ-Running: An Emotion-based System for Recommending Spotify Songs to Runners
音乐推荐系统(Music Recommendation System,MRS)
- 下一首歌推荐系统(next-song recommendation systems): 实时在线生成个性化歌单,既考虑用户长时的偏好与使用习惯(intrinsic information),又考虑当下短时的传感器反馈信息,如位置、场景等外部信息(externel/context information),另外结合音乐本身的特性(可以回避掉冷启动(cold start)问题)。
DJR 可以监测体育训练时用户实时的情绪与生理活动变化,然后推荐适合的音乐以提高训练的动机和表现。
备忘
聚类分析、因素分析、主成分分析等降维相关的数据分析方法
自然语言研究中对词汇语义的处理和分析方法
网站 Musical Universe by David M. Greenberg
听歌曲片段后回答一些问题,得到人格等反馈结果;Greenberg 是正文提及研究的作者之一
参考
迷思
目前关于机器学习看到的很多材料都来自 2015、2016 这两年,那两年真的有特殊性吗,最近这些年怎么总是遇不到呢?