这是什么意思呢?比如性格外向和内向,不是非黑即白的。
大多数人处于外向和内向的中间地带,是个连续变化的。
就好像在调节手机音量,是可以从0静音,不间断的调节到100最大音量,可以停在中间的任何一个位置。
但这篇论文提出的假设是不同的,爸爸认为,如果把观测的维度提高,人类的人格其实是由有限个「离散状态」组成的。
就像是bi把人分成16种,什么「骨折眉」、「快乐小狗」、「小蝴蝶」,或者大五人格分类。
当然这篇论文里的分类要复杂得多,可能要分为几千种,甚至几万种。
但无论分的再细,它依然是「离散」的。
余弦夹起一个凉透的饺子,咬了一口,豆腐馅的口感有些新奇。
「离散」,就像这碗饺子,这一只是豆腐馅,那一只是三鲜馅,另一只是猪肉馅。
它们是界限分明的类别。
你不可能吃到一个「30猪肉馅,70豆腐馅」的混合态饺子——
在离散的定义里,即使是混合馅,那它也会被定义成一个新的、独立的「猪肉豆腐馅」类别。
这意味着什么?
余弦还没想清楚,但父母把人的「人格特质」,当成了一种类似积木的形式,是有限的,可穷举的。
继续看论文。
第二个概念,是「向量化映射」。
这是2016年的论文,也是父母出事的那年。
那时候,有个叫lpgo的围棋i,刚刚击败了曾经的围棋世界冠军李世石,i和「深度学习」的概念,开始出现在大众视野里。
而在现如今的2025年,「大语言模型」已经占据了整个世界,豆包、cgp、gro、gei、千问、元宝都是大语言模型的代表。
余弦虽然不是研究i方向的,但他知道,大语言模型的基石,就是把文字转化为「向量」。
也就是这个标题里的「向量化映射」。
爸爸妈妈竟然在十年前,就已经在对「向量化」做研究了?
一上午的学习,余弦还只能浅显的理解这个概念。
简单来说,就是在计算机眼里,所有的文字,都是以「坐标」的形式存在的。
拿这个领域里,一个很出名的公式来举例:
国王-男人+女人=皇后。
国王向量,减去男人特质,加上女人特