megrxu

脑洞:有关信息,语言和知识

我的民科思想记录。

引子

在这学期学习信息论的时候,就觉得犹如醍醐灌顶,仿佛是在把对于事物的直觉转化成式子。

这种忽然清晰的感觉甚至有点类似于小时候的第一次接触数学和大一第一次接触编程。于是也在脑袋中不断回想有关的概念和知识。

比如今日在群里遇到某个段子的时候:

小学奥数题:浙大有3个人,甲,乙,丙。他们一人是巨佬,一人是菜鸡,一人是中等选手。其中,菜鸡永远说真话,巨佬永远说假话,中等选手有时说真话,有时说假话。请根据下列言辞,判断谁是巨佬,谁是菜鸡:

甲:还好我不是最菜的;

乙:我是真的菜鸡啊;

丙:你们都在说谎。只有我最菜啊…… (根据浙大现象改编)

如果将甲乙丙的回答都换成一样的「我是最菜的」(这也更符合现实),很明显就无法得出答案,因为前置条件和实际结果之间的互信息是0…


信息和语言

类似于机器通过二进制符号进行信息传递,人与人之间的信息传递是通过语言和文字的。这种简单的传递方式持续了千年,而且至今也在不断地演变和发展。它似乎和个体的机能高度耦合。例如脑部损伤造成 「无法辨认文字,但可以听懂说话」 这样的症状,就可以说明了。

但是实际上,人们之间的交流,和机器之间的交流,有相当多的不同。

  • 人们之间的交流,实际上只能算作「试图重现」。

    机器之间的交流,更倾向于信息的拷贝再处理,其中的每一个环节都有着十分清楚的逻辑和作用。但是对于人来说,对听到的话语进行理解,是一个黑箱的过程。没有任何手段确定受众是否理解了,甚至没有手段确定自己是不是对自己的脑中的概念表述得正确

    更多时候,人们的信息交换都是经验式的。通过从小习得的一种理解能力(类似于共情),可以对听到的话语进行一种重现,以便进一步在头脑中构建类似的概念。

  • 信息的载体是语言,但是语言是复杂的,是基于历史和习惯的,不具有逻辑的。

    相较之下,给机器设计的语言(或者称之为编码)都十分严谨,在尽可能规避歧义。但是实际上,要使编码被人理解,仍然需要对其意义在自然语言上进行规定。也正是因为自然语言的重要性和更大的随意性,使得自然语言理解也变得十分复杂,因为这相当于是在已定的形式中寻找规律。

语言和知识

在教授知识的过程中,我们也使用的是自然语言。很明显,这种教授是有效果的。从小学开始,我们渐渐懂得一些知识,有的知识可以用公式表达,有的知识就是一段话。有的知识甚至是一件事,进而可以总结成许许多多不同的话。

疯狂地说,我们可以把一个小孩从小时候到长大成人所听到的所有的话,见到的所有的文字,都记录下来,这些数据本身,结合个体的发育和成长,就确实含有他所习得的所有知识

但是知识这个东西,对于每个人来说都不是那么清楚的。我自己无法总结自己所习得的知识,即便是明白你所需要我说的知识是哪一点,我也只能通过再表示成自然语言的形式来重现这个知识。

知识表达,应该对于我们理解「学习过程」有着十分重要的作用。而同时,感觉上,如果我们能够成功地通过不依赖自然语言的方式「表达知识」,也对知识的信息化和数字化有了极大的突破。甚至说白了,我们也就可以不依赖自然语言进行信息传递了。