腊月的季节

数据的历史

数据的来源

最近一直在研究傅里叶变换,高斯方程,我发现自己都不知道数据是怎么来的,而研究数据的工具是什么,意义又是什么都不知道。所有以前学来的现在都是理所当然,比如自然常数e,三角函数的出现,曲线函数的出现等等。我也不觉得记住公式有什么错,或许能考一个很好的大学。但是我不喜欢这样的教育,这样的教育,现在要花我几年的时间来抛开我十几年的理所当然,既然我已经具备逻辑思维,那么我大脑里面的东西就不能再容纳理所当然,除了感情。一切要从实际意义出发。
提起数据的来源那当然是人类为了计数,数据类型的发展过程,我觉得应该是这样的,整型数据、浮点型数据、虚数。这就是我们现实中的数据,应该就这三个吧,可能没有写完整!其他的,都是用这些数据来描述的。像你们说的负数,我觉得它不属于基本数据类型,更像一种对数据的操作。

数据的操作

说起数据的操作那可多了,我认为的数据操作是什么呢?我认为数据的操作的发明需要根据具体的业务场景,比如当初人类发明的加法操作,当把一种物质抽象成数据来进行计数,那么加法操作是在所难免的。其实在我们刚开始接受加法的时候是很有体会的,在计算1+1的时候很简单,当计算58+45就不知道了,因为我们会掰指头。十个指头就可以算加法了,这就是你把指头抽象成数据。由于后来抽象思维越来越高,我们把所有学的都当成理所当然。蛮怀念不会的时光,如果让我再来一遍, 我一定研究个清楚。

数据的探索

人们总是对未知的东西充满好奇,那么如果在你面前摆一个陌生的东西,你又该如何分析呢?以前我不知道,但是现在我知道了,把这个东西抽象成数据,这里面的数据就多了,按照计量单位来说(这里说一下,计量单位其实就是人类对世界上存在的但是还无法在大脑抽象的物质做一个定义,如长度单位,一旦我们做出一个定义,并且把这个定义用在物质本身,全球都用同一个定义,难道你还不能抽象出这个物质,在举个例子,我告诉你一个长方体长5cm,宽10cm,高3cm,难道你还不知道,当然,前提是你要有这些定义)的话,有长度,重量等等就不一一列举了。你们都听过碎花瓶理论吧!虽然这是一个谣言,但是我们可以看到它在数据上为我们带来的方向。碎花瓶理论就是一个人打碎了一个花瓶,它把碎片按重量分成了三类,最大,次大,第三大,结果发现最大:次大重量比=16:1,次大:第三大重量比=16:1。于是他总结出最大:次大:第三大=256:16:1。这就是对数据的一种探索,看似很简单,但是一结合生活中的实体就不一样,很有意义,所有破碎的物体都符合这个规律的话,难道没意义吗?这对考古界是多么有意义的。可惜不能通过所有的物体破碎规律。但是它向我们解释了抽象数据的可研究性和可普遍性。

数据探索从古至今发生过得事

其实有很多东西都是基于探索才出来,并不是我们学的那么理所当然,比如函数。我们拿起一元二次函数,二元二次函数,二元一次函数都会算,但是你却不知道它是怎么产生的,这样的教育实在埋没人才。我们既然不能了解它的推理过程,至少能知道它的前世今生吧!幸好现在互联网发达。就我在网上的了解,在十七世纪,伽利略发现了在大量的数据面前(这个大量数据是多种数据中的同一类数据在时域上的大量数据),必然存在一个变量对另一个变量的依赖关系,如果你没有发现依赖关系,有三种原因第一、你的数据种类不够,第二数据量不够,第三依赖关系分析的不到位(你甚至可以自己再定义一个自然常数,不要局限思维)。

数据抽象

说起抽象,我想从笛卡尔坐标系来说,这个百度百科上也有说,但我觉得不够好。我认为笛卡尔能想出坐标系的根本在于抽象,如果我是笛卡尔,我会想,既然我的几何图形能够用数据来抽象,那么我能不能用数据来抽象我的几何呢?他确实做到了,他建立了二维坐标系(包括后来的三维坐标系,我觉得也基于笛卡尔),我只要自己去做一些正方形的长宽数据就可以在这个坐标系模拟出来,并可以进行进一步的几何分析。那么这样一来,二维坐标系既可以把数据做几何分析,又可以把几何做数据分析,这是多么一个伟大的工具,现在想想,真是太厉害了。数据做几何分析举一个例子,回归方程,回归方程大家都知道,我也知道大家都当成了理所当然,那就让我揭开这里面一层层的面纱吧!回归方程又分线性回归方程和非线性回归方程,这里就说线性回归方程,回归方程是根据样本数据通过回归分析所得到的反映一个变量(因变量)对另一个或一组变量(自变量)的回归关系的数学表达式。当你拿到样本数据,你该建立什么样的方程呢,这个问题就不探讨,要针对具体的业务场景。这里我就建立回归直线方程,也就是ax+b=y,a,b未知所以我们需要两组样本数据来求解方程组,任意拿出两组是可以求出这个方程组,但是这个方程组是你想要的吗?那么你怎么去知道求出来的方程组又是你想要的呢?这就要说二维坐标系,我们事先把样本数据画在二维坐标系上,然后根据我们求出来的方程在二维坐标系上,就可直接看到有多少个点在这个直线上,这样我们就知道这个方程是否是最优的,当然后来还有最小二乘法。我这个是基于没有最小二乘法的时候。这说明了几何与数据在二维坐标系上的联系性,至于几何在二维坐标系上做数据分析,我也就不说了,有很多比如三角形的中心。

热评文章