《智能时代--大数据与智能革命重新定义未来》读书心得

发表于 2017-04-17 更新于 2024-03-24 分类于读书心得

几千年来，我们都是以一种确定的方式来看待世界，我们努力找出上帝在表象之后设定的因果关系。令我们倍加鼓舞的是，我们还取得了不少的突破。从伽利略到牛顿到爱因斯坦，一批批的科学家用一些简单的公式、定理、数学模型，定义了这个世界的行为，这些让我们人类的自信得到了极大的提高。
但是，人类社会在发展过程中，在我们的知识领域越来越大时，我们发现自己的未知领域反而更大了。这个世界在我们所理解的确定性之外，有着更多的不确定性。这个世界展现出来的一种混沌的表象，我们无法用确定的模型去模拟，即使想通过模型模拟，其中的参数数量也已经远远超出了人类所能控制的范围。例如天气预报，我们做到的只能是通过简化参数来预测（所以并不能做到100%准确）；甚至很多现象我们还找不出相关的模型和公式去模拟它，例如地震等。进一步说，量子力学里面的测不准原理直接定义了这个世界就是不可以直接测量的，更谈不上用模型去模拟了。
人类科学经过工业革命、信息革命的快速发展，到了现代，想像以前那样找出一个优美的数学模型去模拟现实的世界，已经越来越困难了。通俗点说，就是肉都给吃光了，现在每个研究领域都是在啃硬骨头。所以，想获得更大的科学突破，科学家们开始改变思维：能找到现象背后的因果模型更好，因为这毕竟是一劳永逸的事情，很好的体现了上帝的意志。但是，在这个每个突破的都需要漫长的时间里，我们可以通过大数据思维，在基于不确定的前提下，借助数据量的突破性增长、借助计算机能力的突破性发展，以及人类在人工智能方面的飞跃（Alphago战胜了李世石），通过数据的相关性来掌握事物的规律，然后基于机器学习，不断优化模型。这就是大数据思维的核心。
就像以前托密勒利用很多圆嵌套在一起，这个在地心说基础上的简单模型很好地描述了行星的运行规律，其准确程度比哥白尼基于日心说的模型还准确。同样，人们发现，在机器学习方面，多个简单模型的组合，然后通过大数据的机器训练，得出的参数结果，比复杂模型、小数据训练的效果更好。所以，现在数据量的增长成了解决问题的主要驱动力，在模型效果改进方面，模型的优化只占了20%，其它都是数据的增长带来的结果，例如机器的语音识别、机器翻译、图像识别等。
大数据给人们思维带来全新的改变，但在大数据阶段，相关技术的发展和支持也是关键。大数据体现出大数据量、多维度、完备性等特征，对数据的收集、存储、传输、处理带来很大的挑战。不过随着计算机技术的发展，这些问题已经慢慢得到了解决。
水到渠成，现在的机器智能在大数据的推动下，已经展现出了跳跃性的发展，使得人类开始正视人工智能对人类带来的好处和挑战。
人工智能能让我们这个社会更智能，例如智能交通系统、实时路况；能让我们这个社会更精细化，例如区块链（Block Chain）通过使用RFID技术跟踪产品的整个流通和交易环节；能让我们这个社会更个性化，例如新闻定制、疾病的个性化诊断等。大数据已经在农业灌溉（滴灌技术）、体育（数据分析、传感器反馈动作）、汽车制造、医药研究等等都发挥了重大的作用。
但是，人工智能（大数据）就像之前的工业革命一样，也会冲击现在人类的生活。包括从数据的安全（数据泄露的风险）、隐私的安全，还有就是冲击现在的职业体系。很多人在预测，人工智能之后，很多职业会在将来消失，甚至包括一些我们现在看来需要很高智能和经验的职业。例如律师，人工智能能更快速识别历史的档案文书、找出其中的有效信息；记者编辑，机器人能从各自媒体中，寻找热点问题，并写出不逊于人类的稿子；甚至将来的疾病也能通过人工智能进行诊断。
不管你愿不愿意，人工智能时代总要到来，那时将是一个最好的时代，也是一个最坏的时代（狄更斯《双城记》）。在这个时代到来的之前，我们需要做好什么准备，让这个时代成为我们最好的时代呢？

文章摘要

全球数据量按每年平均40%的速度增长。
大数据与机器智能相伴而生，促进物联网从感知到认知并智能决策的升华。
用不确定的眼光看待世界，再用信息来消除这种不确定性，是大数据解决智能问题的本质。
几千年来，我们人类的只是都是建立在归纳法之上，归纳法隐含的假设就是『未来将继续和过去一样』，换句话说应该叫连续性假设。
每一次大的技术革命都会带来阵痛，但同时诞生的，还有更多新的机会。
数据是文明的基石，人类对它的认识也反映了文明的程度。
数据中隐藏的信息和知识是客观存在的。...数据中挖掘出信息，对其进行处理和抽象后就是知识。
很多时候，我们无法直接获得信息，但是我们可以将相关联的信息量化，然后通过数学模型，间接地得到所要的信息。而各种数学模型的基础都离不开概率论和统计学。
回到数学模型上，其实只要数据量足够，就可以用若干个简单的模型取代一个复杂的模型。这种方法成为数据驱动方法。它是大数据的基础，也是智能革命的核心，更重要的是，它带来一种新的思维方式。
大量数据的使用，最大的意义在于它能让计算机完成一些过去只能有人类才能做到的事情，这最终将带来一场智能革命。
今天几乎所有的科学家都不坚持『机器要像人一样思考才能获得智能』，但是很多门外汉在谈到人工智能时依然想象着『机器在像我们那样思考。』...机器智能最重要的是能够解决人脑所能解决的问题，而不是在于是否需要采用和人一样的方法。
笛卡尔的贡献在于提出了科学的方法论，即大胆假设，小心求证。这个方法论在我们今天的工作中还在使用。
牛顿找到了开启工业革命大门的钥匙，而瓦特拿着这个钥匙开启了工业革命的大门。
相比工业革命，任何王侯将相所谓的丰功伟绩都显得微不足道。
信息论的作用远不止在科学和工程上——它也是一种全新的方法论。与机械思维是建立在一种确定性的基础上所截然不同的是，信息论完全是建立在不确定性基础上，而要消除这种不确定性，就要引入信息。至于要引入多少信息，则要看系统中不确定性有多大。这种思路成为信息时代做事情的根本方法。
熵这个词，成了信息论和不确定性的代名词。
而数据之间的相关性在某种程度上可以取代原来的因果关系，帮助我们得到我们想知道的答案，这便是大数据思维的核心。大数据思维和原有机械思维并非完全对立，它更多的是对后者的补充。
亚马逊：由商品直接推荐商品（Item to Item）
对Google自动驾驶汽车的各种报道通常会忽视一个事实，那就是它只能去Google『扫过街』的地方。
新技术 + 原有产业 = 新产业
中学为体，西学为用。
安迪-比尔定律：比尔要拿走安迪所给的。（What Andy gives，Bill takes away）安迪：intel的CEO，比尔：比尔.盖茨
主动的一方不是各种看得见摸得着的工业品生产商，而是提供软件和服务的一方。
通常人们在方便性和安全性方面优先考虑方便性，这是人的天性使然。
计算机系统的设计和高楼设计很大的不同是，前者实现并不考虑安全的隐患，而后者在每一个环节都要考虑安全的问题，这就是我们面临的现实。
工业时代的一个特征，就是一切标准化。
隐私就像自由，只有当人们失去它的时候，才知道它的可贵。
人类总体来讲是过分自信的，趋利而忽视危害，这一点研究幸福学和心理学的学者早就有了定论。
智能革命所要替代的是人类最值得自豪的部分----大脑。
其实社会公平只能反映在机会平等上，而不是结果平等。
在每一个重大的技术革命开始的时候，真正勇敢地投身到技术革命大潮中的人毕竟是少数，受益者更少，大部分人则会犹豫和观望。
使用大数据就像在一堆沙子里淘金，要从里面挖掘出有价值的东西。