# 1.2 机器学习介绍

# 1.2.1 机器学习是什么

机器学习研究如何使用计算机算法和统计模型来使计算机系统能够自动学习和改进性能,而无需显式地编程指令。简单来说,机器学习旨在让计算机能够通过数据学习,并从中提取规律、进行预测和做出决策。

与传统的编程方式不同,机器学习的关键是通过统计学算法,对大量的数据样本,通过训练模型来学习数据中的模式和规律,并根据这些学习到的知识对新的数据进行预测或分类。这些模型可以被应用于各种领域,如图像和语音识别、自然语言处理、推荐系统、金融预测等。

抽象到人的层面,我是这样理解的,人的大脑/天赋是算法,所学到的知识,遇到的事情,称之为数据,学习沉淀后变成经验,称之为模型,然后使用自己的经验(模型)来预估未来生活中未知的事情。

# 1.2.2 机器学习的定义

模拟人的大脑,让机器去学习现有数据的规律,使用学到的经验去预测未来数据。

  • 机器学习是一门人工智能的科学,该领域的研究对象是人工智能
  • 机器学习是对能通过经验自动改进的计算机算法的研究
  • 机器学习是用数据或者以往的经验,以优化计算机程序性能的标准

# 1.2.3 机器学习三要素

# 1. 算法

把需求抽象成对应的数学问题,选对好的算法。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。 首先要明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。

人的大脑是不同的算法,也被称之为天赋,在都努力学习的前提下,有的人适合学习,有的人就是学不会。
学不会的人或许学习方法不对,一个学习方法不会让所有人适应,因为每个人的大脑并不是一样的,不同的大脑适应不同的学习方式。所以只能找到一个适合大部分且中规中矩的学习方式进行教育。
那当然或许他的大脑真的不适合学习此类知识,但古人云:天生我材必有用,这句话不无道理,每个大脑都有自己适合的领域,可能很早就接触到,也或许穷其一生也没找到。

不同的算法解决不同的问题,有的算法不适合做这种事情,就不要勉强,虽然勉强应用也可以解决部分问题,强扭的瓜不甜,让专业的人干专业的事。

有人说所谓的天才就是99%的汗水加上1%的天赋,然而这1%的天赋是99%的人没有的,这是万里挑一的算法

有些人天生算法适合做科研,你的算法适合做韭菜,即使学一样的知识,人家可以拿诺贝尔奖,你依旧研究不出来什么东西。

# 2. 数据

数据是人工智能中很重要的一部分,虽然算法很重要,但是哪怕你有很好的天赋,没有好的知识学习,那最后的效果肯定不理想。

例如有两个小孩张三和李四,他们的大脑是一样的算法

张三从小受环境的影响,接受良好教育,阅读大量书籍学习。

李四从小到大跟一些不学无术的人在一起,天天学很多毒鸡汤。

那么通过两种极端的数据训练出来的人,效果能一样吗?所以教育非常有意义,学到的知识越多,可预测的事情就越多。

我们都是通过数据学习,才会有现在的经验,你永远想不到一种你没见到过的颜色。

数据决定了机器学习结果的上限,而算法只是尽可能逼近这个上限。

# 3. 算力

算力可以理解一个人大脑的学习速度,如果学习速度很慢,那么也是不行的。

在机器学习中,算力越高,学习数据样本速度越快,预估结果越快,一般我们知道计算机使用CPU做运算,但是GPU是一种计算机处理器,可根据给定的数学计算执行图形和成像任务,拥有强悍的算力。

Last Updated: 11/17/2023, 3:32:45 PM