请选择 进入手机版 | 继续访问电脑版
客户端

什么是机器学习?

所在版块: 区块链技术 2018-03-20 17:51   [复制链接] 查看: 1185|回复: 293

什么是机器学习?
   机器学习使用计算机通过识别数据中的模式来预测未知对象属性。
机器学习兴起的最重要原因是它在包括图像,声音,视频,文本,软件代码,粒子碰撞,化学描述符,DNA,社交网络和财务数据等广泛不同领域的成功。
   有趣的是,构成大多数机器学习系统的构建块的数量比人们想象的要小。对于许多将在后面的章节中详细讨论的深度神经网络来说尤其如此。
   换句话说,我们可以将少量的基本元素结合到系统中,这些系统对于图像分类,问题回答以及自然语音合成等多种应用而言具有巨大的价值。
   虽然机器学习可以应用于许多不同的领域,但大多数生产系统都针对单一目的进行了优化,并且处理了一种特定类型的对象。
例如,计算机视觉系统专门从事与图像或视频相关的任务,如交通标志识别[1]和医学图像分类。
对象
   由于机器学习涉及未知的对象属性,因此自然的出发点就是讨论对象。
   为了本教程的目的,对象是任何具有属性的对象。
   我已经答应过,我会抽象的概念具体化,并使用视觉效果。这是一张照片,显示了三个示例性对象(欲望):
001.jpg
  除了其他属性之外,这些冰淇淋勺中的每一种都具有特色口味,所呈现的各种颜色,一定程度的流行度,所售价格等等。
(三个三勺冰激凌的共同特点是它们比华夫饼锥更有趣的属性。)
属性
一个属性是什么,表征的对象。
让我提前提醒你。我喜欢概念树。因此,你会在本系列的过程中看到很多。这是第一个:
002.jpg 在高层次上,我们可以区分测量属性和未测量属性。
许多属性都是可衡量的。简单的例子包括一勺冰淇淋的重量和单位在特定地点和时间出售的价格。在可衡量的属性中,只有一小部分实际上将作为项目期间数据收集活动的一部分进行衡量。
其他属性不会被衡量,因为它们要么不相关,要么超出我们目前的理解,要么超出我们的预算。据推测,大脑具有我们可以测量的属性,以创造出完美的新冰淇淋风味。然而,在实践中,这种努力受到我们对大脑如何产生品尝美味冰淇淋的主观体验以及放在所需扫描设备上的价格标签理解不完全的限制。
测量的属性
我们进一步将测量属性分为两个子类型:
目标特征
该目标是我们关心的,我们想预测的属性。
一些基本同义的术语是因变量,未观测变量,解释变量,输出变量和结果测量。
[我应该注意到,在机器学习中使用的一些概念在其他社区中以不同的名称而已知。在许多方面,机器学习是统计学的后裔,两个领域之间有很强的重叠。因此,当您深入研究文献时,您可能会遇到受统计人员欢迎的变体。
在介绍一个新术语时,我会提到一些经常使用的同义词,然后始终如一地使用机器学习社区中最受欢迎的变体,并且与整体画面最吻合。]
很多时候,目标对于某些对象是已知的,而其他对象则是未知的。例如,我们可能想要根据已知的历史销售数据来预测未知产品的未来销售数据。
功能是(可能)与目标相关的属性。
例如,产品的价格与产品的需求有关。取决于具体情况,这种关系可能很强或者很弱[3],但价格当然是应该想到的第一个特征之一。
在其他社区中,特征通常被称为独立变量,观察变量,解释变量和输入变量。
属性值
一个属性值是属性的关于一个特定的对象的值。
如果目标是下一季度的销售数字,那么目标价值的例子可能是8,000个单位。
与目标类似,我们可以使用术语特征值来指代特定对象的特定特征的值。以美元计价的价格特征值可能为99.99
模式识别
机器学习基于以可预测的方式重复的特征和目标之间的关系为前提。我们将这些关系称为模式。
如果我们生活在一个没有模式的世界中,那么机器学习就没有用处,而且本教程也不会被写入也不会被读取。幸运的是,我们发现自己的宇宙是高度结构化的。经验科学的成功[4]证明了模式存在并且可以被发现的观点。
在不久的过去,Herculean努力设计出与特定任务相关的功能。例如,关于为某些计算机视觉问题开发的功能的大量文献,例如机器人识别房间内物体的能力[5]
在过去的十年中,机器学习的进展使得在某种程度上可以自动搜索特征[6]
以计算机视觉为例
为了结束这篇文章,我们使用一个具体的例子来深入了解功能和目标之间的关系。
003.jpg
假设你刚开始在系统上工作,目标是自动识别照片中的动物。
上面的照片具有显示猩猩母亲和她的婴儿的属性,这是我们显而易见的事实。
然而,对于计算机视觉系统而言,这远非明显。在开发之初,它对猩猩,母亲或婴儿没有任何了解。
在描述我们能做些什么来改变这一点之前,我想问你一个问题。
如何你解决这个任务吗?也就是说,你如何理解上面的照片显示了两只猩猩?
人类视觉(和普通的灵长类视觉)效率很高,只需要很少的有意识的努力就可以发生,需要一段时间才能提出一个精确的,令人信服的答案。
我建议你暂停一下并思考一下。在这样做的时候,你可能会想到下面描述的一些想法,并最终意识到至少某些形式的机器学习比他们看起来更直观。
答案的一部分是,我们已经看过类似猩猩的照片。
在某些情况下,我们提供了相关图像,但没有太多描述或上下文。例如,我们可能会在翻阅电视频道或浏览我们的Facebook供稿时简要地看到这些猿猴。
在其他情况下,猩猩的图像与特定信息一起呈现,使我们能够轻松识别图案。这可能是在纪录片,动物园访问,学校课程或其他学习机会期间。
其中一种模式是猩猩有橙红棕色头发。这种显着特征的存在使得许多其他可能性大大减少。
另一个相关的方面是他们半独居的生活方式。在他们形成的强大母婴关系之外,猩猩通常单独出现。所有其他的事情都是平等的,许多人在同一张照片上的存在可能是一个特征,指出猩猩的缺席。
我们可以关注的另一个信息来源是背景。作为最大的树栖动物,猩猩常常出现在照片上,显示他们居住的森林的树冠。
这是我们用来检测图像中进化亲属的一些高级功能的直观说明。稍后的教程将介绍机器学习模型如何学习要素分类以分类图像。值得注意的是,这些功能中的一部分将变得易于理解,并且与灵长类视觉中使用的功能具有一定程度的相似性。
监督机器学习
收集相关数据和识别模式以产生预测的工作流程是所谓的监督(机器)学习的本质。在这种设置下,目标值(例如,某些内容不存在)对于某些对象(例如图像)是已知的,而对于其他对象是未知的。
在计算机视觉的背景下,我们作为教师向学习者(计算机/机器人)展示示例图像,提供内容的简要描述,强调某些特征并选择帮助学习者看见数据模式的策略。
经过一些调整,同样的过程可以用在开始提到的许多不同的领域,从文本和声音到化学结构和社交网络。
我们将逐渐将这种直觉精确化并将其整合到概念网络中,以便您了解机器学习应用。


翻译:铂链志愿者-技术组
校对:技术组秘书

原文连接https://towardsdatascience.com/machine-learning/home



回复

使用道具 举报

bto

发表于 2018-3-20 20:24:58 来自手机 | 显示全部楼层
讲解的很详细,沙发
回复

使用道具 举报

龙奥传奇

发表于 2018-3-21 14:27:45 来自手机 | 显示全部楼层
学习中,慢慢消化
回复

使用道具 举报

hmjy123

发表于 2018-3-30 23:14:26 | 显示全部楼层
好好学习 天天向上
回复

使用道具 举报

不想拔草了

发表于 2018-3-31 00:00:23 | 显示全部楼层
图文并茂,非常棒
回复

使用道具 举报

风老大

发表于 2018-3-31 00:13:27 | 显示全部楼层
先支持一下,在看
回复

使用道具 举报

湖蓝

发表于 2018-3-31 08:24:21 | 显示全部楼层
可以应用于许多不同的领域,但大多数生产系统都针对单一目的进行了优化,并且处理了一种特定类型的对象。
例如,计算机视觉系统专门从事与图像或视频相关的任务,如交通标志识别[1]和医学图像分类。
对象
回复

使用道具 举报

xuxu8126

发表于 2018-3-31 08:33:16 | 显示全部楼层
早晨好各位
铂链最帅
回复

使用道具 举报

天涯168

发表于 2018-3-31 10:26:39 | 显示全部楼层
什么是机器学习?
机器学习就是使用计算机通过识别数据中的模式来预测未知对象
回复

使用道具 举报

wbrwzff689

发表于 2018-3-31 10:40:08 | 显示全部楼层
老铁  这个分享666
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫描关注微信公众号及微博

Archiver|手机版|小黑屋|铂链BOTTOS社区 | 国内领先的区块链公益社区

GMT+8, 2018-4-20 18:32 , Processed in 0.112241 second(s), 34 queries .

铂链BOTTOS社区 | 国内领先的区块链公益社区

© 2017 bottos

快速回复 返回列表