教育

学习的好战略

通过归纳或错误学习,最好的方法是什么?自动学习算法提供了原始响应。

Gilles Dowek. 用于Science N°477
 机器人

自动学习算法是允许计算机获取知识的方法,并且一如既往地,它被启发成比较计算机使用的方法与我们的人类,用于相同的目的。

自动学习算法排名为两个大家庭,这取决于他们是独自学习还是一个人。例如,通过分析描述小鼠和大象的数据,算法可以将这些动物分为两组,小而旧的,没有任何其他人以指示哪种描述与动物相匹配。同样,没有人教导我们区分汽车的自行车。我们自己,学会了将车辆分类为不同的类别。

涉及一个人的干预的学习算法,命名为教练,依次分为两类:那些所谓的监督和那些通过加强工作的人,具体取决于这个人在过程中是否越来越迟到。

例如,为了学习识别字母表的字母,监督的学习算法使用先前标记的许多图像,也就是说,Coach指示哪个图像对应于哪个字母。在新图像中,该算法然后将标签组合在最相似的图像中。

另一方面,在钢筋学习算法中,稍后将进行教练。他首先让算法随机分配给图像的字母。让我们说文盲算法将字母“j”与“a”图像相关联。但如果偶然,他偶然地将他们归结为“A”,那么教练会告诉他这是正确的答案。然后,算法将随后将此字母与类似图像相关联。

这些技术之间的区别回顾了教师向学习者发出知识的教学方法之间的差异,以及他让他们做的那些,只是为了纠正他们的错误。这种差异也在科学家建立理论的两种方式中回声。

根据英国哲学家弗朗西斯培根,观察和经验让我们进入事实。该理论随着概括的过程:归纳。对于培根,理论的建设是一个受监督的学习过程。三个世纪以后,卡尔波普尔提出了另一种情景:科学家们根据他们的想象力建立了最多样化的理论,然后消除了观察和经验的驳斥。理论的建设将作为加强学习过程出现。

最近的自动学习经验允许在培根和波普尔之间决定这种世俗争议吗?是的:他们告诉我们,两种方法都很有用,在不同的情况下。因此,监督学习为表格提供了非常好的结果。但是当机器人发现环境时,加强学习更好。

而且,远非相反,这些方法可以共同使用:最近的游戏是监督学习方法之间的熟练组合的结果 - 通过对许多零件的分析,通过加强 - 通过对抗自身来留下计算机进展。

主题

杂志

订阅和ACC.édez à plus de 20 ans d'archives !

12号éros + 4 hors-série
在纸张版本+ numérique

+ ACC.ès illimité à plus de 20 ans d'archives

我是'abonne

订阅和ACC.édez à plus de 20 ans d'archives !

12号éros + 4 hors-série
在纸张版本+ numérique

+ ACC.ès illimité à plus de 20 ans d'archives

我是'abonne

我们的上一篇出版物

回到顶部