学习人工智能和聊天工具不难

内容提要

🔍 机器学习是一门疯狂的领域。比如现在,我正在运行机器学习模型,实时告诉我在视频游戏中我有多差劲。但老实说,我觉得它并不准确。算了,它其实非常准确。所以机器学习,现在非常热门。它是未来的赛德斯、G P T,所有这些流行词,你知道的,也是你现在正在看这个视频的原因。感谢YouTube算法,谢谢你们。我制作这个视频是因为我想告诉你,你绝对可以学会这项技术。你不需要学位,也不需要成为数学天才,你可以完全免费学习所有这些。这个视频游戏的东西,你实际上可以在这个视频结束时自己设置,使用Oracle Cloud中所有疯狂的机器学习数据科学工具,而且完全免费,感谢我们的赞助商Oracle。顺便说一下,如果你想开始学习机器学习,这是最好的方法。只需跳进去,豁然贯通,使用真实的数据科学家和机器学习工程师实际使用的真实工具。我正在告诉你关于机器学习的一切,但我不是机器学习工程师。你为什么要听我讲呢? Santiago 是一名机器学习工程师。事实上,你知道来自波士顿动力的那只机器狗跳来跳去,有时候还会把啤酒倒入杯子里, Santiago 就在制造那种情况的团队中。这就是机器学习,具体来说是计算机视觉。我们开发计算机视觉算法,帮助机器人看世界。还有 Nacho,他是一名机器学习工程师。他是那个将帮助你建立机器学习视频游戏的人。我创建了三个研讨会,目的是从最基本的概念开始入门,我发现这些概念是最重要的机器学习。他们两个都将帮助我解释机器学习的奇妙之处,以及你如何开始这种疯狂而极具利润的职业道路。我的意思是说,这是一个未来的证明,伙计。另外,我现在对机器学习着迷。我无法停止玩耍。所以非常感谢Oracle。但在开始之前,让我们先定义一下这到底是什么。机器学习。 Santiago,机器学习是什么?机器学习是教计算机从数据中学习的过程。如果你是一名软件开发人员,你习惯于为了完成某件事而制定一套规则,对吧?比如说你想下井字棋,你会制定这样的规则,如果计算机在这里下棋,那我就在那里下棋。如果对方在这里下棋,你就会制定这样的规则。你会使用循环和条件等编程工具。是的,机器学习有点不同,它颠覆了传统方式。机器学习从很多样本开始,就像是,嘿,这是这个特定地区一年的温度情况,你能自动制定规则来预测明天的温度吗?所以,我们教计算机自主学习,无需明确告诉它要做什么。如果你和我一样,你会想,嘿,这到底是什么意思?这个过程是怎样的?它是如何工作的?让我举个简单的例子,然后我们再深入讨论。我们首先定义我们要教计算机的内容。我要教它如何识别我的照片。这是我吗?是或否?但是我们要如何做到这点呢?我们如何教它识别我的照片呢?答案是数据,答案是数据。我们给它很多我的照片,不同的照片,我摆弄的各种姿势。这样,无论如何,我们还需要看一些不属于我自己的照片,这样我们就可以知道不该寻找什么。所以我们收集了大量这样的数据,然后我们可以训练计算机。它是在训练过程中,它是一名实习生。但在教导它之前,我们必须选择它学习的方式。这就是我们的机器学习算法。有很多种算法,其背后进行了一些复杂的数学计算。但我认为我们要选择的是卷积神经网络。现在我知道它是如何工作的吗?不,但我知道它在这种情况下可能是非常好的选择。我们将用数据喂给算法,然后算法将开始学习,并开始识别我。每当它看到胡子、疯狂的眼睛或丸子头的时候,它会说,噢,你知道吗?我要把这个特征的权重设得更高一些。或者如果它没有看到这个特征,它会降低它的权重,然后它会通过所有这些数据来学习我。然后为了稳妥起见,我们再给它一些不属于我的照片,这样它就知道不该寻找什么。现在它完成了,它已经完成了训练数据的训练,不再是一名实习生。现在我们可以使用测试数据对它进行测试,以查看它的表现。现在,虽然这个例子非常简单,但这就是一个机器学习模型,我们刚刚创建了。它是一个被训练用于识别特定模式的文件。可能你的机器学习模型很差劲,准确率只有10%。这时候,作为一名机器学习工程师就非常重要了,你必须学会如何使模型更准确。你必须学习这些技能,而我将现在就告诉你如何做到。根据 Santiago 的说法,学习机器学习的第一步就是开始做。我更喜欢教学和学习的方式,你从零开始写,然后逐渐解开,分解问题,看看自己需要理解这个特定部分需要什么。让我去看一个视频,或者我需要这个。哦,我不太明白链式法则是如何工作的。让我看看这个视频,去YouTube上看看。我就能明白了,然后我就可以继续了。这是我会建议人们的方式。因此,我们就开始做吧。我们来构建一个机器学习算法,它可以告诉你玩视频游戏有多糟糕。点击下面的链接,让我们免费注册一个Oracle Cloud账户。oci. 顺便说一下,现在注册OCI就可以获得300美元的信用额度,用于无论你想做什么,只要合理,完全够你玩这个机器学习的东西了。所以一旦你有了账户,我们就有三个特别棒的实验室要进行。我创建了三个工作坊,它们是关于机器学习中我发现最重要的最基本的概念的,你可以自己按照一小时半到两小时的时间来完成。它们涵盖了从数据提取开始的一切,像我们用照片做的那样,到实际使用不同工具构建模型。像Psych kittle,学习,自动粘合,甚至构建神经网络,这真的很酷。顺带说一句,实验室真的很酷。因为你会了解到,这就是实际上会使用的工具。不要错过这个机会。试试看。在我们的OCI中,首先要开始做的是提取数据。如果你正按照这个实验室进行操作,你要做的第一件事是在oci中配置你的基础设施。我们将使用很多东西。数据科学云,Shell计算,自主js O数据库。 免费提供有趣的优惠。不,它确实很酷。还有一件事你要做的是注册League of Legends,因为你将获得一个API密钥,以便在之前的比赛和实时比赛中获取各种数据。这是免费的,很容易,只需点击下面的链接,你会按照基础设施说明进行。我们正在用Terraform和Ansible部署所有这些东西。Nacho为你提供了所有的代码,在这个过程中你无需担心任何事情,只需点击一下。你可能有时候甚至不知道发生了什么,没关系,你只需按照指示部署基础设施即可。现在,我要现在做我的。接下来,第二件事,要成为一名机器学习工程师,就需要学习为什么需要进行也科学。为什么我们这样做?这是什么过程?你要做的第一件事是和我一起待在Nacho这里,Nacho会帮助你了解到实际解决实际的机器学习问题是什么样子的。而使用OCI的实物化实验室,你可以实际动手做。这又是多么酷的事情,因为你有机会看到一名机器学习工程师是如何思考的,他们如何解决问题。他用五篇详细的文章详细介绍了每一件事以及为什么这样做。所以如果你想了解机器学习的大概是什么以及为什么,这是最好的开始。你是在动手做,而他在告诉你为什么。如果你需要更多的学习,我经常需要,有一些结构化的学习方法可以帮助你理解整个机器学习的过程。 Santiago 推荐勃朗宁。如果你是从最开始的时候开始的,就像你从未见过这个东西一样,你根本不知道从哪里开始学习,我会推荐勃朗宁。他们有一个非常棒的数据科学路径。它会帮助你开始像一名数据科学家一样思考。如果你对数据科学非常陌生,比如你现在根本不知道我正在说什么,这个选项是付费的,但据 Santiago 说它非常好。像我的八岁孩子就能学习。这是一个很好的让你了解将要面对的事情的启蒙途径。所以我很喜欢这个路径。本步骤的目的是让你了解数据科学的全部内容,并开始像数据科学家一样思考,这对于机器学习非常重要,但同时也要从第一步开始深入使用我们在 Oracle Cloud 上的示例。再次回到我们在 oci 中的《英雄联盟》实验室,我实际上要访问数据科学部分。如果你完成了数据提取实验室,你已经有了一个数据科学项目和一个《英雄联盟》笔记本会话,在我们的OCI数据科学环境中,我们有一个Jupyter notebook,这将使我们真正了解到成为一名机器学习工程师实际上是什么样的。因为,这是他们真正使用的工具。Jupyter笔记本非常了不起,如果你从未使用过它们。而且我们在oci中内置了这个工具。通过这个过程,你将学习使用和体验pandas,num pie,matt plot lib,以及你将通过数据科学课程学到的所有东西。但是在现实生活中,你会看到,我们需要将数据拆分成测试和训练数据集。现在第五步,你可能不喜欢这一个步骤的数学,你无法逃避它,因为它是机器学习中的一部分。好消息是,你不需要学习太多的数学, Santiago 说你只需要学习高中水平的数学。比如你学过高中数学了。你可以根据需要了解更多关于机器学习中的复杂数学。我也问 Nacho,你是否需要重新上大学学习所有这些数学的东西?不,我的意思是, 我不同意,你有一些基础,但, 它并不是百分之百地必需。你不需要博士学位或什么,你不需要深奥的数学知识来学习使用某种东西。现在,如果你还记得高中学的每一件事,你上过比我多的高级班级,你可能很好。但如果和我一样,你可能需要回去重新复习一下。统计学、概率论、微积分,这些方面。幸运的是,有很多地方可以学习数学。比如有勃朗宁,他们有一个高中数学课程,它是免费的。你甚至不需要登录,这有点疯狂。而且这将带你进入机器学习的下一个阶段,给你一个很好的基础,通过这样做,你实际上还可以帮助在OCI实验室中。如果我们回顾一下我们在《英雄联盟》OCI实验室中的情况,我现在要访问数据科学部分。如果你完成了数据提取实验室,你已经有了一个数据科学项目和一个《英雄联盟》笔记本会话,在我们的OCI数据科学环境中,我们有一个Jupiter notebook,它将使我们能够真正感受到成为一名机器学习工程师的感觉。因为这是他们真正使用的工具。顺带说一句,这里还有一些免费的资源,可以帮助你学习数学。比如Brilliant,他们有一个很好的机器学习课程。他们还有一个很好的数据科学路径。这将帮助你开始像一名数据科学家思考。现在,如果你对数据科学非常陌生,比如你现在根本不知道我在说什么,这是一个付费的选择,但 Santiago 说它非常好,甚至我的8岁的孩子都可以学习。这是一个很好的机会,可以让你了解到你要面对的问题是什么样的。关键是要让你了解数据科学的整个过程,并且开始像一名数据科学家一样思考,这对于机器学习非常重要,但同时也需要在OCI中深入研究我们的《英雄联盟》示例。再次回到oci中的《英雄联盟》实验室,我实际上要访问数据科学部分。如果你完成了数据提取实验室,你已经有了一个数据科学项目和一个《英雄联盟》笔记本会话,在我们的OCI数据科学环境中,我们有一个Jupyter notebook,这将使我们能够真正感受到成为一名机器学习工程师的感觉。因为这是他们真正使用的工具。Jupyter笔记本非常了不起,如果你从未使用过它们。而且我们在oci中内置了这个工具。通过这个过程,你将学习使用和体验pandas,num pie,matt plot lib,以及你将通过数据科学课程学到的所有东西。但是在现实生活中,你会看到,我们需要将数据拆分成测试和训练数据集。现在第五步,你可能不喜欢这一个步骤的数学,你无法逃避它,因为它是机器学习中的一部分。好消息是,你不需要学习太多的数学, Santiago 说你只需要学习高中水平的数学。比如你学过高中数学了。你可以根据需要了解更多关于机器学习中的复杂数学。我也问 Nacho,你是否需要重新上大学学习所有这些数学的东西?不,我的意思是, 我不同意,你有一些基础,但, 它并不是百分之百地必需。你不需要博士学位或什么,你不需要深奥的数学知识来学习使用某种东西。现在,如果你还记得高中学的每一件事,你上过比我多的高级班级,你可能很好。但如果和我一样,你可能需要回去重新复习一下。统计学、概率论、微积分,这些方面。幸运的是,有很多地方可以学习数学。比如有勃朗宁,他们有一个高中数学课程,它是免费的。你甚至不需要登录,这有点疯狂。而且这将带你进入机器学习的下一个阶段,给你一个很好的基础,通过这样做,你实际上还可以帮助在OCI实验室中。再次回到我们在《英雄联盟》OCI实验室中的情况,我现在要访问数据科学部分。如果你完成了数据提取实验室,你已经有了一个数据科学项目和一个《英雄联盟》笔记本会话,在我们的OCI数据科学环境中,我们有一个Jupiter notebook,这将使我们能够真正感受到成为一名机器学习工程师的感觉。因为这是他们真正使用的工具。顺便说一句,在这里有一些建议的资源,可以帮助你学习数学。比如有 brilliant,上面有一个非常棒的高中数学系列课程,你还可以去看Khan Academy的数学课程。还有YouTube上的其他Python教程。现在,你已经对机器学习有了一些了解了。你尝试过它,也学到了一些Python知识,所以你可以自己动手做些东西了。现在是时候去做了。通过反复尝试,你可以锻炼你的模型,使其更好。那就是我现在要说的,现在就是时候磨练你的技能了。对于这一点,没有比得到更多实践经验更好的方式了。运用你学到的一切,一遍又一遍地练习。其中一个最好的方法是再次使用OCI的实物化实验室。你会发现,在学习机器学习的过程中,Nacho有一个非常稳固的例子,但他邀请你调整它,使它变得更好。因为正如你所看到的,这个模型非常棒。它很准确,但它可以更好。所以你需要弄清楚,嘿,我该如何添加更多的特征?我该如何使数据更好?我该如何获取更多的数据?也许我要选择一个不同的算法,只要你不断练习,直到获得更好的结果。这就是机器学习。也许英雄联盟不是你的菜,这当然也不是我的菜。现在我有点上瘾了。尝试一下其他游戏,看看它们是否有API,从中获取数据并进行玩耍。去疯狂吧。另一个练习的选项是Kaggle。同样,他们在那里举办数据科学竞赛,这是有点疯狂的。你需要在这些竞赛中使用你的机器学习技巧,如果你能做到这一点,如果你能使用你的机器学习技巧,就能赢得奖金,比如十万美元,六十,这是什么鬼。但是无论如何,你将回到这里,开始练习你的数据科学和机器学习技巧。Kaggle的一个好处是他们已经有了数据集。到了这一步,你已经知道了很多关于机器学习的知识,就像一个优秀的机器学习模型,是时候调整你的模型,你的头脑了,你要变得更好。这就是我现在要说的。是时候锻炼你的模型了,不是吗?这就是我现在要告诉你的。现在涉及到英雄联盟的问题了,如果你按照我说的做了,你收集了你的数据,训练了你的模型,并设置了本地计算机上的模型,就像我这样。顺便说一下,Nacho将所有的内容都详细讲解了一遍。他在GitHub上详细讲解了如何在OCI中完成这些步骤,包括在本地计算机上的操作。到此为止,现在你可以预测你失败的速度有多快,就像我一样。所以请告诉我,如果你设置了这个,我会很高兴知道。