Google Cloud 工程师 Yufeng Guo 在 YouTube、Medium 上发布了一系列的 Machine Learning、TensorFlow 相关分享,每篇文章都是图文并茂,夹叙夹议,非常风趣幽默。这里汇总分享给大家,希望能给大家一定的帮助!(中文来源:知乎专栏 机智如你,英文来源:Medium)
由于文中包含有视频,所以此处为大家提供的链接会跳转到知乎去,欢迎大家为知乎专栏点赞!当然也欢迎给我加个鸡腿~~~
全系列汇总
第一篇:机器学习是什么?
随着人类完全进入信息化时代,每分每秒产生的数据使之多到难以通过人力进行处理和加工。自动化处理是发展的必然,也是时代的要求。而如何让计算机学会像人一样处理这些数据呢?机器学习在这个时代得到了空前的发展,而我们要了解的,也正是机器学习这块非常令人神往的领域。
第二篇:机器学习「七步走」
同我们日常生活中做一件事一样,机器学习也有着自己的流程和步骤。这一期文章和视频将机器学习分成了 7 步,并且举例进行了演示和分析。如果你对机器学习的流程感到模糊,不妨多看一看这期,从中一定能找到答案。
第三篇:用评估器给花卉分类
第三期介绍了一个非常重要的 TensorFlow 高级 API,叫做评估器(Estimator)。通过评估器,开发者可以避免直接控制训练循环,也就能够在更高的抽象层次开发。本期还使用了鸢尾花的案例进行说明,这个案例在后面的分享中也会频繁再现,所以如果还没有读过这篇,赶紧去看看吧!
第四篇:弹性伸缩的云端托管服务
在上一期的指导下,通过充分进行鸢尾花模型的训练,最终得到了一个还不错的模型。但是要让我们的训练结果真正有用,还离不开将其部署、托管成一项预测服务的过程。一起来看看 Google Cloud Platform 是如何实现这一托管服务的吧。
第五篇:通过 TensorBoard 将模型可视化
在开发的过程当中,调试是一个永恒的话题。如果你知道问题是什么、在哪里,那么调试起来也就会很轻松。但是如果你面对的是一个无比复杂的中间过程,如果定位问题将成为你需要解决的头号困难。这期文章和视频分享了 TensorBoard 这一内置的工具,让开发者能更轻松发现并解决问题。
在本期文章中提到了 TensorBoard,但是你是否觉得自己还有更多需求想要实现呢?其实 TensorBoard 有自己的拓展 API,足够你用来实现更丰富的功能。更多信息,请参阅拓展阅读中的相关内容:使用 TensorBoard API 构建机器学习可视化插件。
第六篇:通过深度神经网络再识评估器
第三期中,我们认识了 TensorFlow 的评估器,而在这一期,我们会对它有更深刻的认识。此时你将会发现使用评估器 API 巨大的优势。当然,改变了神经网络类型可能就会有其他方面的变化,赶紧回顾一下,看看究竟有哪些变化吧。
第七篇:云端训练模型的大数据解决方案
当你的训练达到一定规模,会发下自己的本地设备完全没办法满足训练的开销。甚至你还可能会发现,数据大到你的电脑完全装不下。怎么办呢?跟着 Yufeng 试着用云计算解决这个难题吧。
第八篇:跟着 Google Research 体验自然语言生成
这是一期访谈,访谈的对象是 Google Research 团队中专门研究 NLP(自然语言处理)的工程师 Justin Zhao。感受一下 NLP 的含义,并且体会神经网络在其研究中占据的重要地位。
第九篇:云上的机器学习引擎
之前,Yufeng 带着我们搞定了把数据放到云端,而进一步我们则要思考,如果训练太复杂,我们本地没办法进行怎么办呢?这就需要用到云端训练引擎了,一同回顾吧。
第十篇:使用 MNIST 数据集训练模型
前面的众多期分享中,读者已经了解了整个机器学习的方方面面。第九期当中,Yufeng 会带领大家在这基础上,用服饰版的 MNIST 数据来训练一个模型。这一期分享中,你将会再度回味评估器框架,了解如何将图像数据与训练的特征值关联,还会跟着 Yufeng 把线性模型转为深度模型。
第十一篇:机器学习工程师用 Python 开发环境的最佳实践
工欲善其事,必先利其器;好的工具能够让你事半功倍。在使用 Python 开发机器学习时,往往你会用到各种各样的工具,也需要有一个非常好用的 Python 环境。如何搭建呢?到本期去寻找答案吧!
第十二篇:机器学习之前,让「大熊猫」先尝一尝数据的味道
在机器学习当中,非常重要的就是要准备好充分的数据。这一期中,Yufeng 介绍了 Pandas 作为数据处理工具的各个特性。他将带领大家使用 Pandas 来窥探数据的结构、信息,并且充分把控数据。
第十三篇:机器学习大杀器:爆米花般火爆的 Kaggle Kernels
这一期建议和下一期一起看。我们可以通过 Kaggle 提供的在线 Jupyter 环境来在云端使用机器学习相关工具。也可以使用其提供的数据存储服务来进行云端的训练工作。在云计算时代,开发者不再需要在每一台电脑部署开发环境,结合 Kaggle,何时何地都可以进行机器学习,岂不美哉!
第十四篇:工欲善其事,必先利其器:Jupyter Notebooks 的技巧
上一期 Kaggle 中使用的交互界面其实来自于 Jupyter。这些交互式 Python 编程环境都提供了哪些便利呢?跟着 Yufeng 的脚步一探究竟吧。尝试用这种新型的交互编程环境来代替你既有的 IDE,也许你就打开了新世界的大门。
第十五篇:「伊人」何处,宛在云中央:用 Datalab 在云上部署交互式编程环境
我们知道,数据是机器学习的灵魂。当数据特别大、特别多的时候,要想下载到本地进行训练往往是不现实的。既然没办法在本地搞训练,何不在数据所在的地方直接部署训练环境呢?Datalab 的出现为解决这一难题带来了新的解决方案。请回顾本期内容,体验一把这种新的操作思路。
第十六篇:TensorFlow 中的输出函数 tf.Print 详解
数据是机器学习的灵魂,这一点我们之前反复强调了。而本期内容,就是要让你看到机器学习中数据的流淌,也就是 tensor 的 flow。传统的 print 在面对 TensorFlow 中的 tensor 时就显得有些不足了。但是不要担心,TensorFlow 内置的 Print 函数让你能够轻松输出节点数据。试试看吧!
第十七篇:上手试一试 TensorFlow Object Detection API
本周 Yufeng 邀请一个超厉害的全能开发大使 Sara Robinson 来一起聊一聊她自己开发的一款使用 TensorFlow Object Detection API 的 iOS app。
第十八篇:开源在线工具 Facets 使用详解
Better data leads to better models,只有对数据有足够的了解,才能构建出好的模型,Facets 是一个用于帮助理解和分析机器学习数据集的开放源代码可视化工具。Facets 包含两个可视化选择,让用户能够以不同粒度查看其数据的整体情况。可使用 Facets Overview 了解数据的每个具体特性,或使用 Facets Dive 探究个别观察的数据集。
拓展阅读
我们把一些与全部文章相关的内容整合到了这里,欢迎你在这里继续深入。
使用 TensorBoard API 构建机器学习可视化插件
为了让更多的人可以方便的给 TensorBoard 创建新的和有用的可视化插件,TensorFlow 团队发布了一系列可以让开发者给 TensorBoard 添加自定义可视化插件的标准 API。开发者可以通过这些 API 扩展 TensorBoard 的功能,使其可以覆盖到更加广泛的应用场景。
这篇文章,就是要帮助你了解 TensorBoard API,从而根据自身需求,实现更多功能。
【待续】
感谢 Yufeng Guo 的辛勤付出,感谢所有为 TensorFlow 社区贡献的志愿者!
发帖人:dong,发帖时间:2018-4-27 21:57