094_基于深度学习的计算机视觉技术二基本的深度学习模型
144 | 基于深度学习的计算机视觉技术(二):基本的深度学习模型
在上一期的介绍里,我们讨论了以深度学习为背景的计算机视觉技术,重点讲解了为什么需要深度学习,特别是从传统模型的眼光来看深度学习模型的特点。
144 | 基于深度学习的计算机视觉技术(二):基本的深度学习模型
在上一期的介绍里,我们讨论了以深度学习为背景的计算机视觉技术,重点讲解了为什么需要深度学习,特别是从传统模型的眼光来看深度学习模型的特点。
聊起西方文明,我们通常言必称希腊,古希腊有三大哲学家:苏格拉底、柏拉图和亚里士多德。而聊起大数据,我们通常言必称谷歌,谷歌有“三驾马车”:谷歌文件系统(GFS)、MapReduce 和 BigTable。
145 | 基于深度学习的计算机视觉技术(三):深度学习模型的优化
在上一讲的分享里,我们聊了应用到图像上的一些最基本的深度学习模型,主要讨论了前馈神经网络和卷积神经网络的定义,以及它们在图像处理上的应用。
在大数据发展史上有过一场非常著名的论战,这场争议影响深远,值得大书特书:其中一方是数据库领域的元老级人物迈克尔 · 斯通布雷克(Michael Stonebraker)和大卫 · 德威特(David Dewitt)。另外一方是主导了谷歌技术发展的杰夫 · 迪恩(Jeff Dean)。这两群人就谷歌“三架马车”之一的 MapReduce 和数据库到底谁好谁坏,争得不可开交。
146 | 计算机视觉领域的深度学习模型(一):AlexNet
我们继续来讨论基于深度学习的计算机视觉技术。从今天开始,我们进入一个新的模块,我会结合几篇经典的论文,给你介绍几个专门为计算机视觉而提出来的深度学习模型。这些模型都在最近几年的深度学习发展中,起到了至关重要的作用。
谷歌的大数据之路,上半场以“三驾马车”(谷歌文件系统、MapReduce 和 BigTable)开始,却以被 Hadoop 开源生态系统全面山寨了自己的“三驾马车”而结束。
147 | 计算机视觉领域的深度学习模型(二):VGG & GoogleNet
在上第一期的分享中,我们通过一篇经典论文讲了 AlexNet 这个模型。可以说,这篇文章是深度学习在计算机视觉领域发挥作用的奠基之作。
在信息化时代,技术发展日新月异,知识更新的速度也是越来越快。以前我们可以安安稳稳地坐在教室里,等到一本写得不错的教材出来,再去系统地学习知识。而现在,我们却必须选择去读那些最新发表出来的技术论文,因为只有这样才能赶得上时代发展的潮流。
148 | 计算机视觉领域的深度学习模型(三):ResNet
今天我们继续来讨论经典的深度学习模型在计算机视觉领域应用。今天和你分享的论文是《用于图像识别的深度残差学习》(Deep Residual Learning for Image Recognition)[1]。这篇论文获得了 CVPR 2016 的最佳论文,在发表之后的两年间里获得了超过 1 万 2 千次的论文引用。
在谷歌崛起之前的很长一段时间里,雅虎一直是互联网行业的“老大哥”。虽然随着互联网行业的发展,谷歌的市场影响力越来越强,雅虎的日子越来越不好过,但雅虎仍是“瘦死的骆驼比马大”。谷歌发表了“三驾马车”的论文,开启了大数据时代,雅虎作为当时互联网行业的老大,也希望能用上类似“三驾马车”的系统。