13_数据集成这些大号一共20亿粉丝
12 | 数据集成:这些大号一共20亿粉丝?
我们采集的数据经常会有冗余重复的情况。举个简单的例子,假设你是一个网络综艺节目的制片人,一共有 12 期节目,你一共打算邀请 30 位明星作为节目的嘉宾。你知道这些明星影响力都很大,具体在微博上的粉丝数都有标记。于是你想统计下,这些明星一共能直接影响到微博上的多少粉丝,能产生多大的影响力。
12 | 数据集成:这些大号一共20亿粉丝?
我们采集的数据经常会有冗余重复的情况。举个简单的例子,假设你是一个网络综艺节目的制片人,一共有 12 期节目,你一共打算邀请 30 位明星作为节目的嘉宾。你知道这些明星影响力都很大,具体在微博上的粉丝数都有标记。于是你想统计下,这些明星一共能直接影响到微博上的多少粉丝,能产生多大的影响力。
上一期我们讨论了 Spark 的编程模型,这期我们聊聊Spark 的架构原理。和 MapReduce 一样,Spark 也遵循移动计算比移动数据更划算这一大数据计算基本原则。但是和 MapReduce 僵化的 Map 与 Reduce 分阶段计算相比,Spark 的计算框架更加富有弹性和灵活性,进而有更好的运行性能。
12 | 外接设备,把你的库乐队变成移动录音棚
你好,我是邓柯,欢迎你和我一起玩音乐。
在前两个模块的课程中,相信你已经了解了库乐队中各种乐器组件,以及一些进阶功能的使用方法,并且完成了不少音乐片段的制作与创作。随着你对库乐队了解和使用的加深,你可能也在使用库乐队的过程中遇到了更多的问题,比如:
在上一讲中,我向你说明了为什么程序员应该写测试,今天我准备与你讨论一下程序员应该在什么阶段写测试。
或许你会说,写测试不就是先写代码,然后写测试吗?没错,这是一个符合直觉的答案。但是,这个行业里确实有人探索了一些不同的做法。接下来,我们就将进入不那么直觉的部分。
生老病死是我们人生中的大事,学习法律也不可避免这些。虽然我们都不大乐意谈“死亡”,但遗产问题,确实是每个人都不可避免的。正好前几天有个朋友来咨询,借着这个案子,我也来说说遗产问题。
你好,我是刘津。
在上一讲中,我介绍了如何选择受访用户,以及准备访谈大纲。今天我们来谈谈访谈时的要点以及事后如何总结。
我们在访谈的过程中,要特别关注“特殊人群”。真正的洞察往往出现在调研“特殊人群”的过程中。
在上一篇《12 | RTCPeerConnection:音视频实时通讯的核心》一文中,我向你介绍了 RTCPeerConnection 对象是如何在端与端之间建立连接的,以及音视频数据又是如何通过它进行传输的。而本文则更进一步,向你介绍如何使用 RTCPeerConnection 来控制音视频数据的传输速率。
好诗相伴,千金不换。你好,我是天博。
今天是我们“见天地”的最后一讲,我们最后一讲的意象是美人。我们从《甄嬛传》讲起。
《甄嬛传》可以算得上是一部神剧,讲的是甄嬛入宫之后,一步一步和其他嫔妃斗争,最终当上皇太后的事。这部剧一经播出,好评如潮,火遍大江南北,甚至火遍海内外。
你好,我是王沛。今天我们来聊聊如何在 React 中使用表单。
表单作为用户交互最为常见的形式,但在 React 中实现起来却并没有那么容易。甚至可以说,使用表单,是 React 开发中最为困难的一部分。