47_47丨如何利用SQL对零售数据进行分析

47丨如何利用SQL对零售数据进行分析?

我们通过 OLTP 系统实时捕捉到了用户的数据,还需要在 OLAP 系统中对它们进行分析。之前我们讲解了如何对数据进行清洗,以及如何对分散在不同地方的数据进行集成,今天我们来看下如何使用 SQL 分析这些数据。

47_第二季回归二爷归来再次扬帆起航

【第二季回归】二爷归来,再次扬帆起航

有时我会想,如果我所在的公司把我或整个产品团队换掉,换成一个更好的产品经理或团队,公司会有什么变化?这个更好的产品经理会如何解决我解决不掉的难题,如何跨过那些让我踉踉跄跄的障碍,如何给公司带来可观的成长?

47_该不该去创业公司?

大约是 2015 年时,那是一个大众创新、万众创业的“双创”年代。当时,创业公司如雨后春笋般出现,又如昙花一现般凋零。也是在那年,招聘时碰到过一个人,一年换了三个公司,我就问:“为什么这么频繁跳槽呢?”而他的答案也让我吃了一惊,他说因为他加入的每家公司,没几个月就都倒闭关门了。

47_架构重构内功心法第三式:运筹帷幄

在前面的架构重构内功心法“有的放矢”和“合纵连横”中,我提到架构师需要从一大堆问题中识别关键的复杂度问题,然后有的放矢地通过架构重构来解决。但是通常情况下,需要架构重构的系统,基本上都是因为各种历史原因和历史问题没有及时处理,遗留下来逐渐积累,然后到了一个临界点,各种问题开始互相作用,集中爆发!到了真正要开始重构的时候,架构师识别出系统关键的复杂度问题后,如果只针对这个复杂度问题进行架构重构,可能会发现还是无法落地,因为很多条件不具备或者有的问题没解决的情况下就是不能做架构重构。因此,架构师在识别系统关键的复杂度问题后,还需要识别为了解决这个问题,需要做哪些准备事项,或者还要先解决哪些问题。这就需要我今天要和你分享的架构重构内功心法第三式:运筹帷幄。

经过分析和思考,我们可能从最初的 100 个问题列表,挑选出其中 50 个是需要在架构重构中解决的,其中一些是基础能力建设或者准备工作,而另外一些就是架构重构的核心工作。有了这样一个表格后,那我们应该怎么去把这 50 个问题最终解决呢?

47_搜索引擎(上):如何通过倒排索引和向量空间模型,打造一个简单的搜索引擎?

你好,我是黄申。

上一节,我们充分利用了哈希表时间复杂度低的特点,设计了一个简单的缓存系统。在实际项目中,哈希表或者类似的哈希数据结构,有着更为广泛的运用。比如,搜索引擎中的倒排索引,也是基于哈希表结构来设计的。这种倒排索引可以大大提升数据对象的检索效率。

47_尾声如何成为一个编程好手

45 | 尾声:如何成为一个编程好手?

从刚开始准备这个专栏的时候算起,到这一篇文章和大家见面,已经有十个月的时间了。

这个专栏设立的愿景,是想要传达编写优秀代码的理念,帮助软件工程师快速成长并且保持长久的竞争力。但是,四十多篇文章,显然不是通天的秘籍。一个软件工程师的修炼,主要还是靠日积月累的积累和精进。而且,这个修炼还包括编码之外的功夫。

48__B+树:MySQL数据库索引是如何实现的?

作为一个软件开发工程师,你对数据库肯定再熟悉不过了。作为主流的数据存储系统,它在我们的业务开发中,有着举足轻重的地位。在工作中,为了加速数据库中数据的查找速度,我们常用的处理思路是,对表中数据创建索引。那你是否思考过,数据库索引是如何实现的呢?底层使用的是什么数据结构和算法呢?

48__DMA:为什么Kafka这么快?

过去几年里,整个计算机产业届,都在尝试不停地提升 I/O 设备的速度。把 HDD 硬盘换成 SSD 硬盘,我们仍然觉得不够快;用 PCI Express 接口的 SSD 硬盘替代 SATA 接口的 SSD 硬盘,我们还是觉得不够快,所以,现在就有了傲腾(Optane)这样的技术。