006__以MongoDB为例,看基础架构类产品创业

MongoDB 的产品是文档数据库,可以归类于基础架构类的创业公司。这类公司的特点是,产品本身不产生价值,使用其产品做业务和应用的第三方使用者产生价值并给他们付费。

006_机器学习排序算法配对法排序学习

022 | 机器学习排序算法:配对法排序学习

周一的文章里我分享了最基本的单点法排序学习(Pointwise Learning to Rank)。这个思路简单实用,是把经典的信息检索问题转化为机器学习问题的第一个关键步骤。简单回顾一下,我们介绍了在测试集里使用 NDCG(Normalized Discounted Cumulative Gain),在某个 K 的位置评价“精度”(Precision)和“召回”(Recall),以这些形式来评估排序算法。

007__直面MongoDB,谈微软的NoSQL战略

DocumentDB 是微软于 2014 年推出的,基于 Windows Azure 的一个 PaaS 云产品。正如它的名字所示,这个产品是个文档数据库。它主要是冲着 MongoDB 的市场去的,它的数据模型和 MongoDB 很像。

2017 年初,微软推出了和 MongoDB 兼容的 DocumentDB 的 API。在 2017 年 5 月微软面向程序员的 Build 大会上,微软宣布 DocumentDB 升级为 Cosmos DB。Cosmos DB 包含多个数据模型,文档模型成为其子集。

007_机器学习排序算法列表法排序学习

023 | 机器学习排序算法:列表法排序学习

本周我们已经分别讨论了最基本的单点法排序学习(Pointwise Learning to Rank)和配对法排序学习(Pairwise Learning to Rank)两种思路。单点法排序学习思路简单实用,目的就是把经典的信息检索问题转化成机器学习问题。配对法排序学习则是把排序的问题转化成针对某个查询关键字每两个文档之间的相对相关性的建模问题。不过,这两种思路也都有很明显的问题,需要进一步对算法进行优化,以实现我们需要的最终目标。

008__免费还是收费?WinRAR的生意经

今天新一代的网民可能很难想象那个互联网的早期,电脑刚步入家庭时的境况,那时还处于拨号上网的时代,网速如蜗牛一般缓慢。

在那个存储设备尚以 MB 或者 GB 作为计量单位的 80x86 时代,压缩软件的重要性,无论对于软件的下载、通过光盘的传播,乃至在硬盘上的存储,都非同寻常。这是新时代的网民们难以想象的。

008_查询关键字理解三部曲之分类

024 | “查询关键字理解”三部曲之分类

我们在前两周的专栏里主要讲解了最经典的信息检索(Information Retrieval)技术和基于机器学习的排序算法(Learning to Rank)。

009__可视化分析鼻祖Tableau

Tableau 公司成立于 2003 年,总部位于西雅图,是全球领先的可视化分析软件的创建者,于 2013 年在纽约交易所上市。Tableau 是这个领域的奠基人,并且在这个领域至今依然保持着全球最领先的研发态势。

009_查询关键字理解三部曲之解析

025 | “查询关键字理解”三部曲之解析

这周我分享的核心内容是查询关键字理解(Query Understanding)。周一介绍了查询关键字分类(Query Classification)的基本概念和思想。今天,我来讲一个更加精细的查询关键字理解模块:查询关键字解析(Parsing)。

00开篇词 告别盲目刷题,击破算法面试

你好,我是德鲁伊,很高兴能和你一起来并肩作战,击破算法面试。

就职现公司之前,我用一个月的时间通关了 10+ 家公司,顺利地拿下了腾讯、头条、蚂蚁、美团、eBay、微软等大厂的 Offer。面试过程中,每一家公司必考算法写题,不过考查形式各有不同,比如:

00开篇词提效工具or耗能摆设?落地APM要做好这三点

你好,我是赵禹光,欢迎来到我的《应用性能分析实战》专栏。正式开讲前,我先介绍一下我自己,以及我们这个专栏的主角 APM。

我是贝壳找房 APM 架构师,目前在贝壳找房从事了三年的 APM 研发工作。我从 0 到 1 设计搭建的 APM 平台,在贝壳找房内部监控着数千个应用服务,并支撑着二手房、新房、租房、装修等多个核心业务线。