微信号:gh_10a6b96351a9

介绍:坚持撰写接地气的架构文章 通往架构师之路,悠远而漫长,一路上,我们同行.

关于搜索需求,搜索架构的一切

2017-09-18 21:20 58沈剑

前篇:


本文再做总结,体系化介绍互联网搜索架构技术。


一、搜索引擎的原理,架构与细节

文章:《搜索引擎的原理,架构与细节

内容:

  • 全网搜索引擎的架构与流程

  • 站内搜索引起的架构与流程

  • 搜索引擎原理与核心数据结构:正排,倒排,分词,拉链,跳表


二、检索需求到底该如何满足

文章:《流量从小到达,检索架构演进

内容:

  • LIKE阶段架构

  • 全文索引阶段架构

  • 外置索引架构

  • 自研索引架构


三、搜索引擎的实时性

文章:《全网搜索引擎,如何检索到15分钟之前生成的网页

内容:

  • 实时搜索引擎架构

  • 实时搜索引擎实现细节


四、长文本搜索去重

文章:《如何实施长文搜索去重

内容:

  • 长文本相似性算法简介

  • minhash及优化方案

  • 比“分词”更有效的hash算法


五、短文本内存搜索

文章:《低成本,高并发短文检索架构与方案

内容:

  • 三种常见的短文检索方案

  • DAT及优化方案

不一定高深,但一定有收获,感谢大家的支持,收藏后满满细品哟。


欢迎留言,有问必回,帮哈。

 
架构师之路 更多文章 解谜,靠直觉99%的人会答错 99%的人会答错,直觉和逻辑真的不一样 如何学习和提高架构知识 关于互联网“一致性”架构设计的一切 这四类leader,员工是不是容易走人?
猜您喜欢 【面试】Java程序员面试的常见问题及答案 还在用Android自带的WebView组件?太Out了! 一个你不知道的win8.1系统功能! 使用 ElasticSearch + LogStash + Kibana 来可视化网络流量 三天搞定Python基础功,Day 1基础篇