一文轻松图解搞懂Elasticsearch原理！

官方网站 www.itilzj.com 文档资料: wenku.itilzj.com

ES 的集群模式和 kafka 很像，kafka 又和 redis 的集群模式很像。总之就是相互借鉴！

不管你用没用过 ES，今天我们一起聊聊它。就当扩展大家的知识广度了！

认识倒排索引

「正排索引 VS 倒排索引：」

正排索引 VS 倒排索引

「倒排索引包括两个部分：」

单词词典（Term Dictionary）：记录所有文档的单词，记录单词到倒排列表的关联关系
❝ 单词词典一般比较大，可以通过 B+ 树或哈希拉链法实现，以满足高性能的插入与查询 ❞
倒排列表（Posting List）：记录了单词对应的文档结合，由倒排索引项（Posting）组成：
- 文档ID
- 词频TF：该单词在文档中出现的次数，用于相关性评分
- 位置（Position）：单词在文档中分词的位置。用于语句搜索（Phrase Query）
- 偏移（Offset）：记录单词的开始结束位置，实现高亮显示

倒排索引

「ElasticSearch的倒排索引：」

ElasticSearch的JSON文档中的每个字段，都有自己的倒排索引
可以针对某些字段不做索引
- 优点：节省存储空间
- 缺点：字段无法被搜索

分布式架构原理

「分片shard：一个索引可以拆分成多个shard分片。」

主分片primary shard：每个分片都有一个主分片。
备份分片replica shard：主分片写入数据后，会将数据同步给其他备份分片。

将ES集群部署在 3个机器上（esnode1、esnode2、esnode3）：

「创建个索引，分片为 3 个，副本数设置为 1：」

PUT /sku_index/_settings { "settings": { "number_of_shards" : 3, "number_of_replicas": 1 } }

响应： { "acknowledged" : true }

分布式架构原理

「ES集群中有多个节点，会自动选举一个节点为master节点，如上图的esnode2节点：」

主节点（master）：管理工作，维护索引元数据、负责切换主分片和备份分片身份等。
从节点（node）：数据存储。

「集群中某节点宕机：」

主节点宕机：会重新选举一个节点为主节点。
从节点宕机：由主节点，将宕机节点上的主分片身份转移到其他机器上的备份分片上。

写入数据的工作原理

「写单个文档所需的步骤：」

客户端选择一个Node发送请求，那么这个Node就称为「协调节点（Coorinating Node）」。
Node使用文档ID来确定文档属于分片 0，通过集群状态中的内容路由表信息获知分片0 的主分片在Node1上，因此将请求转发到Node1上。
Node1上的主分片执行写操作。如果写入成功，则将请求并行转发到Node3的副分片上，等待返回结果。
当所有的副分片都报告成功，Node1将向Node（协调节点）报告成功。

写入数据的工作原理

「Tips：客户端收到成功响应时，意味着写操作已经在主分片和所有副分片都执行完成。」

写数据底层原理

写数据底层原理

「写操作可分为 3 个主要操作：」

**写入新文档：**这时候搜索，是搜索不到。

将数据写入内存
将这操作写入translog文件中

**refresh操作：**默认每隔 1s ，将内存中的文档写入文件系统缓存（filesystem cache）构成一个segment

❝ 这时候搜索，可以搜索到数据。 ❞

「1s时间：ES是近实时搜索，即数据写入1s后可以搜索到。」

**flush操作：**默认每隔 30 分钟或者translog文件512MB，将文件系统缓存中的segment写入磁盘，并将translog删除。

「translog文件：」来记录两次flush(fsync) 之间所有的操作，当机器从故障中恢复或者重启，可以根据此还原

translog是文件，存在于内存中，如果掉电一样会丢失。
「默认每隔 5s 刷一次到磁盘中」

读取数据的工作原理

「读取文档所需的步骤：」

客户端选择一个Node发送请求，那么这个Node就称为「协调节点（Coorinating Node）」。
Node使用文档ID来确定文档属于分片 0，通过集群状态中的内容路由表信息获知分片0 有 2 个副本数据（一主一副），会使用随机轮询算法选择出一个分片，这里将请求转发到Node1
Node1将文档返回给Node，Node将文档返回给客户端。

读取数据的工作原理

「在读取时，文档可能已经存在于主分片上，但还没有复制到副分片，这种情况下：」

读请求命中副分片时，可能会报告文档不存在。
读请求命中主分片时，可能成功返回文档。

搜索工作原理

「搜索数据过程：」

客户端选择一个Node发送请求，那么这个Node就称为「协调节点（Coorinating Node）」。
Node协调节点将搜索请求转发到所有的分片（shard）：主分片或副分片，都可以。
「query阶段」：每个分片shard将自己的搜索结果（文档ID）返回给协调节点，由协调节点进行数据的合并、排序、分页等操作，产出最终结果。
「fetch阶段」：由协调节点根据文档ID去各个节点上拉取实际的文档数据。

搜索工作原理

**举个栗子：**有 3 个分片，查询返回前 10 个匹配度最高的文档

每个分片都查询出当前分片的TOP 10数据
「协调节点」将3 * 10 = 30的结果再次排序，返回最终TOP 10的结果。

删除/更新数据底层原理

「删除操作」：commit的时候会生成一个.del文件，里面将某个doc标识为deleted状态，那么搜索的时候根据.del文件就知道这个 doc 是否被删除了。
「更新操作」：就是将原来的doc标识为deleted状态，然后新写入一条数据。

「底层逻辑是：」

Index Buffer每次refresh操作，就会产生一个segment file。（默认情况：1秒1次）
定制执行merge操作：将多个segment file合并成一个，同时将标识为deleted的doc「物理删除」，将新的segment file写入磁盘，最后打上commit point标识所有新的segment file。

IT架构师/技术大咖的交流圈子,为您提供架构体系知识、技术文章、流行实践案例、解决方案等，行业大咖分享交流/同行经验分享互动,期待你的加入!扫码即可加入哦，随着材料不断增多社群会不定期涨价早加入更优惠

免责声明：

本公众号部分分享的资料来自网络收集和整理，所有文字和图片版权归属于原作者所有，且仅代表作者个人观点，与本公众号无关，文章仅供读者学习交流使用，并请自行核实相关内容，如文章内容涉及侵权，请联系后台管理员删除。

一文轻松图解搞懂Elasticsearch原理！

周鸿祎近10天里热搜不断背后是360市值蒸发4000多亿

欧洲民众火车站实拍：大量装甲车正运往乌克兰

俄军单日战损创新高，乌克兰与美国就10年安全协议开始谈判

开展“五反斗争”！国安部部长陈一新发声，要坚决“挖‘钉子’、除内奸”

疑因小伙地铁上睡着未让座一家四口对着他破口大骂

被国务卿耽误的乐手，布林肯弹吉他唱蓝调，技惊四座！

今天下午长沙暴雨，长沙高铁站漏雨，像瀑布一样

深圳-珠海低空短途航线今天开通：单程20分钟单人费用为999元

婚礼现场伴娘遭胶带缠绕在地上挣扎宾客乐呵呵拍视频

于吉红同志任北京师范大学校长

司法部原党组成员、副部长刘志强接受审查调查

乌克兰男子被征兵人员带走时强行挣脱，大喊家中孩子无人看管

4-0！雷霆横扫鹈鹕晋级 SGA24+10威廉姆斯24分

牛弹琴：以总理急了不停打电话要求白宫阻止逮捕令

环球：公开背弃并且否认"君子协定" 马尼拉很不明智

3-0！莱斯特城提前1轮锁定英冠冠军+第16冠，37岁瓦尔迪双响告别

东航一客机应急滑梯因机组成员矛盾被放出

浓眉首轮总结：三场30+10一场双20 G5受伤后下半场仅1分梦游

厦门提供实习毕业生1年免费住宿

穆雷32分送绝杀球掘金4-1湖人勒布朗空砍30+9

一文轻松图解搞懂Elasticsearch原理！

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

欧洲民众火车站实拍：大量装甲车正运往乌克兰

俄军单日战损创新高，乌克兰与美国就10年安全协议开始谈判

开展“五反斗争”！国安部部长陈一新发声，要坚决“挖‘钉子’、除内奸”

疑因小伙地铁上睡着未让座 一家四口对着他破口大骂

被国务卿耽误的乐手，布林肯弹吉他唱蓝调，技惊四座！

今天下午长沙暴雨，长沙高铁站漏雨，像瀑布一样

深圳-珠海低空短途航线今天开通：单程20分钟 单人费用为999元

婚礼现场伴娘遭胶带缠绕在地上挣扎 宾客乐呵呵拍视频

于吉红同志任北京师范大学校长

司法部原党组成员、副部长刘志强接受审查调查

乌克兰男子被征兵人员带走时强行挣脱，大喊家中孩子无人看管

4-0！雷霆横扫鹈鹕晋级 SGA24+10威廉姆斯24分

牛弹琴：以总理急了 不停打电话要求白宫阻止逮捕令

环球：公开背弃并且否认"君子协定" 马尼拉很不明智

3-0！莱斯特城提前1轮锁定英冠冠军+第16冠，37岁瓦尔迪双响告别

东航一客机应急滑梯因机组成员矛盾被放出

浓眉首轮总结：三场30+10一场双20 G5受伤后下半场仅1分梦游

厦门提供实习毕业生1年免费住宿

穆雷32分送绝杀球掘金4-1湖人 勒布朗空砍30+9

周鸿祎近10天里热搜不断背后是360市值蒸发4000多亿

疑因小伙地铁上睡着未让座一家四口对着他破口大骂

深圳-珠海低空短途航线今天开通：单程20分钟单人费用为999元

婚礼现场伴娘遭胶带缠绕在地上挣扎宾客乐呵呵拍视频

牛弹琴：以总理急了不停打电话要求白宫阻止逮捕令

穆雷32分送绝杀球掘金4-1湖人勒布朗空砍30+9