大型分布式网站架构-设计与实现

1 分库分表

访问极为频繁且数据量巨大的单表，减少单表的记录条数，以便减少数据查询所需时间，提高数据库的吞吐

分表能够解决单表数据量过大带来的查询效率下降问题，却无法处理数据库的兵法处理能力，对数据库进行拆分，从而提高数据库的写入能力

temp=user_id%(库数量*每个库的表数量)

库=取整(temp/每个库的表数量)

表=temp%每个库的表数量

随着记录条数增加而不断变大后，分裂成一个个的Region，每个Region由(startKey, endKey)表示

分布式系统中，垂直化搜索引擎

又称反向索引，是搜索引擎中最常见的数据结构，将文档中的词作为关键字，建立词与文档的映射关系，通过对倒排索引的检索，可以根据词快速获取包含这个词的文档列表

弱一致性指的是系统的某个数据被更新后，后续对该数据的读取操作获取到的可能是更新前的值，也可能是更新后的值，全部用户完全获取到更新后的值需要经过一段时间

是弱一致性的一种特殊形式

读书笔记

#分布式

大型分布式网站架构-设计与实现

https://bannirui.github.io/2023/02/28/大型分布式网站架构-设计与实现/

作者

dingrui

发布于

2023年2月28日

许可协议