ES杂项
大约 2 分钟
倒排索引
- 倒排索引和mysql里面的fulltext索引,目前还不知道是不是一个原理
先看张图:单词-文档矩阵
一列一列看,就是正排索引 一行一行看,就是倒排索引
正排索引告诉你的是:这个文档中有哪些关键字,每个关键字出现了多少次,出现在哪些位置 倒排索引告诉你的是:这个关键词在哪些文档中出现了,出现了多少次,出现在哪些位置
如果有人问你什么事倒排索引,就画这个图给他看
为什么搜索引擎都是倒排索引?
通过上图可以知道,告诉我关键字,可以非常快速的知道这个关键字出现在了哪些文档,而通过正排索引就需要遍历文档才知道
前端时间看到美团技术公众号发得一篇文章提到,他们已经尝试用ClickHorse+filebeat替换ELK了
ES性能测试
写入性能测试
- 单条数据越大,性能越差
- 集群环境下0副本的情况比1副本的情况吞吐量大概多1w docs/s
- 增加client数量能提高吞吐量,但超过2个后对吞吐量提高不是很明显,所以不建议超过2到3个为宜
- 单节点环境下有无副本貌似影响不大
系统推荐
- 记一次内存泄漏
- MySQL常用命令
- Btrace入门
- NGINX
- 提取Docker镜像中的文件
- PGSQL GIN索引“失效”
- Spring RetryTemplate
- Paxos算法
- 制作KVM ES镜像文件
- MyBatis xml特殊字符处理
- 分布式问题
- BBR加速
- 随机毒鸡汤:56个民族,55个加分。