ES杂项
大约 3 分钟
倒排索引
- 倒排索引和mysql里面的fulltext索引,目前还不知道是不是一个原理
先看张图:单词-文档矩阵
一列一列看,就是正排索引 一行一行看,就是倒排索引
正排索引告诉你的是:这个文档中有哪些关键字,每个关键字出现了多少次,出现在哪些位置 倒排索引告诉你的是:这个关键词在哪些文档中出现了,出现了多少次,出现在哪些位置
如果有人问你什么事倒排索引,就画这个图给他看
为什么搜索引擎都是倒排索引?
通过上图可以知道,告诉我关键字,可以非常快速的知道这个关键字出现在了哪些文档,而通过正排索引就需要遍历文档才知道
前端时间看到美团技术公众号发得一篇文章提到,他们已经尝试用ClickHorse+filebeat替换ELK了
ES性能测试
写入性能测试

- 单条数据越大,性能越差
- 集群环境下0副本的情况比1副本的情况吞吐量大概多1w docs/s
- 增加client数量能提高吞吐量,但超过2个后对吞吐量提高不是很明显,所以不建议超过2到3个为宜
- 单节点环境下有无副本貌似影响不大
系统推荐
- 在没有 telnet 和 nc 的世界里,如何优雅地判断端口是否通?
- 测试两台服务器间的网速
- MongoDB高可用
- K8S 无感发布
- Thread & ExecutorService & ThreadPoolExecutor 总览
- 乱七八糟的笔记
- ShadowsockServerUpdatePort
- Redis高可用
- PasteImageIntoMarkdown插件开发
- MySQL索引
- ReentrantLock源码解读
- sofajraft
- 随机毒鸡汤:月老麻烦下次为我牵红线,能换成钢丝吗?红线老TM断。