ES杂项
大约 3 分钟
倒排索引
- 倒排索引和mysql里面的fulltext索引,目前还不知道是不是一个原理
先看张图:单词-文档矩阵
一列一列看,就是正排索引 一行一行看,就是倒排索引
正排索引告诉你的是:这个文档中有哪些关键字,每个关键字出现了多少次,出现在哪些位置 倒排索引告诉你的是:这个关键词在哪些文档中出现了,出现了多少次,出现在哪些位置
如果有人问你什么事倒排索引,就画这个图给他看
为什么搜索引擎都是倒排索引?
通过上图可以知道,告诉我关键字,可以非常快速的知道这个关键字出现在了哪些文档,而通过正排索引就需要遍历文档才知道
前端时间看到美团技术公众号发得一篇文章提到,他们已经尝试用ClickHorse+filebeat替换ELK了
ES性能测试
写入性能测试
- 单条数据越大,性能越差
- 集群环境下0副本的情况比1副本的情况吞吐量大概多1w docs/s
- 增加client数量能提高吞吐量,但超过2个后对吞吐量提高不是很明显,所以不建议超过2到3个为宜
- 单节点环境下有无副本貌似影响不大
系统推荐
- getPath vs getAbsolutePath vs getCanonicalPath
- synchronized原理深度剖析
- Git合并多个提交并push到远程仓库
- 正则表达式匹配第几个符号问题
- Thread & ExecutorService & ThreadPoolExecutor 总览
- Spring Boot升级到2 6 x踩的坑
- Flutter开发需要涉及的知识点大纲
- 制作KVM ES镜像文件
- 简易版配置中心&初探原理
- 前端axios下载csv文件乱码
- 免费 API 每日提供摸鱼日报,自动返回无水印图片,适用于公众号和小程序
- GitHub Workflow突然报错
- 随机毒鸡汤:每天都要有充足的睡眠,不然你的手机,连个休息时间都没有。