批量写,根据每条数据的大小,一般是几百到几千。
2、多线程编写,编写线程的数量一般相当于机器的数量,可以匹配各种情况,在测试环境下通过kibana观察性能曲线。
3.增加段的刷新时间。通过上面的原理我们知道,段作为最小的检索单元,比如有50个段,目的是查询10个数据,但是我们需要从50个段中查询10条记录,共计500条记录,然后进行排序或者比较分数,截取前10条,丢弃490条记录。在我们的例子中,r:-1程序在批量写入后会被手动刷新(调用相应的api即可)。
4.在内存分配方面,很多文章都提到,给lucene50%的系统内存用于文件缓存是一个很繁重的任务,所以es节点需要更多的内存(比如每个节点最好配置64g以上)。
5,磁盘配置ssd,机械磁盘作为阵列raid5raid10。虽然看起来很快,但随机io还是比ssd好。
6.使用自动生成的id,而使用我们这个例子中的自定义键,也就是带hbase的行键,就是根据rowkey来删除和更新数据,性能下降并不明显。
7.关于段合并,后台定期执行合并,较大的段需要很长时间才能完成。为了减少对其他操作(如检索)的影响,elasticsearch限制了阈值,默认为20mb/s,
抓住所有的对子,但是最重的一个不见了。yaml编程k8syaml包含pod控制器pod运行探针服务器服务confmap配置参数ingress七层负头和存储pvpvcpod日记收集系统elkk8s监控系统prometheus,如果需要更详细的流量控制,有istio。那个这就是全部。