others linux服务器运维 django3 监控 k8s golang 数据库 大数据 前端 devops 理论基础 java oracle 运维日志

doris 运维故障汇总

访问量:101 创建时间:2025-12-21

doris FE master卡死

FE日志最后[reportHandler.putToQueue():228] the report queue size exceeds the limit :100 .current 101

进程无响应, jstack $fe_pid > jstack.txt也无响应 。 gc也没啥异常。 端口监听在但是连不上。

暂时处理在fe.conf添加 qe_max_connection = 4096 report_queue_size = 1000 label_keep_max_second = 21600 // 6 hour streaming_label_keep_max_second = 21600 // 6 hour

看看效果。

Failed to get scan range, no queryable replica found in tablet

服务器停电,数据库未提前关闭导致。建议再故障恢复前先查询一下所有有故障的表。然后再恢复表。表恢复后可以进行数据对比。将表数据恢复一致。

参考:https://doris.apache.org/zh-CN/docs/2.1/faq/sql-faq

Failed to get scan range, no queryable replica found in tablet: xxxx

###Q: Failed to get scan range, no queryable replica found in tablet: xxxx
###A:当副本无法修复时候,可以通过
####使用空白副本填补缺失副本
ADMIN SET FRONTEND CONFIG ("recover_with_empty_tablet" = "true");
#####参数关闭
ADMIN SET FRONTEND CONFIG ("recover_with_empty_tablet" = "false");

##查看表的分片
show tablets from db_name.table_name\G
#查看分片信息
show tablet tablet_id\G
#然后执行后面的 show proc 语句,查看这个 tablet 对应的副本信息,检查副本是否完整
show proc '/dbs/...........'
#显示等待迁移的 Tablet 列表。
SHOW PROC '/cluster_balance/running_tablets';
#查看均衡历史:
SHOW PROC '/cluster_balance/history_tablets';
登陆评论: 使用GITHUB登陆