【YashanDB知识库】主备延迟故障分析方法

2024-09-04 18:18 由 YashanDB 发表于 #数据库

【标题】主备延迟故障分析方法

【问题分类】故障分析

【关键字】Yashandb、主备延迟

【问题描述】当数据库备机出现回放延迟时，需要通过一些手段分析延迟的原因。通过数据库的系统视图或操作系统监控数据可以辅助分析回放延迟的瓶颈。

【问题原因分析】

备延迟手段

当前备库的复制情况

Note：

{rst}{asn}{blockid}

rst：为reset id，每次failover后，数据库新产生的redo文件的reset id会加1。

asn: 归档序列号，archive sequence number，每产生一个redo，ASN会加1，每个redo的ASN不相同。

blockid：redo文件内页面所在ID，页面的偏移量为 block id*block size。

lfn：log flush number，日志序列号，每次redo刷盘，LFN加1。

备机回放进度视图

数据库从MOUNT到OPEN阶段，统计的是重启回放信息，视图中Redo Remain项随着回放会减小。主机OPEN后，视图项不再变化。但是备机OPEN后，可能会重置视图内容，并且Redo Remain项和Remain Time项表示当前剩余日志对应的大小和回放时间。
检查redo的落盘速度

其他辅助分析视图介绍

检查磁盘的IO性能

输出信息说明

Device ：磁盘名

rrqm/s ：每秒进行的 merge 读数目

wrqm/s ：每秒进行的 merge 写数目

r/s ：每秒读 I/O 次数

w/s ：每秒写 I/O 次数

rkB/s ：每秒读设备的字节数（单位：K字节）

wkB/s ：每秒写设备的字节数（单位：K字节）

avgrq-sz：平均每次设备I/O操作的数据大小

avgqu-sz：平均I/O队列长度

r_await ：每个读操作的平均所需时间（包含列队等待时间）

w_await ：每个写操作的平均所需时间（包含列队等待时间）

await ：平均每次设备 IO 操作的等待时间（平均响应时间不超过5ms，单位：ms）

svctm ：平均每次设备 IO 操作的服务时间（单位：ms）

%util ：磁盘繁忙程度（注意：每块磁盘后面都有表示是否繁忙）

如果 svctm 与 await 比较接近，说明 IO 几乎没有等待。

如果 await 远高于 svctm ，说明 IO 队列太长响应太慢，需要优化，可以从 avgqu-sz 队列长度看出来。

YCM监控主备延迟情况

V23.2.1.100 的ycm可以监控主备延迟，如下图

使用gstack查看线程状态

gstack yasdb进程 > gstack.txt

典型案例

问题单：生产数据迁移完毕后数据库延迟比较大

二线分析文章：《主备日志回放延迟高问题》

IO性能测试工具

【YashanDB知识库】YashanDB 开机自启

【问题分类】 YashanDB 开机自启【关键字】开机自启，依赖包【问题描述】数据库所在服务器重启后只拉起monit、yasom、yasom进程，缺少yasdb进程：【问题原因分析】数据库安装的时候未启动守护进程【解决 / 规避方法】进入数据库之前的安装目录，启动守护进程： Shel ...阅读全文

【YashanDB知识库】YAS-02024 lock wait timeout, wait time 0 milliseconds

【标题】错误码处理【问题分类】锁等待超时【关键字】YAS-02024 【问题描述】执行语句时候，因锁等待超时执行语句失败【问题原因分析】数据库默认锁等待时间为0秒，如果执行语句存在锁等待过长会执行失败【解决/规避方法】 1、调整锁等待的时间 SQL alter system set DDL_ ...阅读全文

【YashanDB知识库】ODBC驱动类问题定位方法

【标题】ODBC驱动类问题定位方法【需求分类】故障分析【关键字】ODBC 【需求描述】由于我们的ODBC接口目前尚不完善，经常会遇见ODBC接口能力不足导致应用功能无法运行的问题，需要定位手段确定底层是哪个接口报错【需求原因分析】方便一线数据库管理员初步分析故障【分析方法】 ● 由于我们的O ...阅读全文

【YashanDB知识库】kettle从DM8的number类型同步到YashanDB的varchar类型，存入是科学计数法形式的数据

【标题】kettle从DM8的number类型同步到YashanDB的varchar类型，存入是科学计数法形式的数据【问题分类】数据导入导出【关键字】数据同步，number类型，科学计数法【问题描述】客户查询不到准确数据，只看到科学计数法展示的字符串。number类型存入到Oracle(MyS ...阅读全文

【YashanDB知识库】ycm托管数据库时，数据库非OM安装无法托管

问题现象 ps -ef | grep yas 查看无yasom和yasagent进程，且在{数据库安装目录}/om/{数据库名称}的目录下没有conf、data、log等目录，确定数据库不是用yasboot安装，是用脚本安装的问题的风险及影响非yasboot安装，ycm无法完成托管，无法监控问 ...阅读全文

效率跃升16倍！火山引擎ByteHouse助力销售数据平台复杂查询效率大幅提高

在ByteHouse的支持下，目前该公司在销售数据的非ACL查询和ACL查询两个方向上，都实现了查询效率的显著提升。以ACL查询的60M广告客户DI场景为例，查询效率已经从从优化前的16秒大幅缩短至如今的1秒，效率提升高达16倍。 ...阅读全文

Redis组件介绍(一)

写在前面今天我们来学习一下 Redis 。Redis 是一个高性能的开源内存数据存储系统，支持多种数据结构，如字符串、列表、集合、有序集合和哈希表。 NoSQL 概述随着大数据的兴起，数据量的暴增，数据类型的丰富，传统的关系数据库在应付动态网站，特别是超大规模和高并发的纯动态网站时已经显得力不从 ...阅读全文

Daph：新一代流批一体数据集成与数据处理工具

Daph源码位于gitee，地址是https://gitee.com/dasea96/daph 概述 Daph的中文名称是大副，大副是职位仅低于船长的船舶驾驶员，甲板部（驾驶部）负责人，船长的主要助手。 Daph的英文名称，取自【有向无环图Directed Acyclic Graph】的第一个字母与 ...阅读全文

源代码编译，Apache DolphinScheduler前后端分离部署解决方案

转载自神龙大侠生产环境部署方案在企业线上生产环境中，普遍的做法是至少实施两套环境。测试环境线上环境测试环境用于验证代码的正确性，当测试环境验证ok后才会部署线上环境。鉴于CI/CD应用的普遍性，源代码一键部署是必要的。本文是探索对DolphinScheduler源代码改造，构建测试，线 ...阅读全文

mysql数据库查询时用到的分页方法有哪些

在处理数据库查询时，我们经常需要对结果进行分页，以便在用户界面上提供更好的浏览体验。MySQL提供了几种不同的方法来实现这一功能，其中最常见的是使用LIMIT子句。以下是三种使用LIMIT进行分页的基本方法。一、使用LIMIT子句LIMIT子句用于指定查询结果的最大记录数。它的基本语法如下：这里 ...阅读全文