图书《数据资产管理核心技术与应用》分享

2024-08-02 13:59 由张永清发表于 #数据库

《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书，该图书主要特点如下：

1、依托于大数据技术，独家解密数据血缘的底层技术实现

2、详解数据资产管理的知识体系和核心技术

3、应用元数据管理和数据建模技术，充分发挥出数据资产的更大潜力和价值。

4、全书从元数据、数据血缘、数据质量、数据服务、数据监控、数据建模、数据架构等多个维度来剖析大数据资产管理的核心技术与应用。

5、全书配套了PPT课件以及作者微信答疑服务

核心章节介绍如下：全书依托于大数据技术，独家解密数据血缘的底层技术实现

通常来说，数据血缘的来源可以包括数据源自身、数据处理的任务、数据任务的编排系统等。

数据源自身：比如像Hive，由于其本身就是支持通过HQL做数据处理的，所以其本身就可以通过数据处理的过程来分析从而获取血缘。
数据处理的任务：这点很容易理解，因为不管是实时任务还是离线任务，都会涉及到数据逻辑的处理，从数据任务的底层实现技术上来说，不管是Hadoop的Map-Reduce 任务还是Spark任务还是Flink任务，本质也都是在做数据的转换处理，有数据的转换，就可能会有数据血缘的变化。
数据任务的编排系统：这点也很容易理解，如下图3-1-1所示，在任务编排时，可能会将很多不同的任务节点按照依赖顺序串联起来。前一个任务节点的数据输出会是下一个任务节点的数据输入，所以肯定也会产生数据的转换，就肯定也会存在血缘。

重点介绍了数据血缘的底层技术实现，包括：

如何从Hive中获取数据血缘
从Spark 执行计划中获取数据血缘
从Spark SQL语句中获取数据血缘
从Flink中获取数据血缘
从数据任务的编排系统中获取数

热门相关：寒门状元极品仙医在都市帝少宠妻有点甜龙皇缠身：爱妃，来生蛋！鬼喊抓鬼

MySQL基础20题(续前面的20题)

写在前面今天继续前面的20题之后的练习，数据都是一样的，可以直接使用，来看看你的sql功底降了没。基础20题 #1.查询每个员⼯的姓名、邮箱、职位名称以及所在部⻔名称。 SELECT CONCAT(last_name,first_name) as 姓名, email, job_title, de ...阅读全文

Apache DolphinScheduler使用图关系解决核心链路告警问题，减轻任务运维负担！

转载自程序员小陶 Apache DolphinScheduler 在使用过程中，肯定会有任务出现失败的情况，那么问题来了：调度任务的告警是需要人为配置的，在生产环境中，面对海量的任务，如何找到重要的任务，并且在失败的时候，第一时间告警呢？先思考一下。先看思路本文提供一个思路，接着往下看吧。不 ...阅读全文

ElasticSearch第1讲（4万字详解 Linux下安装、原生调用、API调用超全总结、Painless、IK分词器、4种和数据库同步方案、高并发下一致性解决方案、Kibana、 ELK）

ElasticSearch 官方文档：https://www.elastic.co/guide/en/elasticsearch/reference/current/getting-started.html 非官方中文文档：https://learnku.com/docs/elasticsearch ...阅读全文

oracle大表性能优化

1 不修改表结构的优化 1.1 收缩表,降低高水位线 ALTER TABLE TEST ENABLE ROW MOVEMENT; ALTER TABLE TEST SHRINK SPACE; 1.2 对表收集统计信息 BEGIN DBMS_STATS.GATHER_TABLE_STATS(ownna ...阅读全文

第三讲：深入浅出的索引上

目录第三讲：深入浅出的索引上：引入：索引的常见模型：哈希表：结论：有序数组：弊端：二叉搜索树特点：例子：思考：为什么数据库存储使用b+树而不是二叉树“N 叉”树例子：笔锋一转InnoDB 的索引模型索引维护基于上面的索引维护过程说明，我们来讨论一个案例：小结：补充：问题：第三讲：深入浅出的索引上 ...阅读全文

解读GaussDB(for MySQL)灵活多维的二级分区表策略

本文分享自华为云社区《GaussDB(for MySQL)创新特性：灵活多维的二级分区表策略》，作者：GaussDB 数据库。背景介绍分区表及二级分区表的功能，可以让数据库更加有效地管理和查询大规模数据，传统商业数据库具备该能力。MySQL支持分区表，与传统商业数据库相比，MySQL对二级分区表 ...阅读全文

如何将文本转换为向量？(方法二)

文本转换为向量有多种方式：方法一：通过模型服务灵积DashScope将文本转换为向量（推荐）方法二：通过ModelScope魔搭社区中的文本向量开源模型将文本转换为向量方法三：通过Jina Embeddings v2模型将文本转换为向量方法四：通过百川智能向量化模型将文本转换为向量本文 ...阅读全文

祝贺小鹏汽车Gallardot同学成为Apache DolphinScheduler Committer!

社区迎来新committer！这次是来自小鹏汽车的Gallardot，看看他与Apache DolphinScheduler社区的故事吧。对话社区 Q1：您为Apache DolphinScheduler社区提交过哪些贡献（包括代码和非代码）？请具体描述您的贡献。 A: 我主要专注于提升Apach ...阅读全文

袋鼠云产品支持全栈信创适配，更加安全可靠、自主可控

随着国产替换的深化，企业对信创产品的需求逐渐融合更丰富的业务诉求以及未来数智规划，正从“同类替换”转向“迭代升级”。当前，袋鼠云的产品与芯片、服务器、数据库、操作系统、中间件、云平台等主流信创厂商全面兼容适配，为企业提供了更加安全可靠、自主可控的数智化解决方案。在完成兼容适配的同时，公司的产品体 ...阅读全文

讲师招募 | Apache SeaTunnel Meetup等你来秀！

2024年第三季度已经悄然开启，猛回头才发现今年的时日竟然已经过半！这半年又是在忙忙碌碌中度过，好在看着社区发展年中汇总的一串串数字，似乎都在预示着社区将在一条正确的轨道上，朝着好的方向继续发展。但又隐隐约约觉得还缺点什么。想了半天，幡然醒悟，原来社区还缺一个你啊！ (￣▽￣)" 下半年，社区还是 ...阅读全文