自然语言处理 Paddle NLP - 任务式对话系统-理论

2023-06-29 11:36 由 VipSoft 发表于 #其他

什么是任务型对话:

任务型：用于帮助用户完成某领域的特定任务，例如订餐、查天气、订票等
闲聊型：也称作开放域对话系统，目标是让用户持续的参与到交互过程，提供情感陪伴
问答型：提供知识满足，具体类型比较多，如图谱问答、表格问答、文档问答等

Pipeline型任务型对话系统

什么是NLU?
NLU(自然语言理解)：是指将用户表述映射为结构化的语义表示，典型的结构化语义表示是意图+词槽的形式。
意图：是指对话中用户想要表达的目的，比如订票，查天气等
词槽：是指用户表述中，与任务相关的核心语义元素
意图分类+词槽识别==>文本分类+序列标注

什么是DST？
DS（对话状态）：是指将t时刻的对话表示为可供系统选择下一时刻动作信息的抽象信息（数据结构），典型而言就是每个槽值的取值分布情况（BelifState）。
DST：对DS进行追踪，当前大多数工作采用BelifState

Pipeline型任务式对话系统中的Policy

对话策略是指根据DST估计的对话状态，通过预设的候选动作集，选择系统动作的过程。

Policy中的典型方法
典型方式：
在离线阶段，通过监督学习或模拟学习在语料上进行学习
在线阶段，通过强化学习的方式，与真实用户交互过程中学习

用户模拟器在DPL中的应用
定义：用户模拟器是另一套对话系统，其动作行为与真实用户类似，用来提供进行训练或评估的环境
缺点：用户模拟器并不能完全模拟真实用户的对话习惯，它本身行为的有偏可能会导致学习到的是不是最优模型，从而在与真实用户交互时表现较差。

Pipeline型任务式对话系统中的NLG

什么是NLG？定义：自然语言生成的主要任务是将对话管理模块输出的抽象表达转换为句法合法、语义准确的自然语言句子，一般被视为一个条件语言生成任务。
评估标准：
人为标准：是否自然、是否多样，是否完整传达了语义、是否流畅，可读性是否好等
机器指标：BLEU、perplexity、ROUGE、METEOR等

虽然有多种机器评估指标，但实际上依然缺乏一种能够贴近人为感知的评估标准

端到端任务型对话系统

什么是端到端任务型对话系统？

端到端任务型对话系统是受开放域对话领域的进步启发，使用模型以端到端的方式而不是分模块优化的方式构建任务型对话系统。
虽然大多数端到端任务型对话系统采用了Seq2Seq框架，但端到端任务型对话系统≠Seq2Seq模型

端到端任务型对话系统--示例

工业界的任务型对话系统

UNIT任务式对话技术发展

UNIT--面向小样本的意图识别

UNIT--TaskFlow：可编程对话流管理框架
UNIT网站：https://ai.baidu.com/unit/home

热门相关：恭喜你被逮捕了花月颂变身蜘蛛侠锦乡里民国之文豪崛起

如何从消失的异常堆栈定位线上问题

在618保障大促稳定性过程中，消失的异常堆栈可能会给我们带来严重的麻烦，因为这些堆栈信息是我们解决线上问题的关键之一。如何快速定位问题？想必大家心中都有自己的答案，当然最简单直接的办法还是查找异常堆栈信息。 ...阅读全文

欧拉函数证明与代码实现

# 欧拉函数 - 定义对于正整数n小于等于n的数中与n互质的数的个数记为$\varphi(n)$,即为欧拉函数 - 欧拉公式由算数基本定理任意一个正整数都可以写作n=$p_1^{a_1}p_2^{a_2}\cdots p_k^{a^k}$ 那么$\varphi(n)=n\prod\limits_ ...阅读全文

pytest接口自动化测试框架搭建的全过程

Pytest目前已经成为Python系自动化测试必学必备的一个框架，网上也有很多的文章讲述相关的知识。最近自己也抽时间梳理了一份pytest接口自动化测试框架，因此准备写文章记录一下，做到尽量简单通俗易懂，当然前提是基本的python基础已经掌握了。如果能够对新学习这个框架的同学起到一些帮助，那就更... ...阅读全文

可观测性是什么？入门指南

如果您之前对可观测性重要性，益处，以及组成不甚了解，本文是一个合适的指南手册。什么是可观测性？可观测性被定义为根据系统产生的输出数据（如日志，指标和链路追踪）来衡量当前系统运行状态的能力。可观测性目前被广泛的用于提升分布式 IT 系统的稳定性（系统复杂度成倍提升，在故障或者异常时很难快速定位和 ...阅读全文

链家广州二手房分析 2023

因为详细的数据分析在之前的文章中已经做过，而且这次重新爬取数据主要也是为了比较一下广州二手房市场的一些新变化，所以完整且详细的分析就不再重复了，有兴趣的读者可以翻开之前的文章。不过我利用这些新数据确实看到了一些有趣的变化。这篇文章将会零碎的分享这些新发现。 #### 天河一骑绝尘从图像可以看出， ...阅读全文

Sudo堆溢出漏洞(CVE-2021-3156)复现

2021年1月26日，Qualys Research Labs在 sudo 发现了一个缺陷。sudo 解析命令行参数的方式时，错误的判断了截断符，从而导致攻击者可以恶意构造载荷，使得sudo发生堆溢出，该漏洞在配合环境变量等分配堆以及释放堆的原语下，可以致使本地提权。 ...阅读全文

11个开源项目，5位技术大咖…华为云亮相2023开放原子全球开源峰会

摘要：华为云受邀参加了2023开放原子全球开源峰会中开源数据库、开源安全技术与实践等分论坛，并承办了云原生分论坛 2023年6月13日，由2023全球数字经济大会组委会主办，开放原子开源基金会、北京市经济和信息化局、北京经济技术开发区管理委员会承办的2023开放原子全球开源峰会在北京圆满落幕。本次峰 ...阅读全文

数据恢复EaseUS（数据恢复神器）

易我数据恢复EaseUS Data Recovery Wizard 技术员终身版为全球提供数据恢复方案,用于误删数据数据，电脑误删文件恢复，格式化硬盘数据恢复、手机U盘数据恢复等。RAID磁盘阵列数据恢复，分区丢失及其它未知原因丢失的数据恢复、简单易用轻松搞定数据恢复。 EaseUS 堪称是最好的数 ...阅读全文

不纠结语法（田静）

# 第一章简单句的核心 ## 第一节简单句的核心构成 ### 简单句的核心导图 ![img](https://img2023.cnblogs.com/blog/2807357/202306/2807357-20230628161238883-1987928337.png) ### 注意： - 主 ...阅读全文

分享一次性能测试过程，5个步骤直接起飞！

在企业中完成性能测试项目是一个挑战性强、技术含量高的任务。本文将分享一个公司完成高性能游戏系统的性能测试过程，展示如何完成一次成功的性能测试项目。项目背景：这是一家游戏公司，推出了一款新的游戏软件，系统要求高性能、高并发、高可用，为确保用户体验和游戏体验，公司决定在正式上线前对系统进行性能测试. ...阅读全文