自然语言处理（NLP） - 前预训练时代的自监督学习

2023-06-02 14:31 由 VipSoft 发表于 #其他

前预训练时代的自监督学习自回归、自编码预训练的前世

神经网络(Neural Network, NN)

损失函数，度量神经网络的预测结果和真实结果相差多少

平方差损失（欧式距离角度）预测概率分部和实际标签概率的欧式距离
交叉熵损失（信息量角度）预测概率分部和真实概率分部的差异，指导神经网络学习时，更加稳定

对参数W更新损失的负梯度

One-hot 人为规定，不需要学习，在推荐里有非常多的用处，（可以理解成完全命中）

词向量需要学习，可以很好的泛化结果，泛化性能比 one-hot 更好（可以理解成泛化关系的建模）
评估模型的好坏：有全体指标，以及一些公开的数据集，去评估词向量的相关性

Skip-gram：给定一个中间值，预测上下文窗口中的一个词

CBoW：给定一个上下文词，预测中间值

RNN 抛开马尔科夫假设，

Self-Attention：每个单词和整句所有话进行匹配，来获取当前单词对每个单词的重视程度，利用这个重视程序，对整句话的每个单词进行加权，加权的结果用于表示当前这个单词

Self-Attention：也是非常流行的 Transformer 的核心模块，
Seft-Attention 没有考虑单词的顺序，所以为了更精装的表示位置信息，需要对句子的输入加个位置的序号 Positional Embedding

残差连接，很好的缓解梯度消失的问题，包括映射和直连接部分

https://aistudio.baidu.com/aistudio/education/lessonvideo/1451160

利用远控工具横向移动

# 利用远控工具横向移动 [TOC] ## 一、利用远控工具向日葵横向移动 ### 1、向日葵介绍向日葵远程控制软件是一款免费的集远程控制电脑/手机/平板、远程桌面连接、远程开机、远程管理、支持内网穿透的一体化远程控制管理工具软件，且还能进行远程文件传输、远程摄像头监控等。 ### 2、利用思路 ...阅读全文

学习笔记——VMWare的使用和Windows的安装

2023-06-02 一、VMware介绍 1.1 VMware即虚拟机软件，用于模拟计算机（虚拟机/客户机）实体机（是实实在在的计算机）（1）特点 ①多启动系统一个时刻只能运行一个系统，切换时必须重启。 ②虚拟PC软件一台机器上同时运行多个系统二、在虚拟机中安装操作系统 2.1 安装前的 ...阅读全文

软件测试工程师如何从功能测试转成自动化测试？经验分享篇

随着测试行业的发展，"会代码"越来越成为测试工程师的一个标签。打开各大招聘网站，测试工程师月薪一万以上基本都有一个必备技能，那就是自动化测试。那么自动化测试到底难不难呢？下面我将会将我的经历讲给大家听，希望听完后，大家会有自己的一个判断。 ...阅读全文

软件测试工作3年，我是如何从刚入门进阶到自动化测试的？

从事测试工作已3年有余了，今天想聊一下自己刚入门时和现在的今昔对比，虽然现在也没什么成就，只能说笑谈一下自己的测试生涯，各位看官就当是茶余饭后的吐槽吧，另外也想写一写自己的职场感想，希望对刚开始工作的小伙伴能够有些帮助或启发。 ...阅读全文

学习笔记——软件、软件分类、软件测试、数据的形式与数制（进制之间的转化）

2023-06-02 一、软件 1、软件包含的内容：程序、数据和文档 ①程序：一遍是由编程语言编写的，例如：C、C++、java、Python等。 ②数据：一般使用文件或者数据库来存储数据 ③文档：包括安装说明书、帮助文档、许可协议等。 2、软件分类 2.1 安装功能用途分类（1）系统软件例如： ...阅读全文

有没有免费版的配音软件？

1.先说结论：完全免费的剪映配音可以满足大部分需求先不要着急去买付费的配音软件。（我就被忽悠过，买了付费配音软件后，实际没用几次）当你明确的知道，剪映配音的不足时，再考虑选付费的配音软件。刚开始做视频的时候，总是担心自己的普通话不够标准，不会给视频配音。后来发现，有文本转语音的配音软件 ...阅读全文

存储接口测试简介与测试方法

接口测试的概念接口测试原理是通过测试程序模拟客户端向服务器发送请求报文，服务端接收报文并处理后再把应答报文发送回客户端，客户端接收应答报文的过程测试接口目的就是保证接口调用的正确性和稳定性，测试内容概括为：功能、性能和安全，核心是持续集成 ...阅读全文

QR防伪溯源系统追溯原理是什么？

QR防伪溯源系统是一种基于QR技术的防伪技术，通过为每件产品生成唯一的QR标签，并将其与产品信息、生产信息、物流信息等进行关联，实现产品的全程追溯。本文将从追溯原理、系统构成、应用场景等方面对QR防伪溯源系统进行详细介绍 ...阅读全文

ChatGPT 背后的英雄——AI芯片

AI芯片能为人工智能应用提供所需的基础算力；按技术架构主要分为GPU、FPGA和ASIC。ChatGPT 有着大量复杂计算需求的 AI 模型， AI 芯片专门用于处理人工智能应用中的大量计算任务，是不可或缺的底层硬件。随着 AI 技术快速发展，AI 应用场景扩大至智能制造、家居、教育、医疗和金融等领... ...阅读全文

python mitmproxy抓包库

一.简介 mitmproxy是一款用Python编写的支持HTTP(S)的中间人代理工具。它可以拦截、查看、修改、重放和保存HTTP/HTTPS流量，支持命令行界面和图形界面，可用于安全测试、网络调试、API开发和反向工程等场景。mitmproxy具有很高的灵活性和扩展性，可以通过插件机制进行定制 ...阅读全文