当前位置:
首页
博客
博客详情

【22-23 春学期】AI作业12-LSTM

奋斗吧

奋斗吧

擅长邻域：未填写

标签：【22-23 春学期】AI作业12-LSTM

2023-06-03 18:23:24 212浏览

通过这样的门控机制，GRU可以自适应地控制信息的流动和记忆的更新，从而更好地解决了长期依赖问题，并且相对于传统的RNN结构，它还能够更好地避免梯度消失和梯度爆炸问题，提高了模型的训练和预测性能。具体来说，遗忘门控制之前的记忆是否需要保留下来，输入门控制新的输入数据对当前记忆的影响，输出门控制当前记忆对输出的影响。GRU中的更新门和重置门可以看做是一个对当前输入和上一时刻隐藏状态的加权平均，其中更新门控制了上一时刻隐藏状态的遗忘和当前输入的融合，而重置门则控制了当前输入和上一时刻隐藏状态的丢弃和保留。

网络 LSTM（输入门、遗忘门、输出门）

LSTM（长短时记忆网络）是一种特殊的RNN（循环神经网络），能够学习长期的依赖关系。它通过原始 RNN 的隐藏层只有一个状态，它对于短期的输入非常敏感。LSTM增加了一个保存长期的状态。

遗忘门（forget gate）决定了上一时刻的单元状态有多少保留到当前时刻。

输入门（input gate）决定了当前时刻网络的输入有多少保存到单元状态。

输出门（output gate）控制单元状态有多少输出到LSTM的当前输出值。

这些门都拥有三个全连接层网络，并使用sigmoid函数作为激活函数，最终的输出值都在区间(0,1)中

LSTM如何克服梯度消失

LSTM通过引入三个门机制，即遗忘门、输入门和输出门，使得网络的梯度可以更好地流动，从而克服了梯度消失问题。

具体来说，遗忘门控制之前的记忆是否需要保留下来，输入门控制新的输入数据对当前记忆的影响，输出门控制当前记忆对输出的影响。这些门机制可以通过非线性函数来控制信息的流动，从而实现对梯度的有效传递。

此外，LSTM还采用了循环连接的方式，在时间上对信息进行持久化处理，避免了信息的突然消失或累积问题，从而进一步提高了训练效果。在这里插入图片描述

门控循环单元神经网络 GRU（更新门、重置门）

门控循环单元神经网络（GRU）是一种用于处理时间序列数据的神经网络，它是一种改进的循环神经网络（RNN）结构，通过引入两个门控机制：更新门和重置门，来控制信息的流动和记忆的更新。

GRU中的更新门和重置门可以看做是一个对当前输入和上一时刻隐藏状态的加权平均，其中更新门控制了上一时刻隐藏状态的遗忘和当前输入的融合，而重置门则控制了当前输入和上一时刻隐藏状态的丢弃和保留。

具体来说，更新门和重置门都是一个0到1之间的值，它们通过S形函数来进行计算。当更新门的值接近1时，当前输入的信息会被大量保留，同时上一时刻的隐藏状态也会被相对保留；而当重置门的值接近0时，当前输入的信息会被大量丢弃，同时上一时刻的隐藏状态也会被相对遗忘。

通过这样的门控机制，GRU可以自适应地控制信息的流动和记忆的更新，从而更好地解决了长期依赖问题，并且相对于传统的RNN结构，它还能够更好地避免梯度消失和梯度爆炸问题，提高了模型的训练和预测性能。

好博客就要一起分享哦！分享海报

此处可发布评论

评论（0）展开评论

暂无评论，快来写一下吧

展开评论

您可能感兴趣的博客

23.实现上下架功能

【简介】实现上下架功能

22.管理员端审核功能

【简介】管理员端审核功能

5.数据库表设计

【简介】数据库表设计

基于SpringBoot2+Vue2+uniapp的考研社区论坛网站及小程序

【简介】、Vue2、uni-app框架、MySQL 核心功能本系统是一个专注于考研主题的**社区论坛网站及小程序**，旨在为考研用户提供一个集**资讯获取、学习交流、资源分享**于一体的综合性平台。核心价值在

基于SpringBoot2+Vue2+uniapp的考研社区论坛网站及小程序

写一个最全的Java8日期时间工具类

【简介】写了一个日期时间工具类

下拉列表spinner

【简介】下拉列表spinner

c++求连续子数组的最大和

【简介】 c++求连续子数组的最大和

文本摘要自动抽取技术研究与实现

【简介】文本摘要自动抽取技术研究与实现

题库管理系统

【简介】题库管理系统

uniapp开发业主端

【简介】 uniapp开发业主端

基于深度学习的图像识别与分类系统的设计与实现

【简介】基于深度学习的图像识别与分类系统的设计与实现

基于llm的编程语言学习平台

【简介】基于llm的编程语言学习平台

第15章 ElasticSearch搜索引擎

【简介】 ElasticSearch搜索引擎

第17章定时任务、批处理

【简介】定时任务、批处理

获取电表参数数据

【简介】获取电表参数数据

若依特产商城购物系统-sql

【简介】 sql可以直接复制建表

实验室考勤小程序

【简介】实验室考勤定位小程序

第10次课-ssm整合ajax传参json数据动态三级联动

【简介】 ajax传参,ssm整合

java和springboot开发祭祀小程序扫墓系统

【简介】绿色祭祀小程序，用户微信授权登录后可以发布纪念馆（祭祀名人，祭祀英烈，祭祀个人，可以设置成公开状态或者隐私状态）购买祭祀礼物和留言，用户还可以发布代祭的信息

java和springboot开发祭祀小程序扫墓系统

大学老师绩效考核系统

【简介】大学老师绩效考核系统

教材发放系统

【简介】教材发放系统

奋斗吧

奋斗吧 主页关注

343万+ 人气	865 博客	0 专栏
问答	1 粉丝	0 关注

写博客博客管理

他感兴趣的技术

Java HTML PHP python JavaScript Android MySQL C Linux 微信其他

最热博客更多

1、Windows怎么激活？Windows激活密钥分享 5874

2、黑客入侵的常法 5573

3、类ChatGPT项目的部署与微调(上)：从LLaMA到Alpaca、Vicuna、BELLE 2950

4、黑马Mysql从入门到高级 2933

5、分享200+个关于AI的网站 2610

6、掌握Conda环境迁移的几种方式，从此不在重复配环境 2532

7、八股文总结 2153

8、小迪笔记 2146

9、Spring Boot 最核心的27个注解，你了解多少？ 2064

10、银河麒麟V10——Postgres-12.5主从编译安装 1934

客服QQ 1913284695