搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
代码创作者
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【Java基础系列】JDK21新特性
2
为什么说C语言是面向过程的?
3
解决vmware虚拟机和宿主机之间不能复制粘贴问题_vm复制不能粘贴到主机
4
何为.sh文件?_.sh是什么脚本
5
卸载 vmware-tools.pl和安装 vmware-tools.pl失败了,谁能解?_enter yes to proceed. [no] input: [no] default exe
6
pl/sql编程(五)触发器_hghukfh
7
初级通信工程师-职业道德
8
Idea修改Git账号及密码的方法_idea修改git用户名和密码
9
目标检测算法——YOLOv5/YOLOv7改进之结合SIoU_姿态损失 形状损失 运动估计损失
10
docker网络
当前位置:
article
> 正文
【CTR排序】多任务学习之MMOE模型_mmoe粗排模型
作者:代码创作者 | 2024-01-30 16:02:58
赞
踩
mmoe粗排模型
学习总结
常见的多任务模型有三种范式:
hard parameter sharing:底部有shared bottom,然后上层用全连接层分别学习特定任务模式,但是当两个任务相关性没那么好(比如排序中的点击率与互动,点击与停留时长),共用一套shared bottem参数的效果就可能没这么好了。
soft parameter sharing: 这个范式对应的结果从
MOE->MMOE->PLE
等。没有shared bottom,而是有不同权重的不同专家tower进行组合预测。
任务序列依赖关系建模:如ESSM,DBMTL,ESSM2等都是属于该范式。这种适合于不同任务之间有一定的序列依赖关系。比如电商场景里面的ctr和cvr,其中cvr这个行为只有在点击之后才会发生。所以这种依赖关系如果能加以利用,可以解决任务预估中的样本选择偏差(SSB)和数据稀疏性(DS)问题
样本选择偏差: 后一阶段的模型基于上一阶段采样后的样本子集训练,但最终在全样本空间进行推理,带来严重泛化性问题
样本稀疏: 后一阶段的模型训练样本远小于前一阶段任务
MOE混合专家模型的几个思想:bagging模型集成思想、注意力机制(不同专家的决策地位不同)、multi-head机制(多个专家即多个head,代表了不同的非线性空间)。
Multi-gate Mixture-of-Experts(MMOE)的魅力就在于在MOE的基础上,对于每个任务都会涉及一个门控网络,这样,对于每个特定的任务,都能有一组对应的专家组合去进行预测。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/article/detail/47433
推荐阅读
article
平面
切分
python
蓝桥杯
_
蓝桥杯
平面
切分
python
...
其中,1 \leq N \leq 1000, −10^5 \leq A
_
i,B
_
i \leq 10^51≤。条直线是 y...
赞
踩
article
win32
CreateDI
Bitmap
---- 根据
DIB
文件 创建
Bitmap
...
The CreateDI
Bitmap
function creates a compatible bitmap (DDB...
赞
踩
article
平面
切分
- 蓝桥杯
第十一届
Python
组第九题
_
平面
切分
摘要
...
题目大意给定多条直线,询问这多条直线将
平面
分成了几部分?输入 A 和 B,代表当前直线为y = A * X + B思路我...
赞
踩
article
超详细
idea
使用
git
命令
+图片结合教学
_
idea
变基
...
一开始接触
git
的时候,对
git
无从下手,对fetch、merge、rebase、pull、push这些是词干什么的完全...
赞
踩
article
超级详细的
微信
小
程序
登录
基于
SpringBoot
_前后端springboot实现
微信
小
程序
授权
登录
...
此篇文章,针对的是很多看不懂
微信
官方文档,或者是刚入门
小
程序
和java开发的开发者,教程也会非常详细的讲到我在实现这个功...
赞
踩
article
ubuntu
18.04
安装
(指定
版本
/最新版)
docker
与
docker
compose
_ubun...
安装
Dockersudo apt-get remove
docker
docker
-engine
docker
.io ...
赞
踩
article
druid
中
StatViewServlet
的配置_
druid
.
stat
-
view
-
servlet
...
StatViewServlet
用于展示Druid的统计信息1、web.xml中<
servlet
> <...
赞
踩
article
(C++/
Python
)
LeetCode
312
戳
气球
_le...
题目描述:有 n 个
气球
,编号为0 到 n-1,每个
气球
上都标有一个数字,这些数字存在数组 nums 中。现在要求你
戳
破...
赞
踩
article
Keras
框架_
kersa
框架...
文章目录
Keras
参考网站keras简介
Keras
典型工作流程Sequential 类用函数式 API
Keras
参考网站...
赞
踩
article
高
性能和多级
高
可用
,云
原生
数据库
GaiaDB
架构设计
解析...
GaiaDB
的存储节点支持数据页的回放功能,可以动态回放至任意目标版本后再返回,在之前的版本里,假如由于异步的因素还没...
赞
踩
article
基于
stm32
f103c8t6HAL
库六路
电磁
寻迹
智能
车
_
stm32
红外循迹直角...
#基于
stm32
f103c8t6HAL
库六路
电磁
寻迹
智能
车
学习单片机第一次参加相关比赛,下面分享一些关于调
车
的心得。1....
赞
踩
article
深度学习实战:
keras
框架,循环
神经网络
做
文本
预测和
文本
生成_
in
order
to
run _e...
自然语言处理,建模,
文本
生成基于
keras
框架的深度学习实战,利用三国演义
文本
集,LSTM
神经网络
模型,训练
文本
数据,预...
赞
踩
article
Docker
配置
阿里
镜像
加速(
mac
)_
mac
docker
engine
添加
阿里
镜像
...
此方法针对安装了
Docker
for 客户端 Mac的用户之前上传自己封装好的
docker
镜像
,今天去下载愣是下载了2个...
赞
踩
article
iOS
审核
被
拒绝
问题
汇总_
程序
强制使用特定账号
登录
或采用邀请码等非正常注册
登录
的将
被
拒绝
...
iOS
审核
被
拒绝
问题
汇总1. 5.1.1
问题
1. 1
问题
描述:Guideline 5.1.1 - Legal - Pr...
赞
踩
article
通过
服务器
日志
溯源定位web应用
攻击
路径_
日志
中怎么找到
攻击
网站利用
的
cev
编号...
无论是我们使用
的
个人计算机还是
服务器
都为我们提供了强大
的
日志
记录功能。例如系统
日志
,可以为我们记录系统硬件、软件和系统问...
赞
踩
article
《
Unity
API.
AnimationClip
动画剪辑》(
Yanlz
+
Unity
+
SteamVR
+云...
《
Unity
API.
AnimationClip
动画剪辑》 版本 作者 参与者 ...
赞
踩
article
再谈
Android
View
绘制流程...
笔者在这里提醒读者,
Android
的
View
是UI的高级抽象,我们平时使用的XML文件也好,本质是设计模式中的一种策略模...
赞
踩
article
ubuntu
设置
静态
路由_
腾讯
静态
网站
托管
平台使用指南...
GitHub Pages 部署和访问速度极慢,并且如果不使用 CDN 或主动提交,国内搜索引擎无法爬取相关内容。在寻找替...
赞
踩
article
Spring
Boot +
Druid
动态数据源切换(注解实现)_
spring
.
datasource
...
druid
jar包
com.alibaba
[详细]
-->
赞
踩
article
Docker
使用(一) —
Linux
下
Docker
安装
部署
_
linux
安装
docker
...
Docker
使用(一) —
Linux
下
Docker
安装
部署
_
linux
安装
docker
linux
安装
docker
...
赞
踩
相关标签
python
算法
链表
数据结构
微信小程序
spring boot
小程序
java
javascript
docker
c++
leetcode
动态规划
戳气球
云原生
数据库
百度
单片机
深度学习
keras
rnn
运维开发
IOS审核被拒绝分析