搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
天景科技苑
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
2024年第二届人工智能,通信与机电一体化国际会议 (AICME 2024) -EI核心_2024年国际会议一览表
2
Apache配置与应用(构建web主机、日志分割及AWStats分析系统)
3
C语言数据结构链表基础(一)_数据结构链表c语言
4
[附源码]计算机毕业设计JAVA基于web的电子产品网络购物平台_javaweb购物网站
5
git pull和git pull --rebase的使用_git pull --rebase用法
6
python实现动态桌面壁纸(精简)_python动态壁纸源代码
7
Android Studio实现内容丰富的安卓外卖平台_android studio商家端
8
有关tf::MessageFilter和message_filters::Subscriber的联用方法_messagerfiltersuscriberbase转suscriber
9
最新区块链论文速读--CCF C会议 ICPADS 2023 共28篇 附pdf下载 (1/4)_streamlet 共识算法
10
【微命令】git config如何配置全局的用户和邮箱?(--global user.name、user.email;git config --help)_git config --global email
当前位置:
article
> 正文
将句子表示为向量:无监督句子表示学习(sentence embedding)
作者:天景科技苑 | 2024-07-14 20:05:54
赞
踩
将句子表示为向量:无监督句子表示学习(sentence embedding)
本文主要是用作自己学习记录笔记使用,如有侵权请联系删除即可。
原文链接:
将句子表示为向量(上):无监督句子表示学习(sentence embedding)
将句子表示为向量(下):无监督句子表示学习(sentence embedding)
【上篇】
References
Le and Mikolov - 2014 -
Distributed representations of sentences and documents
Li and Hovy - 2014 -
A Model of Coherence Based on Distributed Sentence Representation
Kiros et al. - 2015 -
Skip-Thought Vectors
Hill et al. - 2016 -
Learning Distributed Representations of Sentences from Unlabelled Data
Arora et al. - 2016 -
A simple but tough-to-beat baseline for sentence embeddings
Pagliardini et al. - 2017 -
Unsupervised Learning of Sentence Embeddings using Compositional n-Gram Features
Logeswaran et al. - 2018 -
An efficient framework for learning sentence representations
【下篇】
更详细的介绍可以参考论文作者的博客
Google AI Blog
(中文版)
。
5. 总结
基于监督学习方法学习sentence embeddings可以归纳为两个步骤:
第一步选择监督训练数据,设计相应的包含句子编码器Encoder的模型框架;
第二步选择(设计)具体的句子编码器,包括DAN、基于LSTM、基于CNN和Transformer等。
Sentence Embedding的质量往往由训练数据和Encoder共同决定。Encoder不一定是越复杂越好,需要依据下游任务、计算资源、时间开销等多方面因素综合考虑。
References
Wieting et al. - 2015 -
Towards universal paraphrastic sentence embeddings
Conneau et al. - 2017 -
Supervised Learning of Universal Sentence Representations from Natural Language Inference Data
Cer et al. - 2018 -
Universal Sentence Encoder
Google AI - 2018 -
Advances in Semantic Textual Similarity
声明:
本文内容由网友自发贡献,转载请注明出处:
【wpsshop】
推荐阅读
article
Flutter
开发踩坑记录一:
Flutter
混合开发入门指南_
io
.
flutter
.embeddin...
本文介绍
Flutter
项目如何集成到原生项目中的步骤,以及注意事项_
io
.
flutter
.
embedding
.andro...
赞
踩
article
如何利用大
语言
模型
(
LLM
)打造定制化的
Embedding
模型
_llm
embedding
...
在探索大
语言
模型
(
LLM
)应用的新架构时,知名投资公司向量数据库是预处理流程中系统层面上最关键的部分。它能够高效地存储、...
赞
踩
article
NLP-词
向量
(
Word
Embedding
)-2013:
Word
2vec
模型(
CBOW
、
Skip
-...
一、什么是word embeddingword embedding是指把一个词映射到成一个实值
向量
空间的过程。二、wor...
赞
踩
article
Langchain
-
Chatchat
项目
:
1-整体介绍_
chatchat
embedding
...
基于
Langchain
与ChatGLM等语言模型的本地知识库问答应用实现。
项目
中默认LLM模型改为THUDM/chatg...
赞
踩
article
【
LangChain
-
chatchat
添加在线调用Openai的
embedding
模型:
text
-e...
【代码】【
LangChain
-
chatchat
添加在线调用Openai的
embedding
模型:
text
-embeddi...
赞
踩
article
Sentence
-
BERT
+
Milvus
实现
智能
问答
系统_
milvus
实现
问答
...
使用
Sentence
-
BERT
+
Milvus
实现
的
问答
系统_
milvus
实现
问答
milvus
实现
问答
...
赞
踩
article
词
嵌入
(
word
embedding
)...
举个例子,我们可以把“苹果”这个单词映射成一个向量[0.2, 0.9, -0.1, ...],把“香蕉”映射成[0.5,...
赞
踩
article
将
句子
表示
为
向量
(
上):无监督
句子
表示
学习
(
sentence
embedding
)...
1. 引言word
embedding
技术如word2vec,glove等已经广泛应用于NLP,极大地推动了NLP的发展...
赞
踩
相关标签
flutter
android
语言模型
embedding
人工智能
增强检索生成(RAG)
深度学习
自然语言处理
Word Embedding
langchain
python
数据结构与算法