搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
小蓝xlanll
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Pytorch框架下的transformers的使用_pytorch transformers
2
NLP 自然语言处理数据集 粗略_entity canonicalization
3
【傻瓜式教学】Vite项目中静态资源 动态路径处理(Vite打包后无法显示静态资源)_vite打包路径问题
4
AI辅写疑似度检测软件大盘点
5
【自然语言处理】pytorch中如何使用RNN_pytorch rnn
6
UNet 网络做图像分割DRIVE数据集
7
BERT简明理解_token bert
8
Thinkphp 路由设置和定义_thinkphp8多模块怎么定义路由
9
【LeetCode】617. 合并二叉树_treenode* mergetrees(treenode* t1,treenode* t2)
10
DB-GPT:生产级大模型部署的思考与实践
当前位置:
article
> 正文
NLP任务概述_morphological analysis计算机
作者:小蓝xlanll | 2024-04-04 20:33:08
赞
踩
morphological analysis计算机
更新下一篇survey之前先来对
NLP
的一些任务进行总结
一、
词法分析
分词 (Word Segmentation/Tokenization, WS)
:在对文本进行处理的时候,会对文本进行一个分词的处理。
新词发现 (New Words Identification, NWI)
:这个好理解,因为网络上总是有新的词汇出现,比如以前的’神马’这类的网络流行词汇。
形态分析 (Morphological Analysis, MA)
:分析单词的形态组成,包括词干(Sterms)、词根(Roots)、词缀(Prefixes and Suffixes)等
词性标注 (Part-of-speech Tagging, POS)
:确定文本中每个词的词性。词性包括动词(Verb)、名词(Noun)、代词(pronoun)等。开源的人民日报数据中就按照规范对句子中的每个词的词性给标注好了。可以对着规范来看。https://www.jianshu.com/p/30fa95e143bf
拼写校正 (Spelling Correction, SP)
:顾名思义,需要找到错误的词,并对错误的词进行修改。
二、句法分析
语言模型 (Language Modeling, LM)
:语言模型的应用还是挺广泛的,NLP之语言模型学习笔记给出了对语言模型的详细介绍。现在好多模型都是基于LM来的。
组块分析 (Chunking)
:标出句子中的短语块,例如名词短语(NP),动词短语(VP)等
超级标签标注 (Super Tagging)
:给每个句子中的每个词标注上超级标签,超级标签是句法树中与该词相关的树形结构
成分句法分析 (Constituency Parsing, CP)
:分析句子的成分,给出一棵树由终结符和非终结符构成的句法树
依存句法分析(Dependency Parsing, DP)
:分析句子中词与词之间的依存关系,给一棵由词语依存关系构成的依存句法树。
语种识别 (Language Identification)
:确定一段文本是哪一种语言
句子边界检测 (Sentence Boundary Detection)
:给没有明显句子边界的文本加边界。
三、语义分析
词汇/句子/段落的向量化表示 (Word/Sentence/Paragraph Vector)
:这个意思就是word2vec、sentence2vec、paragraph2vec,甚至还有doc2vec。
词义消歧 (Word Sense Disambiguation)
:对有歧义的词,确定其准确的词义
语义角色标注 (Semantic Role Labeling)
:标注句子中的语义角色类标,语义角色,语义角色包括施事、受事、影响等
抽象语义表示分析(Abstract Meaning Representation Parsing)
:AMR是一种抽象语义表示形式,AMR parser把句子解析成AMR结构
一阶谓词逻辑演算(First Order Predicate Calculus)
框架语义分析 (Frame Semantic Parsing)
四、信息抽取
命名实体识别(Named Entity Recognition, NER)
:从文本中识别出命名实体,实体一般包括人名(PER)、地名(LOC)、机构名(ORG)、时间、日期、货币、百分比等。另外还有更加专业的专业实体。https://arxiv.org/abs/1812.09449一文综述了一下目前采用深度学习的方法对NER进行研究。
关系抽取(Relationship Extraction)
:确定文本中两个实体之间的关系类型。
术语抽取(Terminology/Giossary Extraction)
:从文本中找出符合要求的terminology。
事件抽取(Event Extraction)
:从无结构的文本中抽取结构化事件。
实体消歧(Entity Disambiguation, ED)
:也称语义消歧,是专门用于解决同名实体产生歧义问题的技术。在实际的 语言环境中,经常会遇到某个实体名称对应于多个命名实体对象的问题。
实体对齐 (Entity Alignment, EA)
:也被称为了实体匹配(Entity Matching),是指对于异构数据源知识库中的各个实体,找出属于现实世界中的同一实体。
共指消解(Coreference Resolution)
:确定不同实体的等价描述,包括代词消解和名词消解
情感分析(Sentiment Analysis)
:对文本里面所蕴含的主观性情绪。例如一句话’我很喜欢这部电影’,那么这个就是一个正向的评价,'我讨厌这部片子’那么就是一个负向的评价。
意图识别(Intent Detection)
:对话系统中的一个重要模块,对用户给定的对话内容进行分析,识别用户意图。
槽位填充(Slot Filling)
:也是对话系统中的一个重要模块,从对话内容中分析出于用户意图相关的有效信息。
五、顶层任务
机器翻译 (Machine Translation, MT)
:两种语言的的转换。深度学习里面的很多模型sequence2sequence、Transformer、Bert等模型应用到了机器翻译上面。
文本摘要 (Text summarization/Simplication)
:对较长文本进行内容梗概的提取
问答系统 (Question-Answering Systerm, QAS)
:针对用户提出的问题,系统给出相应的答案
对话系统 (Dialogue Systerm, DS)
:能够与用户进行聊天对话,从对话中捕获用户的意图,并分析执行
阅读理解 (Reading Comprehension, RC)
:机器阅读完一篇文章后,给定一些文章相关问题,机器能够回答
自动文章分级 (Automatic Essay Grading, AEG)
:给定一篇文章,对文章的质量进行打分或分级
参考
常给自己加个油 博客
课程
,课件链接
下载
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/小蓝xlanll/article/detail/360949
推荐阅读
article
安装
PyQt5
后无法启动
spyder
_
from
qtpy
import
qtwebenginewid...
解决方案在分割线下面。前面是情况说明,如果一样就可以用下面的解决方案。在打开
spyder
时anaconda给我来了个报错...
赞
踩
article
机器
学习
主
成分
分析
(
Principal
Component
Analysis)_机器
学习
主
成分
分析
...
主
成分
分析
1 什么是
主
成分
分析
2 实现自己的PCA算法1 什么是
主
成分
分析
主
成分
分析
法是一个非监督
学习
的机器
学习
算法,
主
...
赞
踩
article
Survey
of
Aspect
-
based
Sentiment Analysis Datasets...
基于方面的情感分析(ABSA)是一个自然语言处理问题,需要分析用户生成的评论,以确定:a)被审查的目标实体,b)它所属的...
赞
踩
article
被老师夸了的汇报,2023计算机视觉最新论文自监督_
top
-
down
visual
attentio...
ξξ。_
top
-
down
visual
attention
from
analysis
by
synthes
is
top
-...
赞
踩
article
ElasticSearch
+
Kibana
安装及使用(1)_7.13.2
版本
的
es
对应什么
版本
的
e...
1.
ElasticSearch
是什么?
elasticsearch
简写
es
,
es
是一个高扩展、开源
的
全文检索和分析引擎,它...
赞
踩
article
文献阅读_Radiogenomic
analysis
of
vascular
endothelial
...
Radiogenomic
analysis
of
vascular
endothelial
growth
factor
...
赞
踩
article
MIA
-
Net
:
Multi
-
Modal
Interactive
Attention
Net
work...
总括:多模态融合时,首先将多种模态分为主模态与辅助模态,通过构建了一个交互注意力模块,从辅助模态中提取对主模态有帮助的信...
赞
踩
article
【论文阅读】
Time
sNet:
Temporal
2D-
Variation
Modeling
for...
文章的重点是时间变化建模,这是广泛分析任务的常见关键问题。单个时间点通常无法提供足够的语义信息进行分析,时间变化更能反映...
赞
踩
article
Modern Methods
for
Sentiment
Analysis_
sentiment
an...
原文url:https://districtdatalabs.silvrback.com/modern-methods-...
赞
踩
article
离群
点
检测方法_《
Outlier
Analysis
》
离群
点
分析
阅读笔记(1)...
最近关注 VANETs(车载自组网络)/ ITS(智能交通系统)中的网络安全问题。一、简单扯两句由于网络规模的不断扩大、...
赞
踩
article
(学习笔记)
OoDAnalyzer
:
Interactive
Analysis
of Out-of-...
一、OoD样本以及算法、定理备忘录预测模型性能下降的一个主要原因是训练数据没有很好地覆盖测试样本。这种没有很好表现的样本...
赞
踩
article
自监督学习 | (2) 一文读懂
Self
-
Supervised
Learning_
self
-sup...
原文地址**导读:**最近
self
-
supervised
learning
变得非常火,首先是 kaiming 的 M...
赞
踩
article
论文翻译(5)-
Contextual
Inter
-
modal
Attention
for
Multi
...
Contextual
Inter
-
modal
Attention
for
Multi
-
modal
Sentiment
A...
赞
踩
article
机器
学习
之线性
判别分析
(
Linear
Discriminant
Analysis
)_
lda
分类
算法中...
Iris 鸢尾花数据集是一个经典数据集,在统计
学习
和机器
学习
领域都经常被用作示例。数据集内包含 3 类共 150 条记录...
赞
踩
article
【论文阅读笔记】Tag-
assisted
multimodal
sentiment
analysis
...
本文提出了一种名为“标签辅助变换器编码器(TATE)网络”的新型多模态情感分析方法,旨在解决在不确定的多模态数据中部分模...
赞
踩
article
SIGIR
2022 | 推荐系统相关论文分类整理_tag-
assisted
multimodal
...
大家好,我是对白。ACM
SIGIR
2022是CCF A类会议,人工智能领域智能信息检索( Information R...
赞
踩
article
阅读笔记—
Robust
Image
Sentiment
Analysis
using
Progres...
由Jiebo Luo等人发表在AAAI 2015上关于图片情感分析的一篇文章,主要目的是将图片分为情感上正负两类。根据文...
赞
踩
article
Fusion
-
Extraction
Networkfor
Multimodal
Sentiment ...
使用的数据集是来自twitter的MVSA-Single和MVSA-Multiple。与CoMN相比,FENet网络结构...
赞
踩
article
MABSA
(
Multimodal
Aspect
-
Based
Sentiment Analysis)2...
进一步的实验和分析表明本文的各个预
训练
任务都对提升模型的表现有所帮助,在弱监督的情况下本文提出的几种task-speci...
赞
踩
article
2020李宏毅学习笔记——20.
ELMO
,
BERT
,
GPT
_
sentiment
analysis
(...
1.机器理解文字演化历史:1-of-N encoding——word class——word embedding1-of...
赞
踩
相关标签
python
随笔
nlp
计算机视觉
人工智能
elasticsearch
论文笔记
论文阅读
深度学习
算法
离群点检测方法
机器学习
笔记
面试
职场和发展
java
CNN
PCNN
预训练
情感分析