赞
踩
阶段一(直到1970年代),模型基于规则:该阶段自然语言处理主要基于手写规则,只能处理少量数据
阶段二(1970-2000年代),模型基于统计:从数学统计的角度预测下个词的出现概率,代表模型如N-Gram等,推理过程非常直观,但是推理结果非常受数据集的影响,容易出现数据稀疏(即空值)等问题
阶段三(2000年代到现在),模型基于神经网络:模型开始像人脑一样学习,2017年以前主要是小模型阶段, 在 2017年Transformer发布之后,模型开始尝试大量数据的训练学习,进入大语言模型阶段,在加入人工干预的反馈基础上,模型效果攀上新的台阶。
作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM
关键词:统计语言模型、n-gram模型、神经网络语言模型、Transformer、GPT、BERT
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。