麦克雷
标题:
ChatGPT分别是什么意思?
[打印本页]
作者:
艾的民
时间:
2023-4-21 20:41
标题:
ChatGPT分别是什么意思?
ChatGPT分别是什么意思?
作者:
艾的民
时间:
2023-4-21 20:42
ChatGPT是由OpenAI研发的聊天机器人程序,全称为“chat Generative Pre-trained Transformer”,是一款人工智能技术驱动的自正烂然语言处理工具。它能够通过学习和理解人类的语言来进行对话,不仅知识渊博,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、唤清梁视频脚本、文案、翻译和运、代码等任务
作者:
Dustinmi
时间:
2023-4-21 20:42
(, 下载次数: 3)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
(, 下载次数: 2)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
(, 下载次数: 0)
上传
点击文件名下载附件
ChatGPT分别是什么意思?
Generative
G是Generative的缩写,中文译为生成式,是众多的人工智能模型的一种方式。其它比较出名模型还有判别模型:例如人脸识别,车牌识别等各种识别任务Generative 这个大类里包含几个小分支,例如现在最火的Stable DiffusionMidJourney 用了其中一个分支,叫做Difusion,而 ChatGPT 又是一个分支,就是转换器 Transformer。
Transformer Generative 模型的核心,通俗的说就是顺口溜。它在看了足够多的文本以后,发现有一些语言模式是反复出现的。它就所以可以准确的填补“床前明月的空格,仅仅是通过语感,顺口溜出来的。生成式模型解决的问题,就是给定一些字,预测人类会写什么字。
PreTraining
P是PreTraining的缩写,中文译为预训练。以前大部分人工智能模型都是为了一个目标训练。比如给1000 张狗的照片,就很容易的可以训练出来一个模型,判断一张图片是狗还是不是狗,这就是专用的模型。PreTraining模型不为特定的目标训练,而是预先训练一个通用的模型。如果有特定的需求,可以在此基础上进行第二尘嫌察次训练,基于原来已经预训练的模型,进行微调(fine tune)。
PreTraining就好比公司招了新员工,她已派茄经在大学预训练了专业基础知识,在此之前已经被小学老师预训练了中文对话,到了公司里面只要稍微了解学习(fine tune) 一些公司的业务要求就好了,而不需要给我一个空白的人,让我从教汉语开始把她彻底教一遍才能让她干活。
Transformer
T是Transformer的缩写,中文译为转换器。例如变电器就是一种 转换器,将220伏的电转为12伏输出。语言的转换器就是把语言的序列作为输入,然后用一个叫做编码器encoder 的东西转换成数字。然后者如经过转化,变成一串新的序列,最后再用 decoder把它输出。这个转换器,是这个自然语言处理的核心。
比如ChatGPT 输入Orange这个词,它会返回诸如-0.012022103等大量浮点数字,它用浮点数来表示Orange,这些数字是从多个维度(例如颜色,甜度等)对Orange的描述然后这堆数字,再交给 decoder,如果限定中文的话,它会解码成为橙子,限定 emoji的话,就输出。通过编码,转换,解码.就完成了从 Orange 到目标语言的转化。
ChatGPT究竟是个啥 ?
将G、P、T结合起来,GPT 就是一个预先训练好的,用生成的方式,把输入文字转化成输出文字的翻译。核心上说,它就是把一个语言序列,转换为了另外一堆语言序列,但是因为转换的太好,以至于让人产生了它有智慧的错觉。
GPT模型的历史版本包括GPT-1, GPT2,GPT-3。这些模型都是根据提示词来进行补全。但是这些模型用于聊天不是很好用,所以OpenAI在 GPT-3 基础上发展出了下一代模型InstructGPT,专注于让这个模型可以听懂指令。在上面继续发展出了 ChatGPT.针对对话场景进行了加强。但ChatGPT这个模型是基于 GPT-3 升级的产物,可以说是GPT-3 模型上面的一个微调。
欢迎光临 麦克雷 (https://mavom.cn/)
Powered by Discuz! X3.5