新浪博客

加载中…

http://blog.sina.com.cn/u/3239269453

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

chatGPT培训老师AIGC培训讲师叶梓:大模型这么火，我们在使用时应该关注些什么？-6

(2023-11-16 15:40:18)

标签：

aigc

ai讲师

chatgpt

计算机视觉讲师

人工智能讲师

以下为叶老师讲义分享：

P25-P29

提示工程的模式

节省计算资源：

在微调过程中，不需要重新训练整个模型，因此可以节省计算资源。

提高特定任务上的性能：

通过微调，模型可以适应特定任务的语言特征和模式，从而提高模型的性能。

保留模型的通用性：

预训练模型具有较高的通用性能，微调可以帮助模型适应特定任务的语言特征和模式，从而提高模型的通用性。

减少数据需求：

预训练模型已经过大量训练，因此在微调过程中可以使用较少的数据。

微调大模型的意义

节省计算资源：

在微调过程中，不需要重新训练整个模型，因此可以节省计算资源。

提高特定任务上的性能：

通过微调，模型可以适应特定任务的语言特征和模式，从而提高模型的性能。

保留模型的通用性：

预训练模型具有较高的通用性能，微调可以帮助模型适应特定任务的语言特征和模式，从而提高模型的通用性。

减少数据需求：

预训练模型已经过大量训练，因此在微调过程中可以使用较少的数据。

微调大模型的方法（Adapter-Tuning）

https://img-blog.csdnimg.cn/20a5e2e1883547029391761ecc8600d1.png编辑

微调时冻结预训练模型的主体，由Adapter模块学习特定下游任务的知识。
Adapter调优的参数量大约为LM参数的3.6%。

https://img-blog.csdnimg.cn/97355201474e4462872189d0cd37f261.png编辑

Prefix Tuning只是在每个任务前有少量的prefix的参数，

比如翻译任务，可以在每句话的前面加上“翻译：”来引导模型进行翻译功能。
Prefix Tuning参数规模约为LM模型整体规模的0.1%。

https://img-blog.csdnimg.cn/8be9233c631040258ebfae6057bec025.png编辑

因为离线的Prompt对于连续的神经网络只是次优解，prompt的词之间是彼此关联的，需要将其关联起来。

于是，P-Tuning将一些伪prompt输入至LSTM中，然后利用LSTM的输出向量来替代原始的prompt token，然后一起输入至预训练语言模型中。

LSTM和随着预训练语言模型一起训练。

chatGPT讲师AIGC讲师叶梓:大模型这么火，我们在使用时应该关注些什么？未完，下一章继续……

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：chatGPT讲师AIGC讲师叶梓:大模型这么火，我们在使用时应该关注些什么？-5

后一篇：人工智能AIGCchatGPT之泄露和被破解的GPTs提示大集合

新浪BLOG意见反馈留言板　欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

Copyright © 1996 - 2022 SINA Corporation, All Rights Reserved

新浪公司版权所有