什么是指令调优和大型语言模型的正常微调之间的区别?
我所指的指令调优并不是上下文/提示式的那种。
最近关于微调的所有论文似乎都是关于指令调优的。
我看过一些关于微调/指令调优(例如FLAN)的论文,但没有一个真正描述指令调优与其他选择(无论是什么选择)之间的区别。
我理解指令调优是一种使用指令数据集进行微调的形式。但难道不是所有数据集都是指令数据集吗?还有其他种类的数据集吗?
我所指的指令调优并不是上下文/提示式的那种。
最近关于微调的所有论文似乎都是关于指令调优的。
我看过一些关于微调/指令调优(例如FLAN)的论文,但没有一个真正描述指令调优与其他选择(无论是什么选择)之间的区别。
我理解指令调优是一种使用指令数据集进行微调的形式。但难道不是所有数据集都是指令数据集吗?还有其他种类的数据集吗?