什么是ChatGPT:ChatGPT是在GPT 3.5大模型语言模型(LLM,即Large Language Model)的基础上,加入“基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)”来不断微调(Fine-tune)预训练语言模型,使得LLM模型学会理解不同类型的命令指令,并通过多重标准合理判断基于给定的prompt输入指令,输出的是否为优质信息(这些标准包括:富含信息、内容丰富、对用户有帮助、无害、不包含歧视信息等)。