CodeAsPoetry - working, reading, writing, traveling...

七月 01, 2023

背景监督微调(supervised fine-tuning)，是重要的对齐人类指令和偏好的阶段。它对数据的质量、多样性、丰富性等都有很大的要求。而且也是与...

七月 01, 2023

背景大模型的对齐阶段，一直都是重点关注的地方。因为随着大模型的工程技术的发展，高效、稳定、持续地训练大模型的门槛已越来越低。预训练对数据的要求相对来说也容...

七月 01, 2023

项目背景建立深度学习模型，解决场景应用问题时，需要考量的重要指标之一便是模型的泛化性，要尽量避免模型在训练集上过拟合。在《Deduplicating T...

六月 26, 2023

在 LLM 工作中，尽最大的时间和精力，跟上此领域的进展，记录一些笔记、思考。 ChatGPT： GPT-3 InstructGPT 预训练： GL...