2025-04
01
个人简介顾煜贤,清华大学计算机科学与技术系 2021 级博士研究生,导师为黄民烈教授,研究方向为语言模型的高效训练、模型压缩方法,在计算机顶级会议发表论文数篇,多次进行口头报告,谷歌学术引用累计 2600 余次。研究工作介绍在预训练方面,作为一作发表在 ICLR 2025 上的论文 Data Selection via Optimal Control For Language Models被选为口头报告(top 1.8%)。这项工作提出了一套新的理论框架和算法,为语言模型的预训....