个人简历
庞承杰
手机:15200805543
邮箱:codeaspoetry@outlook.com
私人博客:https://codeaspoetry.github.io
微信公众号:CodeAsPoetry
学历
- 本科(2012-2016):中南大学,矿物加工工程
- 硕士(2016-2019):北方工业大学,计算机科学与技术
自评优势亮点
- 自驱力强,注重实际业务落地;
- 数学基础较好,能够不断跟进研究,并加以实现及产品应用;
- 喜欢写作、交流,分享技术总结
- 具体个人对 LLM 的思考理解:https://codeaspoetry.github.io/2023/07/09/LLM/ ;
- 个人对LLM在教育、搜广推、文创行业的应用的微信公众号文章分享
工作经历
阿里巴巴集团 2021/03-至今
高级NLP算法工程师
职责业绩:
参与夸克APP教育线AI自动答题和作业批改项目,负责过的工作有K12数学知识点分类、大规模数据去重等,其中在英语单项选择、首字母填空等细分场景取得较大提升,同期与竞品作业帮相比,在召回率持平的情况下,准确率超竞品约10个百分点,服务上线后,负责英语单选题型的 QPS 翻了 5 倍左右,为英语学科中的流量次高峰,仅次于阅读理解;
参与夸克APP教育搜索项目,负责教育 query 的数据和模型建设,包括构建 10 亿级别的泛教育优质句段内容,优化 QT(query、title)、QTC(query,title,content)模型,结合term召回、向量召回等,不断提升用户教育搜索 query 的满意度;
平安普惠上海 2020/08-2021/03
NLP算法工程师
职责业绩:
对于存量电销放贷业务,通过增加前后轮的对话依赖,优化多轮人机对话,尽可能将客户引导至业务目标节点,结合话术分析,提高业务节点的转化率,同期相比,节点流转量提升有 113%;
建立智能电销日志自动报表系统,分析 AI 和用户的多轮对话,分析各种话术的命中率、转换率,以及目标用户群体和节点流转瓶颈,报表系统有立支撑了模型迭代的数据获取和优化方向。
科沃斯商用机器人有限公司 2019/07-2020/07
NLP助理算法工程师
职责业绩:
对基于BERT支持多个业务的语义相似度模型进行数据、算法优化,与此同时,进行压缩加速,利用权值稀疏、注意头剪枝、量化、蒸馏,再结合 cuBERT 的工程优化,将模型推理速度提升 220%,压缩比接近 60%,相当于线上服务扩容 4倍左右;
通过有 schema 约束的 SPO 抽取,获取开源知识图谱,结合业务话术底表,实现机器人闲聊、画像相关的数据建设,积累了千万级别的知识三元组,有效支撑机器人闲聊以及垂直业务的对话功能,人机互动的活跃量因命中知识库从而得到的提升有 1.5 倍左右。
佳能医疗系统株式会社 2017/04-2017/10 (实习)
工作站 · 机器学习助理研究员
职责业绩:
- 埃尔兹海默症智能诊断系统的数据、算法研究。在根据公司自行开发的大脑体积分割算法抽取分割艾尔兹海默症数据集(多用户多套脑部MR图)得到的780维特征数据的基础上,进行数据清洗、分析、降维、分类算法的探索。涉及到SVM、GBDT、RF等机器学习模型和PCA、LDA、LEE等降维算法,特征筛选的结果与有医学病理支持的结论(海马体萎缩等)得到了吻合。
- 但是由于数据样本普遍存在着类间距离小于类内距离的问题(同属患病类的两个不同病人的特征距离小于同一个病人而不同类(即健康与患病)的特征距离),最终确定以变分推断为数理基础的统计学习作为数据拟合的建模探索方向,如混合高斯、混合贝塔或混合狄利克雷模型,实现特征映射来解决问题。