ningshixian ningshixian

Hi 👋, I'm Ning Shixian

19年硕士毕业在北京龙湖从事4年NLP算法开发，期间主要负责内部 2B端智能客服系统的搭建。

domain_keyphrase_extract：领域关键短语抽取，帮助业务挖掘知识中的领域实体词库及其常用说法。具体实验方案的解读在博客
chinese-interrogative-recognition：中文疑问句识别，用于 query 理解；
corpus-generalization-spider：语料泛化爬虫工具，借助爬虫和相似性度量，对标准问扩展相似问，丰富训练数据；
metric_learning：这个项目是为了训练 Embedding 模型，包括了度量学习和对比学习的一些实验，主要有双塔、triple loss、AMSoftmax+simcse、rdrop、Bert-whitening等。具体介绍在博客
seq2seq_with_bert_unilm：以“BERT+UniLM”为基础架构，训练一个Seq2Seq模型，用于坐席辅助-话术生成。主要借鉴了苏剑林.《Seq2Seq+前缀树：检索任务新范式（以KgCLUE为例）》 Blog post
learning_to_rank：主要是排序学习LTR的一些实验，用于协助企业内搜的精排阶段。相关模型介绍在博客

23年 5 月离职后，照顾媳妇生娃，空窗期了半年。

23 年 10 月加入贝壳找房，短暂做了 2 个月的 NL2SQL 研究。

23 年 12 月跳槽理想汽车，参与内部 2C端智能客服系统的开发，以及 AI算法原理的研究工作（老本行٩(•̤̀ᵕ•̤́๑)ᵒᵏᵎᵎᵎᵎ + 前沿研究）

业余时间研究的一些感兴趣的东西....