算法面试问题#

技术问题#

模型结构#

  • deepseek有什么做的不好的地方?如何改进?
  • 多少数据量能让模型work?

预训练#

  • 预训练数据,怎么保证数据是新知识?
  • 预训练用kenlm做过滤,这个对吗?ppl高的数据一定要丢弃?
  • tokenizer怎么选?BBPE了解吗?
  • BPE和wordpiece的区别?分别适合什么任务?

后训练#

应用问题#

  • 工具类应用,比如devin、lovable是怎么做的,你看好他们的前景吗?
  • deepsearch 是怎么实现的?

合成数据#

  • 合成数据做得最好的是哪家公司?

推荐和LLM之间有什么可以相互借鉴的地方?#

HR面#

你是一位算法工程师,你怎么评价你自己?#