DeepSeekr1闭门学习讨论|BestIdeasVol3From:ShixiangTo:ShixiangFriends「BestIdeas闭门讨论会Vol.3」聚焦在引爆全球AI社区的DeepSeekr1,本篇纪要是我们对闭门会上参与讨论的嘉宾成员的观点的总结,不代表任何具体个人及机构观点立场。I.DeepSeek1.DeepSeek有好口碑的原因在于是第一个把复现MoE、o1等发出来,胜在做的早,但能不能做的最好,空间还很大,和新挑战在于资源有限,只能把有限的资源放在最亮眼的地方,但后续可能没有精力去做得更好,比如MoE,这个团队的research能力、团队文化还是很好的,如果再给10、20万张卡,可能能做出更好的事情。2.DeekSeek从preview到正式发布这段时间,长上下文能力提升很快。DeepSeek的Longcontext10K用非常常规的方法就能够做到。3.DeepSeek肯定没有5万张卡,公开信...
发表评论取消回复