DeepSeek r1闭门学习讨论_ 拾象 Best Ideas Vol 3_0127

阅读 138 格式 pdf 大小 371.99 KB 共10页2025-02-10 10:08:34发布于四川
DeepSeekr1闭门学习讨论|BestIdeasVol3From:ShixiangTo:ShixiangFriends「BestIdeas闭门讨论会Vol.3」聚焦在引爆全球AI社区的DeepSeekr1,本篇纪要是我们对闭门会上参与讨论的嘉宾成员的观点的总结,不代表任何具体个人及机构观点立场。I.DeepSeek1.DeepSeek有好口碑的原因在于是第一个把复现MoE、o1等发出来,胜在做的早,但能不能做的最好,空间还很大,和新挑战在于资源有限,只能把有限的资源放在最亮眼的地方,但后续可能没有精力去做得更好,比如MoE,这个团队的research能力、团队文化还是很好的,如果再给10、20万张卡,可能能做出更好的事情。2.DeekSeek从preview到正式发布这段时间,长上下文能力提升很快。DeepSeek的Longcontext10K用非常常规的方法就能够做到。3.DeepSeek肯定没有5万张卡,公开信...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

发表评论取消回复

参与评论可获取积分奖励  
嘿牛投研
结合工作实务分享各行业优质研报,一起洞见研报里的趋势、机会和热点。

文档

66344

收藏

12

店铺

企业店铺
广告位不存在!
确认删除?
VIP会员服务
限时9折优惠