殷述康-多模态大语言模型领域进展分享-2024-42页(1)

阅读 110 下载 0 格式 pdf 大小 4.36 MB 共42页2025-01-11 23:24:52发布于上海市
多模态大语言模型领域进展分享殷述康/博士在读DataFunSummit#2024背景介绍多模态大语言模型介绍多模态大语言模型演进团队相关工作介绍未来展望01背景介绍背景-LLM正走向多模态•大语言模型(LLM)是近几年来最火热的方向之一•可以解决各种传统NLP任务,如文本分类、命名实体识别等•可以做更高级的任务•作为聊天机器人,按照要求扮演某个角色(强大的指令遵循能力)•做高阶的推理任务,如写代码、解数学问题等(强大的推理能力,CoT进一步增强)•然而LLM存在固有的限制•无法处理多模态的输入,导致有些任务无法做或者很难做,如根据网站截图给出源代码、理解一张表情包的含义•无法获取更多的多模态的世界知识,如名画、名人等背景-LLM正走向多模态•多模态大语言模型(MLLM)的兴起•就在近两年,工业和学术界都在积...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

发表评论取消回复

参与评论可获取积分奖励  
嘿牛投研
结合工作实务分享各行业优质研报,一起洞见研报里的趋势、机会和热点。

文档

64933

收藏

12

店铺

企业店铺
广告位不存在!
确认删除?
VIP会员服务
限时9折优惠