AI时代的数据处理技术陈文光清华大学/蚂蚁技术研究院大数据:数据量,数据生成的速度和多模态(inzettabytes)物联网、边缘设备和用户行为产生大量数据•数据量(Volume)和数据生成速度(Velocity)多模态数据(Variety)•图片,文档,图,时序,交易•Volumeofdata/informationcreated,captured,copied,andconsumedworldwidefrom2010to2025©Statista2021https://www.statista.com/statistics/871513/worldwide-data-created/数据处理的深度也在增加https://medium.com/hackernoon/the-ai-hierarchy-of-needs-18f111fcc007大模型崛起引领大数据新需求高质量训练数据是进一步提升基础模型性能的关键向量数据库是提升模型服务能力的核心技术80%Data+20%Model=BetterAI搜索增强的内容生成:RAG吴恩达的“二八定律”:Vecto...
发表评论取消回复