投资人看不懂大模型

栏目：行业报道作者：李京亚肖芳来源：多面体InterfaceX发布：2023-07-01浏览：90478

在ChatGPT走红之后，很多从业者也在反思中国为什么没有诞生和OpenAI类似的公司，投资人不懂技术和太擅长投资，被认为是其中一个重要原因。

记者 | 李京亚肖芳

编辑 | 文姝琪

头图©Unsplash

去年下半年至今，中国人民大学高瓴人工智能学院教授卢志武和他的学生高一钊见了150多家VC（风险投资机构）。以ChatGPT走红为分界点，他明显感觉到投资人对大模型创业的态度变得积极甚至是着急，但卢志武依然没拿到VC的投资。

卢志武的多模态大模型项目源起智源，最开始由智源研究院注资3000万元。2021年，他团队研发的多模态大模型项目雏形已现，急于寻找一笔融资支持大模型的深入研发。他曾对风险投资寄望很大，期待获得微软之于OpenAI那样的支持。

在ChatGPT走红之前，卢志武需要反复跟投资人科普大模型是什么以及价值在哪，其中不乏朱啸虎这样的大佬级投资人，但没有人听得懂——他们不理解大模型百亿级别参数意味着什么，更难理解提前几年研发所带来的竞争优势。

“VC永远问我怎么盈利，怎么竞争得过大厂。”卢志武说，头部VC他几乎都见了，主投TMT的主投硬科技VC也见了，但感觉VC们做的功课很少。

在ChatGPT走红之后，他终于不用向投资人科普大模型，但新的问题又来了：如果多模态大模型这么重要，那为什么ChatGPT是单模态的？

卢志武不知道怎么回答。

北京大学信息科学技术学院副教授、智能编程助手aiXcoder创始人李戈对此也感同身受。很多投资人在评估项目时都会向他质疑：既然ChatGPT已经有了程序生成功能，国内团队再做，有什么意义？

很多投资人都会使用最简单的python实现贪吃蛇游戏作为测试用例，但在李戈看来，程序生成是很难的事情，涉及上下文环境，投资人总是把它过于简单化，他们的目光都盯在nl2code（即自然语言转换成代码）上，输入个自然语言输出个代码，然后在那儿比来比去。“这个东西能比得出来谁好谁坏么？”

兜兜转转见了上百个投资人，卢志武终于意识到，VC们把大模型项目当成互联网项目去类比，围绕着商业模式和团队构建打转，“大模型有自己的特殊性，他们不理解，但却很早就达成了某种共识。”

这种共识主要指投资人之间的小圈子文化。卢志武认为，投资人们喜欢交换看法，虽然很多看法大多是错误的，但这些投资人的态度却出奇的一致。

“基金跨周期很难，找benchmark（对标与基准线）是投资人的天性和习惯，所以在上个周期形成的共识范式往往会成为新周期绊脚石。在大模型这样晦涩难懂的前沿领域，当底层范式发生转变，简单地和过去类比没有意义，老一代范式的知识体系和判断标准会变成包袱，投资前沿科技需要开阔思路和技术信仰。”前沿科技基金Capital O的创始合伙人刘大卫这么解释这个现象。

谈了几个月之后，卢志武不再想拿VC的投资，因为他们并不懂大模型。

但还有很多大模型相关的创业者寄希望于通过VC的助力把项目继续下去。界面新闻了解到，红杉中国旗下的创业加速器YUE2月28日开启报名之后，2000个报名项目中有400个是AIGC主题，创下了历史。6月3日，在奇绩创坛2023春季创业营路演上，60家参与公司中有41家为人工智能主题，比去年翻番，其中有39家为大模型相关。

记录屡屡刷新，但大模型创业者们首先需要面对的是投资人比以往都大的认知鸿沟。

犹豫的投资人

一种stereotype（刻板印象），一种倚老卖老。

很多投资人听完大模型创业的项目之后，不是不想下手，而是不敢下手。

今年春节前后，卢志武和高一钊见投资人的频率明显提升。他们感受到ChatGPT走红之后投资人急迫的心情，但也感受到了他们的犹豫。“很多投资人愿意听我们讲，但不给明确答复。我们催他们回复，他们一般只说在考虑中，或者说等下一轮再看看。”

投资人犹豫的原因是，他们不知道用什么标准去评判眼前的大模型项目是否值得投资。实际上，在移动互联网时代，面对很多新应用和新商业模式，很多投资人也未必听得懂，但他们拥有一个重要决策逻辑——投人。

风险投资就是投人，这个理念由美国风险投资家威廉·德雷帕最早提出，在移动互联网大潮十年黄金期中被屡屡印证。真格基金创始人徐小平的一句名言是，投人，投人，投人，而不是投事、投模式、投方向。

投人背后的逻辑是，早期创业一定需要经过无数试错和调整，只要创始人强大、团队战斗力强，就能走过暴风骤雨，抵达胜利的彼岸。

从移动互联网到硬科技时代，很多早期投资人仍坚持投人。真格基金联合创始人王强在一次媒体交流活动中表示，自己不怎么用ChatGPT，也不用stability.ai，但仍想赶上这波前所未有的时代变局，用自己过往投人的方式。

实际上，投人的逻辑在国内仍处于概念化阶段。过去三十年间，国内天使投资的失败比例高达90%，风险投资失败比例达70-80%，投人缺乏真正具体的标准，这个逻辑就是风险本身。

无论从个人经历还是团队背景来看，卢志武的项目都可圈可点，但和移动互联网项目不同的是，大模型项目前期需要的资金多很多，很多基金要么投不起，要么非常谨慎。而且，大模型创业是一个10年甚至20年才能看到结果的事情，现在的判断都过于简单。

“投人逻辑在VC行业很常见，它的正面是对创业者画像与素质的深度理解，在行业里浸泡了10年以上的投资人基本都有他们看人的一套方法论，但是各有千秋。反面折射的则可能是投研的惰性，一种stereotype（刻板印象)。当很多项目说不出个所以然的时候，投人逻辑也是一种自我安慰。从行业数据来看，后者似乎愈演愈烈，特别是跨周期时期。”一位头部基金年轻合伙人对滥用投人逻辑表示排斥。

“相比于当年打车和社区团购这种大规模的投资热潮，如今大模型浪潮中的投资人更冷静。可以只投人的基金规模往往不大，规模较大的中后期基金又不能在只投人的阶段介入，双边一挤压，交集就变小，也一定程度上限制了资金的投入速度。但无疑，AI/大模型是今年机构都无法绕开的主题。”光源资本创始人郑烜乐在谈到大模型创投现状时表示。

卢志武在见了很多投资人之后也意识到，风投未必适合大模型项目。“基金的钱是LP（有限合伙人）的，老在那儿犹豫也可以理解。”

消费互联网时代的经验不够用了

“今年的AI新浪潮很像2019年的半导体热潮，但比2019年要更大，其实按照AI目前的逻辑，很贴切过往TMT逻辑的。”一位硬科技投资合伙人持类似观点。

“真正往里面放的大方钱很少。”

投行一直是投资圈对信息和风向最敏感的群体，据悉，光源资本看过的大模型相关概念初创项目超过百家，但在其创始人郑烜乐看来，大模型创业是“很偏venture（风险）的领域”，VC目前还是在做尝试性投资。

因为大模型的创业项目对人才密度、资金密度要求极高，跑模型的时候就需要花费千万美金级别的算力投入，而且经历数月。团队要求则是长期在机器学习上有很强的工程创新和实践经验，这类人稀少且昂贵。按照技术难度壁垒，真正有能力做底层技术创业的公司并不多。

“如果高性能算力芯片的供需关系无法改善，可能仍只能供少数公司充分训练，加上大厂布局，独立大模型创业公司资金需求量大、风险始终处在高位。”Capital O创始合伙人刘大卫认为。

实际上，在ChatGPT走红之后，很多从业者也在反思中国为什么没有诞生和OpenAI类似的公司，投资人不懂技术和太擅长投资而更擅长“投机”，被认为是其中一个重要原因。

搜狗创始人王小川在朋友圈表示，OpenAI的胜利，是技术理想主义的胜利。创业者回归技术信仰，投资人方面则有了呼吁技术为先的苗头。同日，刘大卫的朋友圈也在感慨“光是ChatGPT带来的关注度和对前沿技术的信心就很有意义”。

品玩创始人骆轶航在《谁拖了中国ChatGPT的后腿》一文中写到，沈向洋、李笛、马维英、王小川和李志飞，他们出来做大模型的创业项目都挺靠谱，但问题是得换一批背后支持他们的投资机构和投资人，有一些太擅长“做局”和投机，在加密货币等赛道上浸淫太深的投资机构混杂在其中，是应该被拉进黑名单的。

这只是一个表象，其背后更深层次的原因是，国内的VC们并没有形成一套完整的投资方法论，他们在投资决策中过分依赖于过往的成功经验。这些成功经验大多来自消费互联网领域，投资决策过程判断所处赛道的市场规模、项目在赛道所处的竞争位次以及能否通过烧钱获取足够市场份额再提价赚钱——本身就是一个投机的过程。

在郑烜乐看来，互联网时代，投资人可以从用户角度去理解产品。但大模型时代不一样，投资人需要理解大模型里面的技术环节、数据获取和清洗过程等细节，理解怎样形成有效数据集，如何评估一个团队训练和迭代模型的能力，乃至于如何对一个模型进行评价，这确实需要一定的技术背景。

Capital O创始合伙人刘大卫告诉记者，国内目前头部大模型项目创始人大都属于共识性强人，导致投资成本不低，所以会出现一些VC扎堆投资，这也是正常现象，“真正履行技术信仰投资的投资人毕竟是少数，进行前瞻性布局的科技投资注定是孤独的，所以VC跟风投资存在，是常见且可以理解的。”

目前，市场上活跃的大部分VC机构都是在移动互联网时期发展壮大，大部分投资人以商科背景为主，在硬科技时代，确实已存在较多长期聚集科技赛道的投资人具备很强的计算机背景，但从整体数量看，目前拥有技术背景的投资人占比仍然较小。

“主要落差是因为这波起势太快，大多数人的知识储备不够，还都在同步建立和迭代。”郑烜乐表示，各行业的投资本质规律其实都是一样的，投资人们最早看半导体等硬科技领域时也有很高的进入门槛，大模型的难度其实没有更高。

综合来看，AI2.0时代，投资人所具备的能力组合一定是非标的，能用高效的方法快速梳理行业图谱是必备技能，工科背景会是一个加分项。

ChatGPT爆火之后，很多投资机构已经在高薪招聘具有工科背景的投资人。据界面新闻了解，猎头公司开始密集收到机构招聘AI方向投资人的需求，这些职位动辄可以给到接近百万年薪的待遇。而在任职要求上，除了STEM专业（STEM是指科学、技术、工程、数学相关领域）出身，很多招聘需求还把代码能力提上台面。

关于怎样的投资人才能看懂大模型，润土投资合伙人刘苡松告诉记者，此前一级市场经历过以cnn（卷积神经网络）为主的AI项目浪潮，所以看过那波的投资人是能看懂大模型技术逻辑的。他进一步解释称，这次大模型用到的transformer（一款用于自然语言处理的深度学习模型），跟cnn（卷积神经网络）、rnn（循环神经网络）、mlp（多层感知机）都属于神经网络模型的各种类型，投资人群体有人能看懂技术细节，但关乎大模型，更大部分需要看懂的只是技术演进思路和商业化场景，“投资人能看懂这些就够了”。

他认为，投资人要分类来看大模型的初创项目。做底层技术的，跟以往项目确实不太一样，但国内大部分关于大模型的创业项目集中于应用层和连接层。这块创业团队需要的更多是产业经验，能够在现有产业上建立自己独特的垂直模型，再结合大模型的能力把现有产业做升级，或是基于大模型的特点开发新的应用场景，所以更具体化的“投人投技术投场景创新”逻辑用在应用层并无问题。

优秀投资人比以往更被需要

学院派创业者对在社会面上怎么赚钱有时可能缺乏了解，这个时间节点上，能给到建议的投资人与急于获得支持的创业者降低沟通成本显得重要起来。

今年4月，卢志武和高一钊团队的多模态大模型项目“智子引擎”终于拿到了千万元天使轮融资。卢志武真的没要VC的钱，他选择了与软通动力建立深度合作。

和见VC大佬们不同，卢志武见到软通动力董事长刘天文的第一感觉就是，终于有人懂他们了。卢志武发现，刘天文在见他之前还偷偷试用了他们的产品，甚至已经在谋划其公司业务场景和“智子引擎”大模型产品的结合。

软通的业务场景也是卢志武最看重的。这半年寻求融资的经历让他意识到，单纯做大模型也是有问题。在去年寻求融资屡次碰壁之后，卢志武团队已经开发了面向C（消费者）端的应用级多模态ChatGPT产品“元乘象ChatImg”以及面向B（企业）端的视频搜索解决方案等产品。

作为学院派创业者，卢志武过去的关注点主要集中在技术——虽然GPT-2已经开源，但却没有人告诉你上亿规模的数据如何处理，规模量巨大的机器如何高效利用，一切都要从零开始摸索。

但在商业世界中，如何赚钱才是根本。虽然不喜欢总是因为这个问题被投资人纠缠，但卢志武也不得不面对——这也是很多学院派创业者缺乏了解或者比较少去关注的事。

和移动互联网项目不同，AI公司很多是科学家主导，没有非常好的商业模式呈现。电商AI SaaS领域的独角兽乐言科技创始人兼CEO沈李斌博士认为，学院派创业者有时确实对怎么赚钱缺乏了解。“不需要市场都认可，找到对的两三个投资人就够了。”他给出了学院派创业者建议。

但由于行业局势并不明晰且投资人对行业的洞察能力参差不齐，投资人对大模型和AIGC领域创业者的支持都显得有点“廉价”，愿意输出系统性观点的AI投资人也不多。但在短期内，大模型创业者确实需要尽快把投资人的担心消除，如何利用先发优势，后续跟大厂如何比拼迭代和服务，这些都需要对商业化更敏锐的投资人去带动思考。

在沈李斌博士的感受里，现在的AI投资环境已比数年前好了很多，2015年前后大部分投资人根本不懂深度学习为何物，来到2018年前后，绝大部分投资人对AI已经有了一定理解，有的还非常深刻。

记者从投资数据观察发现，相比之下，投资机构还是很愿意支持明星创业者的创业项目。

Capital O刘大卫解释了原因，“虽然市场中存在一些声音并不看好明星创业者的专业性，但项目的成功是多方面综合构成的。在大模型发展的阶段中，明星创业者能够吸引更多的资源支持和资金注入是有意义的，这可能是很多技术背景的创始人不具备的。”

与此同时，跨界人才主导大模型公司走向可能正在成为趋势，近期受到广泛关注的ChatGPT新任产品负责人Peter Deng，就没有技术背景，而是出身符号学与传媒专业，却是领导了Ins、Messenger和Oculus产品研发的传奇人物。

于是，大模型底层创业一个矛盾逐渐展露，围绕大模型技术创业处于相当早期，因技术储备缺失，加上各自对技术路线和工程路线的理解差异极大，投资人们无法作出研判，但大模型相关技术已经发展数年，纯技术向领头人似乎不能完全把持住类似春秋战国的百模大战局面。

“国内现在看是还缺少好用的底层大模型，应用层都是虚的，总不能所有应用层都用国外的底层模型吧，所以大家现阶段应该集中解决这个问题。”刘苡松点出了问题核心。在当前这种环境下，国内各行业的大模型呈几何数量爆发，但无论是大厂还是初创，做出的东西都差一口气。

郑烜乐也因此非常理解卢志武等学院派企业家的诉求，他认为，只要能做出大模型，所有的后续选择就都在，至于To B和To C只是一种实现路径，都有巨大的场景机会。

“投资人对很多事还是理解的不够深刻，但他们自己可以去想清楚的。”一位经历了TMT落幕时代的投资经理这样看。

光源资本的AI团队已经花费了半年时间研究大模型领域知识体系，甚至专门招募了做过AI大模型的工程师加入团队，“大模型和AI整个赛道长坡厚雪，到现在我们还是觉得学海无涯，每天都有新的输入和思考。”

郑烜乐觉得，这波浪潮初创一定有机会，尤其是从大厂核心AI部门走出的创业者。“大厂这次跟初创企业的竞争跟以往赛道都不同，很难讲谁能做得更大。”也因此，在今年上半年，光源资本参与孵化了前字节跳动视觉AI负责人王长虎的创业项目爱诗科技。

多位从业者比较一致的判断是，未来六个月至少能跑出一款相对不错的大模型产品，但不好说是语言层面还是多模态层面，不指望能赶上ChatGPT, 但某些能力能够PK了。

（界面新闻记者姜菁玲对此文亦有贡献）

来源：多面体InterfaceX

作者：李京亚肖芳

免责声明：本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况，及遵守所在国家和地区的相关法律法规。同时本网站部分推送的文章内容未及时与原作者联系，在已知出处的情况下均已注明来源，版权归原作者所有，内容为原作者个人观点，并不代表本网站赞同其观点和对其真实性负责，若涉及版权问题，敬请原作者联系我们删除，感谢每一位作者的辛苦创作与付出！