家具拆除

面壁智能李大海:第四次创业如何跟大厂PK

“8月初,我们还在对面那栋办公楼里,当时团队只有40多人,现在我们已经搬到这来了,因为那边座位坐不下了。”

10月底接受《中国企业家》采访时,坐在海淀区科建大厦办公室里的李大海这么评价面壁智能的发展状态,“创业公司经常因为座位不够搬家,所以我觉得现在公司发展得还不错。”

李大海于今年6月担任面壁智能联合创始人、CEO,主要负责面壁智能战略发展和日常运营管理。这是他的第四次创业,也是他第一次担任创业团队的一号位。

2006年大学毕业后,李大海便加入Google成为Google中国创始员工之一;四年多后,他和时任Google北京工程副院长的刘俊一起创业,做出了国内第一个社会化搜索引擎“云云网”。之后,他又加入豌豆荚,负责搜索业务。2015年,李大海加入知乎,担任联合创始人、执行董事和CTO。

持续兴奋、偶尔焦虑——加入面壁智能以来,这种痛并快乐的情绪一直伴随着李大海。面壁智能是国内最早从事大语言模型的团队之一,核心科研成员来自于今年大模型创业浪潮中的“半壁江山”——清华大学NLP实验室,联合创始人刘知远是清华大学计算机系长聘副教授、智源青年科学家。

今年年初,在ChatGPT席卷科技圈后,时任知乎CTO的李大海觉得不能错过这次技术变革带来的机会,深入调研后,知乎决定与面壁智能合作。4月,知乎宣布对面壁智能进行天使轮投资,并陆续发布了共研的知乎大模型“知海图 AI”、基于大模型的对话产品“面壁Luca”等。

随着“百模大战”逐渐进入尾声,关于大模型的商业化模式也成为创业者和投资人关注的重点。

对于AI创业公司而言,单纯的大模型没有商业模式,或者说商业链路很短;而纯应用没有竞争壁垒。因此,国内外的生成式AI领域投资人和创业者都变得更为“冷静”。据清科数据统计,今年Q3,该领域国内外融资交易数和金额都大幅下降。

这种情况下,公司只有将模型和应用结合起来形成数据飞轮,才更加靠谱。今年下半年,面壁智能在迅速推动大模型的落地和商业化,同时,公司也在推进新一轮的融资。

李大海预计,明年会是大模型或AIGC(生成式人工智能)应用广泛落地的一年,因此,公司希望在保持模型技术能力领先优势的同时,也能产出很好的应用,获得显著的用户规模增长。

当以ChatGPT为代表的大语言模型面世后,作为创业者,第一反应都是兴奋。

因此我们可以看到,AIGC创业的第一阶段,大家都在探讨怎么能训练出更好的模型,并且上半年各家公司都在发布自己的大模型。

面壁智能早在2020年就开始做模型的训练。国内最早的GPT结构的中文大模型——CPM-1,就是面壁智能核心团队研发的。

国内的“百模大战”也导致大众对于AIGC的理解,大部分也还停留在ChatGPT这个面向C端的出圈产品或者大模型“混战”阶段。但实际上,这一轮AI浪潮早已经进入了头部(公司)模型基本可用的状态,现在业内是从技术驱动转向应用驱动的“下半场”,也就是如何把大模型的应用做出来。

大模型想要落地到具体场景,AI Agent(自主理解、规划决策、执行复杂任务的智能体)是重要路径,它代表的是比“裸”模型更拟人的使用体验。

我们判断未来会是Agent的世界,万物都是Agent。比如电饭锅可以是Agent,放入食材后,我们跟它说要熬粥,它就会根据熬粥的逻辑,去设定相应的加热方式。冰箱也会是Agent,如果它的冷却剂漏了,它会跟我们对话,说自己需要维修了,或者它已经打完了维修电话,通知维修师傅上门时间;或者提醒我们上周蔬菜买多了,要赶紧吃掉,否则菜就坏了。

基于此,我们对于未来世界也有一个概念——IoA,即Internet of Agents。

面壁智能的定位也由此确定,我们是一家基于大模型Agent技术的公司,技术研发方向从模型基座到Agent技术,再到最终的应用。

因此,在大语言模型研发的基础上,我们进行了Agent框架的研发,我们内部称之为AI Agent 的“三驾马车”。

第一驾马车是大模型驱动的智能体通用平台AgentVerse,其中有各种各样的AI专家,可以组合成“工作组”,共同帮助用户解决复杂任务。

第二驾是基于AgentVerse的多智能体协作开发框架ChatDev,它可以应用到更具体的场景,如软件研发等。其中有一些已经预定好的固定角色,如判断用户需求的CEO、技术研发的CTO、写程序的programmer、产品设计designer,以及tester等,每个角色都有固定的工作职责。

第三则是超强AI智能体应用框架XAgent,它的定位是一个“ AI特工”,可自己拆解处理复杂任务,简单来说就是超强的单体智能。

在我看来,随着整个社会数字化、信息化和智能化的开展,各行各业都需要在IT方向进行投入,这意味着社会对于工程师的需求会越来越大。

大模型以及Agent技术一旦可以实际应用,就可以提升程序员或者工程师的能力边界,进而极大提升他们的工作效率。

未来可能就是工程师去做构思,理解市场需求,然后将需求拆解交付给AI,让AI去完成一些低水平的重复劳动,解放人的生产力。这有助于未来千行百业都能把AI相关软件应用起来,进而更好地推行全面数字化和信息化。

基于这种设想,我们现在更关注模型跟应用结合产生的综合效果,给用户提供更好的体验。通俗理解,我们现在更像一家“造车厂”,我们自己做引擎,同时要把引擎放到自己的车里,让它能够跟所有的部件组合在一起,让车跑得更快,用户开车时更稳更安全。

目前,面壁智能在技术上走得很快,我们是国内最早一批在技术上实现这一能力的公司。通过我们的ChatDev,一位普通用户只需要一杯可乐的时间,用不到一美元的成本,就能做出来一个小软件。

如果将AI智能时代类比移动互联网时代,大模型就相当于安卓系统,我们目前处于安卓系统的更上层的一个比较体系化的技术突破状态。

作为一次非常重要的技术革命,大模型的影响会扩大到千行百业,也就是社会的方方面面。

那就意味着,to C和to B两个领域势必都会受到影响,并在此基础上进行换代升级。进入AI竞争的下半场,各家公司在商业化落地时,都面临to B、to C两个路径选择。

年初时,大家表示大模型可以把所有事情重做一遍,也就是将现存的各种系统和产品进行改造。这意味着大模型对于各种各样的企业都有价值,因此创业公司的商业化方式,应该是给其他企业提供大模型,让它们能从中受益,推动业务快速发展。我认为这是to B业务的基础逻辑。

在to C领域则有一个基础概念:任何一次技术的革新,如移动互联网、图形界面等,它都会带来新的人机交互模式,而基于这个模式会有全新应用,即原生应用。

移动互联网时代产生了移动互联网时代的原生应用,同。