对话张亚勤:AI不是泡沫,但AI公司有泡沫
在清华无锡研究院智能产业创新中心,张亚勤院士在盛夏时节的访谈中,就当前人工智能(AI)领域,特别是具身智能和AI投资创业的热潮,表达了需要“降降温,更冷静些,不要急躁”的看法。
张亚勤五年前创立了清华大学智能产业研究院(AIR),该机构已有多位AI产业经验丰富的教授。目前,AIR的首届博士生已毕业,并且孵化出了十家公司,这些公司累计获得了约150亿元人民币的融资,总估值达到1500亿元人民币。其中,华深智药和它石智航等公司已成为资本市场的焦点。
尽管1500亿元的估值令人瞩目,张亚勤强调AIR的首要任务是科研,公司孵化是自然衍生的结果,且多数公司尚处于“证明能力”的阶段。作为国内知名的学者,张亚勤见证了技术革命与资本周期的起伏。他认为,当前AI产业正处于类似于1998-1999年互联网发展的阶段,大规模的基建投入(包括电力、算力及算法)正在进行。他看好AI的长期潜力,认为“AI没有泡沫,但早期AI公司会有泡沫”,并预测未来的万亿市值巨头可能并非当前最受瞩目的公司。
2026年,“物理AI”成为技术研发和资本关注的热点。过去五年,张亚勤及其团队已在自动驾驶、具身智能仿真以及工业能效AI等领域布局了多家公司。他提醒,过度追求“趁市场热多融资”,可能导致业务分散,最终资金耗尽而业绩未达预期。
张亚勤每年都会对AI发展趋势发表看法。例如,他在2024年6月提出,需要开发新的AI算法体系,包括世界模型和Agent,以实现效率的百倍提升。他进一步阐述了当前AI发展阶段与1998年互联网的相似性,分析了面向物理世界的AI数据缺失问题,探讨了VLA(Vision-Language-Action)和世界模型的技术路线结合,并分享了对教授创业的看法。
自2024年起,AIR每年6月在无锡举办“太湖对话”论坛,今年已是第三届。在论坛前夕,张亚勤接受了暗涌Waves的专访。
教授创业的挑战与模式
张亚勤认为,当前AI创业高度依赖技术驱动,因此教授在其中扮演着重要角色。中国已有一批高水平教授能够引领世界级的创新。他将教授创业分为三种模式:一是教授全职投身创业;二是教授以学术研究为主,将技术转化为企业,但不直接管理;三是教授在职同时管理多家公司。他认为第三种模式极难成功。
对于前两种模式,张亚勤表示第一种模式有成功案例,例如高通的创始人是MIT教授,AIR的彭建教授全职创办的华深智药在AI制药领域表现出色。然而,他指出,大多数教授并不适合直接管理公司,即使全职创业,其失败率也可能高于普通创业者。这是因为将研究转化为技术、再将技术产品化并规模化,中间存在巨大鸿沟,鲜有人能同时精通前沿研究和市场商业化。
AIR教授的创业模式多属于第二种:科学家以联合创始人或首席科学家的身份,凭借其技术入股孵化企业,并寻找具备商业和工程能力的CEO进行市场化运作。这种模式能最大化发挥教授的优势,同时兼顾企业发展需求。
张亚勤强调,全职创业风险极高,可能导致科研和商业两头落空。AIR的定位是科研机构而非孵化器,每年仅孵化一两个项目。
关于培养CTO和顶级架构师,张亚勤认为核心在于学生在成长阶段就要具备产品和系统思维。他指出,仅在校园内进行算法研究和论文撰写不足以应对真实世界的挑战,关键在于验证技术在实际系统中的可行性。AIR通过与20多家大型企业合作,建立联合实验室,让学生参与前沿研发和规模化验证。
在寻找CEO方面,张亚勤表示,虽然理想状态是为每个团队匹配合适的CEO,但实际操作中非常困难。他认为CEO不一定是职业经理人,可以是连续创业者或团队中的年轻人。AI人才相对容易找到,但具备深厚产业经验并理解AI技术的复合型人才更为稀缺。他强调CEO必须具备强烈的信念感,才能应对创业过程中的重重困难。他再次重申,1500亿这样的估值数字意义不大,企业最终还是要依靠技术实现商业化,产生收入和利润,形成核心竞争力。
AI产业与公司泡沫的辨析
面对创业公司获得高估值,张亚勤认为需要格外冷静,因为市场期望越高,需要证明的就越多。他会在学院中“泼冷水”,询问创业者需要解决的核心问题、AI的实际作用以及谁来为产品付费。他认为短期内获得高估值并非成功的标志。
他以当前机器人赛道为例,指出数百家公司中,未来可能只剩下约20家;大模型赛道,国内最终可能也只剩下三四家。他回顾了互联网泡沫时期,当时的市场比现在更为狂热,但许多明星公司迅速消失。
张亚勤认为,创业需要充足的资金,但资金并非唯一决定因素。他强调创业九死一生,必须聚焦。如果尚未想清楚就盲目融资并“什么都干”,最终很可能资金耗尽而未能产生业务成果。他相信,拥有优秀产品、独特技术、强大团队和清晰前景的企业,自然会吸引投资。
与上一轮互联网创业相比,当前AI和具身智能领域的氛围既相似又不同。张亚勤指出,不同之处在于,许多AI头部公司具有快速增长的收入,例如OpenAI和Anthropic,这增强了市场的信心。但他不确定这种高增长能否持续。
他提到,全球科技巨头在数据中心和芯片等领域的巨额投入,是基于对未来的高预期,但这些投入能否转化为订单和收入仍需验证。他认为,未来2-3年是关键的观察期,如果巨头的收入增长未能达到预期曲线,整个循环将受到影响,大公司会受波及,小企业则更为敏感。
张亚勤将当前AI发展阶段比作1998、1999年的互联网初期,当时雅虎等公司受到追捧。他重申,长期来看AI产业本身不存在泡沫,但AI公司及其估值可能存在泡沫。短期的资本炒作意义不大,企业应专注于业务,脚踏实地,用结果证明自身价值。
让机器人承担“脏活、累活”
张亚勤预测,通用家庭和服务机器人可能还需要10-15年才能成熟。然而,在特定场景下执行具体任务的机器人,如自动驾驶(本质是“开车机器人”)和工业机器人,其发展速度会更快,技术难点已基本突破,主要面临工程化和商业化问题。家庭机器人面临开放复杂的环境,且需要与人进行自然交互,完成动作,这些科学和技术问题尚未完全解决。
他解释物理世界AI发展相对缓慢的原因:第一,数据量不足;第二,物理场景分散;第三,数字世界的“比特”需要与物理世界的“原子”结合,而原子世界不遵循摩尔定律,机械结构的控制也非简单堆砌算力可解决。
针对数据缺失问题,他提出几种方式:一是学习人类,从第一人称视角收集交互数据;二是机器人自主采集数据;三是在仿真环境中生成模拟数据。然而,仿真结果不一定能完全迁移到真实世界。因此,他提到了“RSR”(Real-to-Sim-to-Real)闭环,即从真实世界到仿真,再回到真实世界,这是一个极具挑战性的方向。
在解决物理世界数据缺失的挑战方面,他提到VLA(Vision-Language-Action)模型和世界模型是当前热门的技术路线。VLA模型将大语言模型的方法论拓展至视觉和动作,能够利用现有大模型的研究成果。但动作的精确描述仍是难点。而从视觉直接产生动作,以语言为辅助,是另一种思路。世界模型则旨在让机器真正理解世界,其研究方式多样,包括构建模拟器。张亚勤认为,最终的解决方案可能是这两种路线的结合。
他进一步解释了两种路线结合的必要性:机器人需要处理极其复杂多变的环境。例如,自动驾驶主要依赖视觉,端到端系统不一定需要大量语言交互。但机器人常常需要理解人类指令,并根据视觉信息转化为动作。目前尚无清晰的“scaling law”适用于此。他提到,语言模型中的“token”是人类抽象的、有意义的单位,而像素和动作信号则缺乏这种内在含义。AIR的研究,如X-VLA系统,尝试对不同机械臂和机器人的能力进行“归一化”,实现技能泛化和跨设备迁移。同时,也有团队通过观看大量视频来理解动作和环境。他建议,在通用性研究取得突破的同时,也要在特定场景解决实际问题。
他认为,机器人应首先应用于真实生产力场景,承担人类不愿从事的危险或艰苦工作,例如在煤矿、地下管网和电网等环境中。他强调AI和具身智能应以“帮助人”为目标,而非取代人的工作。
对于当前AI领域追求“超级智能”和“通用AI”的趋势,张亚勤认为,虽然可以作为科研目标,但从社会和企业角度看,解决具体问题更为重要。他警告,一些美国企业过度追求智能上限,可能导致风险不可控。他质疑AI是否必须“学人”或“超越人”,并指出AI在放大能力的同时,也可能放大人性中的负面因素,带来安全和伦理风险。
张亚勤特别关注AI的三类风险:失控、滥用和系统性风险(包括失业等社会问题),其中他更关注失控和滥用。他指出,AI系统日益复杂,机理不清,具备行动能力的Agent正走向部署,存在自主复制和逃逸的风险。他以Anthropic的Claude Mythos为例,说明了模型识别软件漏洞并可能造成大规模网络攻击的潜在威胁。因此,他强调在设计AI产品和技术时,必须明确其要解决的问题,以增强AI的可控性,最终目标是让AI帮助人类生活得更长久、舒适和幸福。
加入討論,分享你的看法