对话张亚勤：AI不是泡沫，但AI公司有泡沫

在清华无锡研究院智能产业创新中心，张亚勤院士在盛夏时节的访谈中，就当前人工智能（AI）领域，特别是具身智能和AI投资创业的热潮，表达了需要“降降温，更冷静些，不要急躁”的看法。

张亚勤五年前创立了清华大学智能产业研究院（AIR），该机构已有多位AI产业经验丰富的教授。目前，AIR的首届博士生已毕业，并且孵化出了十家公司，这些公司累计获得了约150亿元人民币的融资，总估值达到1500亿元人民币。其中，华深智药和它石智航等公司已成为资本市场的焦点。

尽管1500亿元的估值令人瞩目，张亚勤强调AIR的首要任务是科研，公司孵化是自然衍生的结果，且多数公司尚处于“证明能力”的阶段。作为国内知名的学者，张亚勤见证了技术革命与资本周期的起伏。他认为，当前AI产业正处于类似于1998-1999年互联网发展的阶段，大规模的基建投入（包括电力、算力及算法）正在进行。他看好AI的长期潜力，认为“AI没有泡沫，但早期AI公司会有泡沫”，并预测未来的万亿市值巨头可能并非当前最受瞩目的公司。

2026年，“物理AI”成为技术研发和资本关注的热点。过去五年，张亚勤及其团队已在自动驾驶、具身智能仿真以及工业能效AI等领域布局了多家公司。他提醒，过度追求“趁市场热多融资”，可能导致业务分散，最终资金耗尽而业绩未达预期。

张亚勤每年都会对AI发展趋势发表看法。例如，他在2024年6月提出，需要开发新的AI算法体系，包括世界模型和Agent，以实现效率的百倍提升。他进一步阐述了当前AI发展阶段与1998年互联网的相似性，分析了面向物理世界的AI数据缺失问题，探讨了VLA（Vision-Language-Action）和世界模型的技术路线结合，并分享了对教授创业的看法。

自2024年起，AIR每年6月在无锡举办“太湖对话”论坛，今年已是第三届。在论坛前夕，张亚勤接受了暗涌Waves的专访。

教授创业的挑战与模式

张亚勤认为，当前AI创业高度依赖技术驱动，因此教授在其中扮演着重要角色。中国已有一批高水平教授能够引领世界级的创新。他将教授创业分为三种模式：一是教授全职投身创业；二是教授以学术研究为主，将技术转化为企业，但不直接管理；三是教授在职同时管理多家公司。他认为第三种模式极难成功。

对于前两种模式，张亚勤表示第一种模式有成功案例，例如高通的创始人是MIT教授，AIR的彭建教授全职创办的华深智药在AI制药领域表现出色。然而，他指出，大多数教授并不适合直接管理公司，即使全职创业，其失败率也可能高于普通创业者。这是因为将研究转化为技术、再将技术产品化并规模化，中间存在巨大鸿沟，鲜有人能同时精通前沿研究和市场商业化。

AIR教授的创业模式多属于第二种：科学家以联合创始人或首席科学家的身份，凭借其技术入股孵化企业，并寻找具备商业和工程能力的CEO进行市场化运作。这种模式能最大化发挥教授的优势，同时兼顾企业发展需求。

张亚勤强调，全职创业风险极高，可能导致科研和商业两头落空。AIR的定位是科研机构而非孵化器，每年仅孵化一两个项目。

关于培养CTO和顶级架构师，张亚勤认为核心在于学生在成长阶段就要具备产品和系统思维。他指出，仅在校园内进行算法研究和论文撰写不足以应对真实世界的挑战，关键在于验证技术在实际系统中的可行性。AIR通过与20多家大型企业合作，建立联合实验室，让学生参与前沿研发和规模化验证。

在寻找CEO方面，张亚勤表示，虽然理想状态是为每个团队匹配合适的CEO，但实际操作中非常困难。他认为CEO不一定是职业经理人，可以是连续创业者或团队中的年轻人。AI人才相对容易找到，但具备深厚产业经验并理解AI技术的复合型人才更为稀缺。他强调CEO必须具备强烈的信念感，才能应对创业过程中的重重困难。他再次重申，1500亿这样的估值数字意义不大，企业最终还是要依靠技术实现商业化，产生收入和利润，形成核心竞争力。

AI产业与公司泡沫的辨析

面对创业公司获得高估值，张亚勤认为需要格外冷静，因为市场期望越高，需要证明的就越多。他会在学院中“泼冷水”，询问创业者需要解决的核心问题、AI的实际作用以及谁来为产品付费。他认为短期内获得高估值并非成功的标志。

他以当前机器人赛道为例，指出数百家公司中，未来可能只剩下约20家；大模型赛道，国内最终可能也只剩下三四家。他回顾了互联网泡沫时期，当时的市场比现在更为狂热，但许多明星公司迅速消失。

张亚勤认为，创业需要充足的资金，但资金并非唯一决定因素。他强调创业九死一生，必须聚焦。如果尚未想清楚就盲目融资并“什么都干”，最终很可能资金耗尽而未能产生业务成果。他相信，拥有优秀产品、独特技术、强大团队和清晰前景的企业，自然会吸引投资。

与上一轮互联网创业相比，当前AI和具身智能领域的氛围既相似又不同。张亚勤指出，不同之处在于，许多AI头部公司具有快速增长的收入，例如OpenAI和Anthropic，这增强了市场的信心。但他不确定这种高增长能否持续。

他提到，全球科技巨头在数据中心和芯片等领域的巨额投入，是基于对未来的高预期，但这些投入能否转化为订单和收入仍需验证。他认为，未来2-3年是关键的观察期，如果巨头的收入增长未能达到预期曲线，整个循环将受到影响，大公司会受波及，小企业则更为敏感。

张亚勤将当前AI发展阶段比作1998、1999年的互联网初期，当时雅虎等公司受到追捧。他重申，长期来看AI产业本身不存在泡沫，但AI公司及其估值可能存在泡沫。短期的资本炒作意义不大，企业应专注于业务，脚踏实地，用结果证明自身价值。

让机器人承担“脏活、累活”

张亚勤预测，通用家庭和服务机器人可能还需要10-15年才能成熟。然而，在特定场景下执行具体任务的机器人，如自动驾驶（本质是“开车机器人”）和工业机器人，其发展速度会更快，技术难点已基本突破，主要面临工程化和商业化问题。家庭机器人面临开放复杂的环境，且需要与人进行自然交互，完成动作，这些科学和技术问题尚未完全解决。

他解释物理世界AI发展相对缓慢的原因：第一，数据量不足；第二，物理场景分散；第三，数字世界的“比特”需要与物理世界的“原子”结合，而原子世界不遵循摩尔定律，机械结构的控制也非简单堆砌算力可解决。

针对数据缺失问题，他提出几种方式：一是学习人类，从第一人称视角收集交互数据；二是机器人自主采集数据；三是在仿真环境中生成模拟数据。然而，仿真结果不一定能完全迁移到真实世界。因此，他提到了“RSR”（Real-to-Sim-to-Real）闭环，即从真实世界到仿真，再回到真实世界，这是一个极具挑战性的方向。

在解决物理世界数据缺失的挑战方面，他提到VLA（Vision-Language-Action）模型和世界模型是当前热门的技术路线。VLA模型将大语言模型的方法论拓展至视觉和动作，能够利用现有大模型的研究成果。但动作的精确描述仍是难点。而从视觉直接产生动作，以语言为辅助，是另一种思路。世界模型则旨在让机器真正理解世界，其研究方式多样，包括构建模拟器。张亚勤认为，最终的解决方案可能是这两种路线的结合。

他进一步解释了两种路线结合的必要性：机器人需要处理极其复杂多变的环境。例如，自动驾驶主要依赖视觉，端到端系统不一定需要大量语言交互。但机器人常常需要理解人类指令，并根据视觉信息转化为动作。目前尚无清晰的“scaling law”适用于此。他提到，语言模型中的“token”是人类抽象的、有意义的单位，而像素和动作信号则缺乏这种内在含义。AIR的研究，如X-VLA系统，尝试对不同机械臂和机器人的能力进行“归一化”，实现技能泛化和跨设备迁移。同时，也有团队通过观看大量视频来理解动作和环境。他建议，在通用性研究取得突破的同时，也要在特定场景解决实际问题。

他认为，机器人应首先应用于真实生产力场景，承担人类不愿从事的危险或艰苦工作，例如在煤矿、地下管网和电网等环境中。他强调AI和具身智能应以“帮助人”为目标，而非取代人的工作。

对于当前AI领域追求“超级智能”和“通用AI”的趋势，张亚勤认为，虽然可以作为科研目标，但从社会和企业角度看，解决具体问题更为重要。他警告，一些美国企业过度追求智能上限，可能导致风险不可控。他质疑AI是否必须“学人”或“超越人”，并指出AI在放大能力的同时，也可能放大人性中的负面因素，带来安全和伦理风险。

张亚勤特别关注AI的三类风险：失控、滥用和系统性风险（包括失业等社会问题），其中他更关注失控和滥用。他指出，AI系统日益复杂，机理不清，具备行动能力的Agent正走向部署，存在自主复制和逃逸的风险。他以Anthropic的Claude Mythos为例，说明了模型识别软件漏洞并可能造成大规模网络攻击的潜在威胁。因此，他强调在设计AI产品和技术时，必须明确其要解决的问题，以增强AI的可控性，最终目标是让AI帮助人类生活得更长久、舒适和幸福。

对话张亚勤：AI不是泡沫，但AI公司有泡沫

熱門話題：

分享到：

加入討論，分享你的看法