目前,大模型已具备出色的推理能力,但仅凭这种能力不足以应对复杂任务。就像人仅有大脑而缺乏其他能力是不够的,我们需要借助AI Agent(智能体)进一步发展,AI智能体能够将基础大模型通过行业数据训练,形成具有行业特性的定制化大模型,并将智能下沉到终端,实现多模态的智能交互和具身智能。
AI Agent应具备丰富的记忆能力,包括短期记忆和长期记忆。短期记忆类似人们在短时间内记住一长串数字,但很快会遗忘;长期记忆则类似骑自行车或游泳这类技能,即使长时间不练习,依然能够保持。此外,AI智能体还应具备规划能力,在大模型的辅助下,能够对后续动作进行自主安排。
为了在物理空间应用,AI Agent还需要具备使用工具的能力。装备了这些工具后,AI智能体便可以采取行动。有了AI Agent,物理世界的运作可以转变为以AI为主导、人为监督的模式,这与目前大多数AI应用——以人为主、AI为辅助的“副驾驶”模式形成对比。未来,AI Agent不仅具备规划和行动的能力,还能够直接理解自然语言,无需编程,这将极大地方便人们通过自然语言遥控执行物理世界中的各种任务。
具身智能代表了AI Agent的进步,它使得机器人、智能系统、智能网联车等能够通过感知器和执行器与现实世界进行实时互动,成为互联网向物理世界扩展的关键接口。谷歌的机器人展示了在受到人为干扰后,能够恢复并继续执行任务的能力,如从抽屉中取出物品并根据人的指令将其送到指定地点;西北工业大学和中国电信(6.700, 0.34, 5.35%)合作开发的导盲机器狗,能够在遇到障碍时自动避让,只有在确认无障碍后才会继续前行;在美国,华人团队在两所高校研发出了Open-TeleVision的通用框架,展示了人与机器人之间默契的配合。
具身智能在工业、消费、民生服务和城市管理等多个领域展现出广泛的应用潜力。它具备三个核心特点:一是支持多模态交互,能够整合多种感官信息;二是能够与环境进行互动,并从这种互动中学习,从而泛化到更多场景;三是从感知过渡到认知,并能够自主决策。
具身智能在人形机器人领域的进步尤为显著。波士顿动力的人形机器人技术已经从依赖液压驱动转变为电动驱动,并且在训练方法上实现了创新:不再单纯依靠机器人的实际动作进行训练,而是利用有限的实机数据,结合迁移学习与合成数据来优化机器人的行为,这种方法显著降低了研发成本。特斯拉开发的第二代人形机器人Optimus一经发布,引起了广泛关注。
总的来讲,人形机器人的发展超出了预料。高盛预计2035年人形机器人出货量将达到140万台,市场规模达380亿美元。值得注意的是,这一预测相比前年的60亿美元有大幅度提升,主要原因是高盛观察到人形机器人的关键零部件成本在短短一年内下降了40%。
马斯克预言人形机器人的数量最终可能超过全球人口总数,并且人形机器人的成本将降至一万美元左右。马斯克相信,未来特斯拉在人形机器人领域的市场潜力将远超其电动汽车业务。
国内企业也在积极探索人形机器人的应用。例如,一汽—大众与人工智能公司合作,将人形机器人引入其青岛的汽车制造工厂,目前主要承担螺栓拧紧、零件安装和转运等基础工作。他们的终极目标是打造一个高度自动化的无人工厂。
人工智能在推动数字与实体融合方面发挥着越来越重要的作用。例如,在智能客服领域,人工智能打破了传统客服的地域和时间限制,实现了全天候的即时服务,大大节省了工作人员查找信息的时间。丰田公司在研发设计中应用人工智能,而美的厨电在顺德的工厂则利用人工智能优化了整个产业链,显著提升了效率。此外,许多企业包括蚂蚁数科、长沙银行(8.520, 0.08, 0.95%)和吉利汽车,都在智能风控方面应用了人工智能技术。
互联网在中国经历了55年的发展和30年的全功能接入,为中国的社会经济发展和民生服务做出了显著贡献。面对新的时期,互联网需要进行数字化转型,实现高质量发展,并在这一过程中抓住时代的机遇,实现使命担当。
5G-A与IPv6技术的兴起,特别是AI大模型的突破,为互联网业态带来了革新,并催生了新的业态。现有的互联网业务正通过人工智能进行重塑,互联网大厂已在这一领域取得了成效。
工业互联网是互联网的下半场,现在人工智能正推动数字世界与物理世界结合,提升互联网服务垂直行业的能力。这不仅促进了产业的数字化,也推动了数字产业化和互联网产业的发展。
AI为平台经济增添新动能,互联网平台也是AI赋能消费与行业应用的重要模式,在新引擎的加持下,互联网再出发正当时。