呓语:从人的局限理解智能的疆界

00IntelligenceHCI

翻出过去一些自问自答的呓语……


人机交互的形式发生了什么变化?

过去几十年的人机交互,形式上是人使用计算机来做各种各样的事情,这些工具从一开始以硬件为主,到现在以运行在不同硬件/云上的软件为主,核心变成了人-数字工具的交互。

人机交互的目的发生了什么变化?

人机交互的最终目的并不是使用工具,人使用工具是为了满足需求。

过去人与机交互的目的,很大程度上是在塑造数字世界。人使用计算机,产生了海量的数据、文本、多媒体,以及对现实世界的表示和标注。

但人的需求,不只是在数字世界,而是遍及三大世界——物理世界、数字世界、精神世界。当生成式 AI 带动数字世界发生一轮大的跃迁时,“机器“这种形态已经不能很好概括形式的目的。交互也将相应进化到新的阶段——人与智能交互,目的是使用智能来满足人在三大世界的需求,尤其是那些在过去还满足不好的需求。

人的需求由哪些底层动力驱动?

人为什么有那么多的需求?柴米油盐,七情六欲,风花雪月。

因为生而为人,欲望和局限都太多了。我们只能存活几十年,空手只能够到 2 米多高,步行 1 小时不过几公里,只能看到约 400~760nm 波长的光,听见 20Hz ~ 20000Hz 的声音,临时记住约 4 个单位的信息……

在这些局限之中,最重要的有三个:时间,空间,注意力/认知加工能力。人的各种需求,总是指向突破这种种限制的努力。

  • 时间:为了突破时间限制,我们追求永恒、延续、不死——数字世界,生命永存
  • 空间:为了突破空间限制,我们开疆拓土,繁殖,扩散——物理世界,无远弗届
  • 认知:为了突破认知限制,我们希望拥有更长的 Context、更大的 FLOPs——精神世界,万物合一

不论技术如何演进,人一定会尽可能利用工具,尤其是智能程度高的工具来突破三大限制,从而接近人类叙事中的神——灵魂不死,无处不在,包容万物。

数字世界

表面上看,AI 是人的工具,但人和 AI 在很长时间内是相互依存的关系,因为 AI 需要人产生的数据。

AI
需求功能数据
供给数据功能

如果对这种相互依存的关系,寻找一种更符合人的偏好的表达,应该是什么呢?

智能很大程度上是人在数字世界中孵化的。不论从主客体关系,还是可控性需求,又或是人对工具的态度,人在与智能交互时,比较理想的载体是助手。

助手:人和 AI 在数字世界的中介

助手不是 AI 本身,助手的“本职”工作不是生产,那是模型的工作。助手的核心是“中介”,促进供需匹配

  • Stage1 生成:LLM、LMM 让数字世界的内容供给趋于无限
  • Stage2 转换:数字世界的内容形态可以任意转换
  • Stage3 匹配:数字服务的流通,供需匹配效率,从信息分发到需求分发
    • 信息时代—信息找人:信息先被生产出来,然后订阅、推送
    • 智能时代—需求分发:需求先被捕捉,供给是即时分发和生成的。prompt 是一种需求模板

人类擅长用各种工具解决问题,但是解决问题不等于达成目标,更不等于满足欲望。这一轮的 AI 发展,似乎是一次掀翻潘多拉魔盒盖子的过程。当我们意识到 AI 可以直接交付结果,就不再有耐心探索怎样使用工具达成目标的路径,而是每天都在畅想(或是幻想)”如果……就好了“的场景,欲望演化的速度前所未见。

智能时代的人机交互,基于真实情境(物理/数字/精神)的需求(欲望)识别,是核心的挑战和机会。

什么比信息找人价值更高?

  • 问题找解决方案
  • 供需匹配:需求找供给
  • 时间扩展:(未来)机会识别,(未来)风险消除
  • 空间扩展:生态位巩固

横向扩展:信息的上游是需求,信息的下游是知识和服务,去掉信息这个中间环节

纵向扩展:物理世界,精神世界(从下到上带宽越来越窄)

物理世界

助手:人-物理世界的超频器

跟比特相比,原子变化慢。助手帮助实现在数字世界的模拟和演化,然后部署到物理世界。

精神世界

助手:人-精神世界的镜映器

三维的人,在高维的空间中,始终照见的是自己。

智能时代的常态和机会

  • 数字世界:供给过剩,需求不足,(时间不够用)时间限制被放大
  • 物理世界:供给不足,需求过剩,(虚实预期差)空间限制被放大
  • 精神世界:供给过剩,需求过剩,(注意力挤兑)精神问题被放大

智能就是人类欲望和局限通往三大世界的桥梁。

© 00RSS