AI 将会带来用户界面范式的第三个阶段

date
Sep 10, 2023
slug
20230909
status
Published
tags
沉思录
summary
计算机历史上,有三次界面革命:批处理、基于命令的交互,和即将到来的基于「意图」的交互。
type
Post
计算机历史上,有三次界面革命:批处理、基于命令的交互,和即将到来的基于「意图」的交互。
从这个角度来看,除了 AI 本身的技术之外,如何让这种技术和用户更好交互,也会成为一个巨大的竞争优势。因为在任何一个新领域早期,少数公司决定了标准的 UI 界面 —— 想想 iPhone 之后所有图标形状的变化,以及手势操作的习惯等。
从这个角度来看,可能更好理解为何 Ivan 认为他们在 Notion 中添加 AI ,重要的不是背后的技术,而是如何为 AI 设计更好的交互 —— 比如通过 AI 来自动化填充,而非使用命令行。
notion image
范式 1:批处理
  • 从 1945 年计算机诞生开始出现的用户界面;
  • 在这种模式下,用户指定一个完整的工作流程,包括希望计算机完成的一切。然后把这批指令提交给数据中心(多数时候是一堆穿孔的卡片),然后等待在某个时间被批量处理。
  • 当被批处理完成后,他们能拿到这批输入的输出结果 —— 一大摞打印纸。但也有可能再次提交打孔卡片,因为如果这批命令包含任何错误,要么没有输出结果,要么结果毫无意义。
  • 从用户界面来看,批处理基本上不涉及人机之间的交互操作。用户界面的唯一触点是那批打好孔的卡片。可用性相当糟糕,且通常需要许多天时间来进行微调处理,才能使其在执行过程中产生预期结果。
范式 2:基于命令的交互设计
  • 从 1964 年开始的大型机分时共享,导致出现了第二次用户界面范式革命:基于命令的交互。
  • 在这种模式下,用户和计算机一次一个命令,进行轮流交互。这种范式从诞生到今天,主导着计算机界面设计长达 60 年 —— 从命令行(Dos/Unix)、全屏文本(IBM 大型机)、图形用户界面(Mac/Win 以及今日所有的智能手机平台)。
  • 和范式 1 相比,优点在于,每条命令被执行后,用户可以重新评估情况,并修改接下来交互时发布的命令,以便使结果达到自己的预期。
  • 多数时候,用户并不需要一个完全明确的目标,因为可以根据和计算机交互的结果中,调整处理手头问题的方法。
  • 早期的命令行系统不支持显示状态,所以可用性很糟糕。比如在 Unix 系统中,只有命令错误时才能从系统中得到反馈,这让用户很难持续编写命令。而图形界面的魅力在于,能在每个命令之后显示状态,从 1984 年 Mac 普及图形界面以来,这种范式一直主导着计算机。
范式 3:基于意图的结果规范
  • ChatGPT 或 Claude 未必能代表未来几年我们要用到的 UI,因为其本身易用性并不强。
  • 比如衍生出来一个工作叫 Prompt 工程师,其存在的价值是在正确的地方给 ChatGPT 挠挠痒痒,让其能咳出来正确的结果。这和早年曾经需要培训许多法律专家来查询法律数据库一样 —— 然后 Google 就横空出世了。
  • AI 的可用性应该是一个重要的竞争优势,但目前基于聊天的交互形式,对用户的要求还是太高。因为大多数人并不擅长描述自己的需求。
  • 从这个角度来看,AI 的用户界面潜力很大,因为会和之前的互动范式截然不同。比如在基于命令的交互中,用户一次次向计算发出命令,逐步产生预期结果。这个过程中计算机完全是服从命令,但问题在于,许多低可用性设计导致用户发出去的命令和自己本身想要的不同。
  • 有了 AI 之后,用户不再告诉计算机要做什么。相反,用户告诉计算机他们想要什么结果。所以说,当前生成式 AI 所代表的第三次范式革命,是基于意图的结果规范。
  • 比如我们使用 Prompt ,是直接告诉 AI 我们想要什么结果,但并不关心这个结果该如何完成。与传统的基于命令相比,这种范式颠覆了控制权。比如如果对输出结果不满意,我可以告诉 AI 继续调整为我想要的结果 —— 只不过目前并没有很简洁的交互方式。
  • 所以,按我说的给我结果,比按我说的做,更加诱人。
  • 当然,目前还有很长的路要走,因为图形界面效率更高,且交互更加直观。所以未来的 AI 系统会有一个混合的用户界面,结合了基于意图和基于命令界面的要素,但同时还有许多 GUI 元素。
notion image
 


© nabin 2024