交互的本质是输入(执行)和输出(反馈),大模型并没有带来信息格式的变化,而是变更了信息的生产和交流。
大模型会带来新的人机交互的转换,也会改变产品设计思路;但自然语言交互是否就是最好的交互形式,尚难有定论。纯粹基于自然语言的交互可能也是效率低下的,人类往往都会有误解或表达歧义,需要结合特点场景来判断。
从交互方式对比
交互模式 | NUI | GUI |
---|---|---|
模式定义 | 自然用户界面(通过自然语言文本或者语音,以及输入输出图片等直接交互,就像人和人之间聊天一样);基于对话的 NUI 交互方式更符合人的直觉,用户的互动性&参与感更强,需要用户发挥主观能动性。 | 图形用户界面(在众多图标、重重菜单或者瀑布流中选择);通过点击按钮与机器交互,这是一种结构化和机械化的方式 |
擅长场景 | 擅长处理不确定性、复杂性和新概念,通过多轮对话帮助用户理解和接受新的信息 | 在概念变得普遍和确定之后发挥作用,通过可视化界面提高用户体验和操作效率。 |
用户意图 | 不是很明确,或有明确目标但需要大量的信息参考后逐步变得清晰 | 较明确;一般知道要具体的动作 |
设计重点 | 难在用户对大模型能力的理解:不清楚大模型能力,交互中需要给予友好引导不信任大模型产出,需要结果中有交互回收反馈,需要进行追问的提醒 | 难在用户对产品的熟悉程度,尤其是新产品/新手阶段:不知道有什么功能,遵循常见的设计原则不知道如何使用,遵循常见的设计原则本质上遵循交互规范,在UI上创新 但请勿在UX上较大创新,符合大众的使用习惯 |
研发方式 | 开发流程更多依赖于模型的自动生成能力,而不是完全依靠开发者手动编写每一个步骤 | 传统的程序开发过程中开发者定义一个问题或任务,随后思考解决这个问题的方法和步骤,并将这些步骤转化为代码实现 |
产品形态 | 适用于信息生成或获取的产品形态用户表达目的或需求,由语言模型驱动的代理完成大部分工作或内容产生或页面产生,简化用户操作 | 适用于任务执行或操作用户按照预定义的步骤和流程操作产品 |
从业务结合方式对比
切入方式 | AI+业务 | 业务+AI |
---|---|---|
产品类型 | 应用层:AIGC、Agent、RAG等产品平台/框架层:coze、dify等低代码平台其他中间层、模型层暂不讨论 | 传统B端 |
面向客户 | 大多是通用性产品,面向2C | 大多是垂类产品,面向2B |
AI的形态 | Chat聊天方式为主,即NUI或依托于聊天交互展开 | 不同场景可能不同:【A】AI能力较为独立,单独入口,与业务脱离;比如提供帮助场景,在右侧浮窗等【B】AI能力作为助手,嵌入之前GUI交互,作为业务的解读或提醒;比如全局提供搜索或问答,支持快速的功能直达或功能操作【C】AI能力作为“数字员工”,在接收人类确认后进行执行,替换之前业务繁琐的SOP业务流程;比如目前常见各类型Agent,或待办提醒处理 |