构建人工智能应用的底层逻辑

大语言模型是个黑盒,GPT-4 在早期版本中就如真人一般,而大量使用之后又不禁怀疑:它真的理解了对话吗?

AI也许是以我们不同的方式理解,之所以表现相似,是因为神经网络是一种模拟,人脑也是神经网络,正如我们搞不明白人脑怎么冒出意识那样,模型的生成过程也无法解释。

Stephen Wolfram 提出了叫做计算不可约和计算等价性的思想,用在AI上来说,要弄明白为什么模型输出那些内容,就得做不少于它参数量的运算,这就叫不可约,而它输出的结果,人脑也能产生,某种程度上就叫等价,所以至少对于非研究者而言,不必纠结于原理是什么,只需从外部测试这个盒子的能力,重点在于应用。

宇宙中有大把未知的存在,存在即合理,假设我们将存在和可能的存在都当作一种意义,就有了意义空间,从这个出发点可以推断出很多东西。

一点浅见!

我以为意义是一种主观判定因果关系的方式,例如,小路上散步,一阵小风,不是朝这儿吹就是朝那儿吹,吹到树身上,种子飘到别处生根发芽了,吹到人身上,引起一阵惬意,这就是意义,它们的意义是在人身上体现的,所以:

  • 意义是一种组合,来源可能并不相干;
  • 意义是基于判定者而言的,判定角色多种多样;
  • 意义及其组合片段可以是自然、非自然、实体、抽象;
  • 意义针对的是结果,至于其因则是一种非完全归纳;

根据以上假设,可以做几点推论:

  • 意义的判定可以非常主观,只要主观一致,这种判定就有了客观性;
  • 在约束条件下,可以固定组合,也就存在复现的可能;
  • 如果因果可以被观察并复现,可以不寻求其完备性;
  • 意义的片段也有其因果,因此意义可以嵌套;
  • 因可视为一种资源,意义的创建依赖资源;
  • 因果如果不是唯一对应关系,可以推论:
    • 给定片段可以创建出不同组合的意义,或者给定意义可以由不同片段组合;
    • 客观性、非唯一性、观察和复现作为依据,进而可以测量;
    • 以测量为基准,组合可以评估、替换、优化;

再说到 AI !

以大模型为代表的AI来自与人对齐,当它作为主体代入到以上推论,AI和人在意义空间的交集是数字,人的语素和模型的tokens转为相同的编码。AI参与意义的数字化部分,如果它同时兼具确定性因果的生成能力和主观一致能力,就可以如同生命体一般,自我创建意义、分解、替代、整合;否则可以测量,为人所用;

例如四种测量指数:正确率、速率、适用性、容量用于评估给定意义选取片段进行组合的能力或者者给定片段生成意义集合的能力,从而判断智能水平,如果其结果是AI > 人,那么AI就在这个例中超越了人类。而目前大模型作为黑盒子的测试结果是:

  • 模型很难固定为具有内部一致性的判定者,因为它的判定依据来源不一缺少内部关联。所以对意义的判定仍然需要人的对齐、监督,或者用程序给予强的约束。
  • 由于缺乏一致性,而对于未知的、复现的,都需要判定,也可以叫验证,AI也缺少验证的能力。因此:
    • AI很难自主学习新的知识,除非给予真实反馈监督训练;
    • 对包含未知片段的意义组合,AI错误率较高,例如AI很难做总体规划,它会给出错误的方案;
  • 模型能创建的集合容量大于人个体的集合,因为它能模拟人以及人的创造例如程序,也许还能模拟气候...模拟各种自然生物和非生物的现象,上限是模拟能力;
  • 模型的智能水平在很多具有通用性的案例中已经超越了人类,因为它压缩了人类的历史知识;
  • AI创建意义的速度远大于人的速度,在处理多任务、快速挂载、卸载资源方法也是如此;
  • AI创建某条意义时,能挂载的资源容量也超出人类,如超长上下文;

人的优势是什么?

如果人代入以上推论呢?显然人也有AI无法比拟的优势:

  • 人类意义活动中,有大量未数据化的部分;更具体的说人的环境感知和知识库中只有少部分被数据化;
  • 人具有内部一致性的能力,这种能力意味着他可以自主学习;
  • 人拥有更多具有内部关联的背景知识,对自己、家庭、职业、企业、行业,可以了解更深入,也就是说对这些特例化、垂直化的场景,创造意义的智能水平>AI。
  • 加上自主学习,针对特例,人可以基于零样本、少样本预先学习、动态训练;
  • 人更善于单线程,各个片段间深度嵌入、耦合,集中于一个任务,可以维持长连接、随时待机,随时交付;

三个应用方向

对于人类社会来说,应该追求并集,而非交集,AI的能力也可以反哺给人类(如气候预测、行车预测)。根据以上的推理,有三个应用大方向:

对于模型训练:

  • 追求更多的数据化;
  • 针对特例任务的训练,例如固定格式输出;
  • 蒸馏出具有更强内部关联性的小模型,能够运行在小型设备上;

对于应用平台:

  • 发掘AI表现较高智能水平的场景,包括多样化流程组合,自适应的人与AI的交互方式,例如最简单角色扮演系统:挂载系统提示这个资源,让人-AI循环交互作为标准流程;
  • 通过打造上述场景,让意义复现降低成本,让每一用户都更容易根据已有的案例结合个性化需求创建自己的意义;
  • 提供资源挂载池,这种资源可以有知识库辅助、第三方工具辅助、智能代理程序辅助、人工辅助、社区辅助等等;

对于用户自己:

  • 致力于应用由平台创建→第三方开发者创建→用户创建AI辅助→AI创建人辅助的智能化方向;
  • 打磨人与AI能够协调一致性的沙盒,作为共同的运行时环境,开发、测试、验证的一体化,例如一个自托管服务中心;
  • 有条件的话在家庭和个人的设备上运行小模型,针对沙盒环境自己进行微调训练;
  • 创作才是终途,量入,量出,寻找最优解:让有限的资源创造更多的意义;