人工智障 - 稔谷·刊

AI 带来的三重危机以及对未来的信心

2024年08月09日人工智障

关于人工智能，有这么一则寓言：一辆加速的列车，一经抵达就远远地把人甩在身后。幸运的是，列车似乎已经抵达，并没有把人甩在身后。因此，我们只需要回答好三个问题： * 列车是否仍在加速？ * 应该上车吗？ * 怎么上车？上一篇文章《构建人工智能应用的底层逻辑》展望了下AI应用的前景，然而现实的反馈是：应用很难落地。这同时指向了上述三个问题。这篇文章将尝试回答头两个问题，对于第三个问题，也许将来有更多实践分享。列车是否仍在加速？这个问题尚未在技术上得到很好的解答。从历史的角度却很容易找到线索，只需观察两条曲线。第一条曲线代表了对AI的投资和研究以及能力随时间的变化 A Critical Historic Overview of Artificial Intelligence: Issues, Challenges, Opportunities and Threats InfoQ：2023 中国人工智能成熟度模型报告中间有波峰和波谷，说明人工智能也有退潮期，如果贸然跟风，也可能踩坑（后面再谈论这个）。但总体

…

构建人工智能应用的底层逻辑

2024年08月08日人工智障

大语言模型是个黑盒，GPT-4 在早期版本中就如真人一般，而大量使用之后又不禁怀疑：它真的理解了对话吗？ AI也许是以我们不同的方式理解，之所以表现相似，是因为神经网络是一种模拟，人脑也是神经网络，正如我们搞不明白人脑怎么冒出意识那样，模型的生成过程也无法解释。 Stephen Wolfram 提出了叫做计算不可约和计算等价性的思想，用在AI上来说，要弄明白为什么模型输出那些内容，就得做不少于它参数量的运算，这就叫不可约，而它输出的结果，人脑也能产生，某种程度上就叫等价，所以至少对于非研究者而言，不必纠结于原理是什么，只需从外部测试这个盒子的能力，重点在于应用。宇宙中有大把未知的存在，存在即合理，假设我们将存在和可能的存在都当作一种意义，就有了意义空间，从这个出发点可以推断出很多东西。一点浅见！我以为意义是一种主观判定因果关系的方式，例如，小路上散步，一阵小风，不是朝这儿吹就是朝那儿吹，吹到树身上，种子飘到别处生根发芽了，吹到人身上，引起一阵惬意，这就是意义，它们的意义是在人身上体现的，所以： * 意义是一种组合，来源可能并不相干； * 意义是基于判

…

FastGPT & Dify 应用案例及工作流开发总结

2024年08月07日人工智障

AI+Workflow是当前比较流行的Agent应用开发方式，本博客之前重点对比了：Dify vs FastGPT两个开源项目，也演示了Coze的案例，本文继续分享这两款产品的开发实践，借此对拖控件编排工作流这种低代码开发方式进行阶段性总结，读者顺便也能体会到它们之间的差异。特别强调的是，这几款产品迭代得很快，文章仅作参考而非为了评价它们的优劣。同样优秀开源项目还有：bisheng（支持autogen和lanchain）和 ragflow（提供更丰富的RAG方式）等，你如果了解 langchain 的话，它也有 workflow 的开发方式可供选择。言归正传！图形界面仍然是我们大部分用户首选的人机交互方式，例如，下图是我用FastGPT实现的一个下载器前端：目前AI在实现智能生成UI、自动提参的交互能力上还比较弱，一方面，开发应用需要先对图形界面（GUI）进行布置，这受限于平台自身提供的UI组件；另一方面，AI更广泛的应用场景是作为其他软件的辅助形式，所谓副驾驶，例如代码编辑器中的插件，聊天软件中的机器人，而软件是各自独立的，多数软件接入第三方AI的形式

…

Coze 平台 AI 聊天机器人的搭建案例

2024年06月27日人工智障

大语言模型问世一年半，出现了越来越多有意思的东西，例如可以在聊天中触发一些UI互动，让大模型使用第三方工具，执行一些自动化工作流，使用低代码开发Agent 代理最近也非常火热，扣子（Coze）是其中优秀的平台，本次，我尝试在coze.cn搭建应用，看看目前主流平台的 AI 智能体开发方式，能不能替代前后端，能不能落地，具体会碰到什么问题？顺便也看看国产大模型表现如何。我首先想到一种需求，了解开源领域的朋友们都知道，Github是开源项目的主要集中地，我们大抵是通过标星（stars）来关注一个仓库，长时间下来，stars数量已经有几百个乃至上千个之多了，这带来一个问题，我们关注一个项目通常不会细致的研究它的文档和代码，只大致了解了它的用处，过后可能也就忘了。当我们实际需要某种工具时，又常常想不起来，只能借助传统的搜索，包括GitHub自己的搜索功能，这效率有点低，经常就搜不到，因为开源项目的描述和我们关键词并不一定匹配。诚然，现在的大模型基本上都会爬取GitHub上的数据，但实际测试发现，它并不是真的“记住了”什么知识，并不能当作信息搜索引擎来用，要命的是，它还会一本正经的瞎编乱造

…

Dify VS FastGPT —— 两个出色的整合大模型应用的开源项目

2024年04月21日人工智障

在基于大语言模型 API 的生态上，有那么几种类型的应用解决不同的痛点： 1. 使用最广泛的是网页或软件在API上套壳，方便有网络障碍和弹性需要的用户； 2. 检索增强生成（RAG），适用于垂直和私有化数据领域； 3. 结合第三方软件，包括 SaaS 平台、本地工具，扩展模型的能力； 4. 低代码拖控件调度工作流，降低个性化定制的门槛； 5. 统一API接管，应对各家模型如雨后春笋般发布的场景。而 langgenius/dify 和 labring/FastGPT 将以上功能集于一身，是开源AI项目中的佼佼者，类似的项目还有 Bisheng 和 TaskingAI（国外的新起之秀）等。综合体验下来，我选择 Dify 和 FastGPT 的社区版作为其中代表进行比较，这两个应用也是我使用最多的，在不同服务器上都部署过，以下评价并非严谨的测试，仅作为主观使用感受总结。安装和运行环境： Dify

…

AI 的轻应用开发只是热闹一时

2024年01月15日人工智障

这篇文章写于2024年1月15日，现在分享到博客上来。我自己也开发过GPT，对话数超过10k，评分4.5，算排名靠近，不过我也早早取消了Plus订阅，改用API了，那对我来说更好用。 GPT是OpenAI推出的定制版ChatGPT，有点类似于微信小程序。定制门槛很低，最简单的直接在聊天框上提需求，构建器会自动帮你创建好，然后还可以分享到商店来赚取收益。在这篇文章中，我得出几个结论，如果您有不同的看法，欢迎探讨。 1. GPT应用真正能落地的场景很有限这个结论也同样适用于国内AI平台。为了理解这点，我们需要回顾一下Prompt和Agent，即提示工程和智能体代理。简单来说，大语言模型根据前文生成后文，而Prompt就是利用模型的这一特性预设某些提示以规范输出，例如角色扮演，Agent的骨干也是Prompt，通过特殊的提示让模型能够与外部服务及私有数据结合起来，更加垂直化。提示和代理提供了无限的想象空间，大模型如同压缩了世界知识的宝藏，提示词如同密钥，有什么样的钥匙就能开出什么样的宝石。而代理将自然语言赋予了创造的魔力，如同咒语般从石头

…

曲线救国：用谷歌语音助理唤起必应聊天

2023年03月05日人工智障

现在手机上的 Bing 应用已支持 AI 聊天，并且可以语音对话。声音还行，识别率也高，即便偶尔口误或者识别出错别字，也基本上能够返回正确的回答。不过，Bing 还无法像 Siri、小爱那样在待机状态下用语音唤醒，也许未来微软会重新上线像曾经的 Cortana 那样的智能助理，但目前只能通过点击桌面上的图标打开。有没有办法直接用口令唤醒呢？经尝试，我在 Android 手机上成功用 Google Assitant 和 Tasker 呼出 Bing Chat Voice 并连续对话。本文只演示安卓设备上的操作，

…

替代 ChatGPT，用 Notion AI 和 Bing Chat 写文稿

2023年02月25日人工智障

Notion 简介 Notion 是一款功能强大的云端笔记软件，可以让用户创建各种类型的文档、表格、数据库、任务清单、日程安排等。Notion 支持多人协作，可以轻松地与团队成员共享和编辑文档。Notion 支持块引用和 API，这让它拥有丰富灵活的能力，不仅仅用来做笔记，也可以用来做项目管理、任务清单、知识库、财务记账、博客等。 Notion AI 介绍 Notion AI 是 Notion 最新推出的智能写作助手，它利用生成式语言模型自动创建各种文本内容，功能主要包括： * 写作模式：使用不同的模式，例如博客、

…