第四范式发布式说大模型以生成式半岛体育AI 重构企业软件（AIGS）

新闻资讯

分类

新闻资讯

NEWS MESSAGE

第四范式发布式说大模型以生成式半岛体育AI 重构企业软件（AIGS）

发布日期：2023-04-27 07:03:17

　　半岛体育4 月 26 日，第四范式首次向公众展示其大模型产品「式说 3.0」，并首次提出 AIGS 战略（AI-Generated Software）：以生成式 AI 重构企业软件。式说将定位为基于多模态大模型的新型开发平台，提升企业软件的体验和开发效率，实现「AIGS」。

　　第四范式创始人兼 CEO 戴文渊表示：C 端产品已经逼近用户体验的上限，而 B 端的企业级软件往往是个十分复杂的执行系统，堆砌十几层菜单和成千上万功能也不算多。

　　戴文渊认为，目前这些 B 端软件极为复杂的交互体验，以及复杂性带来的极低开发效率，恰恰为生成式 AI 留下足够大的重构和改造空间。

　　过去很难通过人类语言（自然语言）的方式去调用企业软件的功能，现在当我们有更强的语义理解和生成能力，再加上 GPT 任务翻译、任务分发和推理的能力，就可以通过更好的「对话框式」交互方式实现功能的调用，不再需要找到某个位于十几级的菜单目录之下的功能。

　　这背后还是大模型的能力。第四范式现场拔网线，展示了式说大模型的图片理解、多轮对话、写小说、迅速画图等能力。

　　此外，现场展示了式说通过推理能力完成更加复杂的装箱操作，以及其现场编写代码的能力。

　　在戴文渊看来，要做到 AIGS，大模型未必需要是知识广博、十项全能冠军的通才，更重要的在于模型具备 Copilot（副驾舱），和思维链 CoT（chain of thoughts，多步推理）的能力。

　　要去改造企业软件，大模型不能只有语言能力。式说 2.0 就加入了多模态和 Copilot，因为很多企业软件里的数据是多模态的，而 Copilot 能把人的指令翻译成要调用后台的哪个 API。此前发布的式说 2.0 的 Demo 中，门店员工通过语音、文本等交互方式向式说发起指令，式说理解后，联网门店监控软件调出后厨未戴口罩的图片，并直接将图片以对话框的形式输出给员工。

　　大模型去调用软件内置的一个个功能、数据来「对话框式」完成任务，已经能产生巨大价值。但员工用企业软件时也会面临复杂任务，需要人按照顺序执行一个个功能。

　　因此，式说 3.0 强调的是 Copilot 加上思维链 CoT，具有更强的推理能力，在学习大量数据和攻略后，能形成中间的逻辑推理步骤，从而做到拆分并执行复杂工作。

　　第一阶段，Copilot 调动不同的信息、数据、应用，作为助手完成用户的指令。相当于在所有企业级软件系统里，配备一个指挥官。指挥官听用户的指挥，比如把照片亮度调亮 20%。

　　第二阶段，Copilot+ 基于企业规则的知识库，AI 能够参照规则做复杂工作，进一步丰富了「对话框」的能力。比如 AI 查询了人像美化知识库后，能执行把照片修好看的步骤。

　　第三阶段，Copilot+CoT（思维链）。软件系统的使用行为最终会被大模型学会，形成 AI 针对这个领域的思维链，意味着把照片处理得更好看这种复杂指令，AI 能自动地按照步骤完成。

　　第四范式的 AIGS 战略，就是指基于式说大模型背后的 Copilot+COT 能力，把企业软件改造成新型的交互范式，并在新型交互上不断地学习软件的使用过程，形成领域软件的思维链。

　　在我国航空制造代表企业的实际场景演示中，其与第四范式基于 Copilot 技术，联手改造了某工业设计软件。

　　现场某医疗行业的实际场景演示中，式说的思维链能够清晰指出将药品销售出去的具体步骤。

　　最终，由于新的交互形式的出现，企业软件的开发效率变得更高。以前是功能和执行逻辑被编排在软件界面，每次一个功能升级，都要周而复始的经历原型图、设计、开发等，至少是月级别的开发时间。而现在由于「对话框式」的界面是固定的，功能和逻辑被改写在数据、API 和内容层面，变成了天级别的开发效率。

　　值得一提的是，在式说 3.0 发布现场，来自航空制造、金融、医疗等行业的客户代表出席并做产品的 livedemo 演示。ChatGPT 出现的短短两个月内，众多企业与合作伙伴已经与范式在生成式 AI 方面开展了深度合作。式说作为基于大模型的新型开发平台，期待与更多合作伙伴与企业客户及一起，探索以生成式 AI 重构企业软件的机会，共同提升企业软件的易用性和生产力。

　　在 BERT 出来的时候，范式研究院就开始关注并投入在这个技术领域，GPT3 出来以后更加明确了要朝这个方向。不过相比今年的投入，过去几年肯定还是有差距的。半岛体育ChatGPT 对我们最大的帮助，就是整个市场的信心一下从 0 调满了，确定性的投入更大了，再往后就是变成产品、变成商业化的路线、是否跟同行做过对比？

　　中国目前还没有像 OpenAI 那样在大模型上绝对领先的公司，也会有更多的大模型。大模型是新的生产力，大家都得有大模型作为底座，所以入局的门槛确实是变高了。

　　第四范式认为比较大的机会在于改造整个的企业软件行业，也就是 AIGS 这个方向。发力的大模型技术方向是 Copilot 可控（执行可控、知错能改），和思维链 COT（（chain of thoughts，多步推理、复杂任务拆分）的能力，形成数据飞轮（比如将某垂直领域的数据和流程投入大模型，很快可以形成模型在该领域的思维链）。

　　3、式说在短短两个月的时间已经发布了 3 个版本，从 1.0-3.0 这中间的迭代过程是？

　　1.0 —— ChatGPT 火了之后，大部分的客户和伙伴还没有真的使用上 GPT 类似的技术，我们当时出了第一代的产品。式说 1.0 有生成语言的能力，并且解决 GPT 技术应用时内容可信、数据安全和成本的三大问题。当时主要的场景就是文库问答，相当于让 GPT 学习的企业知识后，可以解答专业问题，并且是可溯源的。

　　C 端的软件体验在过去的十几年已经被打磨到了比较高的水准，你用对话未必就一定更好用。但是 B 端（想象一下在企业报销系统、HR 系统、OA 系统），体验还是比较差的。可能你在菜单里面点一个下拉菜单，再点下拉菜单，再点几下才能进入到某一个功能。

　　其次是开发效率的提升。原先 B 端企业软件都是高度定制化的，基于菜单式的开发，基本每次一个功能升级，又要产品经理画界面，设计、开发等，至少是月级别的开发时间。而由于新的交互形式的出现，以前是功能和执行逻辑被编排在软件界面，现在功能和逻辑被改写在数据、API 和内容层面，变成了天级别的开发效率。

　　去改造软件大模型不能只有语言能力。式说 2.0 就加入了多模态和 Copilot，因为很多企业软件里的数据是多模态的，而 Copilot 支持用对话去调用软件内置的一个个功能 / 数据来完成任务。2.0 的时候，员工可以通过语音、图像、表格、视频等多模态方式向式说发起询问或下达指令，式说理解之后，半岛体育联网企业软件调出有关功能，并以所需要的形式输出答案。

　　首先，范式拥有做大模型的技术能力。虽然先知不是做通用模型的定位，当时定位是做专用模型，但先知一直强调模型是要高维的，所谓的高维其实就是参数，要把模型做大，就像 GPT3.5 是 1700 多亿的参数，这是从技术上来说能平移过去的地方。此外范式拥有国内领先的研究院、工程化、产品力的全栈技术能力。

　　其次，范式原有市场和新市场所面对的产业链正好是上下游。以前 AI 更像是一种重要零件或者元器件，这些以外的其他地方不是 AI 覆盖，是企业软件覆盖。企业软件经过了这么多年发展，基本上能把所有的事都覆盖了。范式和软件公司一直互为生态，范式做的是软件里面的 AI 决策，软件公司做功能和流程的实现。比如 AI 预测出门店明天要运多少鸡翅，这需要放到门店管理的系统里。