GPT-4——关于 OpenAI 的新多模态模型你需要知道的一切

已发表: 2023-03-16

GPT-4——关于 OpenAI 的新多模态模型你需要知道的一切

当 AI 工具在司法考试中获得第 90 个百分位时，我们就知道世界正在发生变化。是的，我们正在谈论 OpenAI 最近的人工智能奇迹之一——GPT-4。

当全世界都在谈论 AI 时。营销领域对 ChatGPT 赞不绝口。同时，现在有一个重大公告引起了所有人的注意。请打鼓！街区来了一个新孩子。 GPT-4。备受期待且被认为是“OpenAI 最先进的系统”，这一切都将彻底改变对话式 AI 领域。

如果您错过了宣布 GPT-4 的直播，请看这里：

这需要处理很多，对吧？我们将在此博客中为您分解。因为 AI 及其在营销领域、在我们所知的商业领域中的潜力，确实令人着迷。可以轻描淡写地说 OpenAI 对此做出了巨大贡献。

GPT-4——简介
GPT-4 与 ChatGPT 有何不同？
- 1. 这里的流行语是“多模式”
- 2. 更大的文本容量
- 3. 语言能力
GPT-4 – 6 个您可能从未想过的用例
- 1.充当虚拟助手
- 2. 甚至写一本书！
- 3. 分析文档
- 4. 构建应用
- 5.消除应用程序/程序中的费用错误
- 6. 创造更好的对话以获得更好的客户体验
是时候停止抗拒并开始接受人工智能了

GPT-4——简介

宣布 GPT-4，一个大型多模式模型，在功能和对齐方面取得了有史以来最好的结果：https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
- OpenAI (@OpenAI) 2023 年 3 月 14 日

就在几个月前，每个人都在谈论 ChatGPT。如果您错过了我们之前关于 ChatGPT 的帖子，请在此处查看。 ChatGPT 确实成为对话式 AI 领域的潮流引领者。它为范式转变铺平了道路，并开启了许多关于人工智能及其对人类劳动力的增强效益的对话。

ChatGPT 基于 OpenAI 的 GPT-3.5。它是语言生成领域的一场革命，它在一个以深度学习为核心的复杂机器学习模型上工作。 OpenAI 一直在不断发布其图像生成工具 DALL.E-2 以及语言生成模型的新更新。

GPT-3.5 不断学习和完善的成果就是 GPT-4。

在保留其前身功能的同时，GPT-4 也被认为是更好的问题解决者。此外，由于其更广泛的知识库，它还具有理解更复杂输入和提供更准确结果的潜力。

与其他 GPT 版本一样，此版本可作为 API 使用。您可以加入候补名单以访问 API 或在 ChatGPT Plus 上体验 GPT-4。（目前以每月 20 美元的订阅价格提供）。另一种方法是注册 Bing 预览版并通过 Bing Chat 体验该模型。

互联网上已经充斥着使用 GPT-4 创建的内容样本。埃隆·马斯克 (Elon Musk) 等创业天才的反应吸引了更多眼球。

这只是对 GPT-4 的概述。让我们现在进入细节，好吗？

GPT-4 与 ChatGPT 有何不同？

据报道，GPT-4 的推理能力比 ChatGPT 好得多。因此，它可以更有效地处理范围广泛的复杂提示。具体来说，以下是一些最重要的参数，这些参数使 GPT-4 比 ChatGPT 具有明显优势。

1. 这里的流行语是“多模式”

GPT-4 和 ChatGPT 之间第一个也是最明显的区别之一是前者的多模式。 ChatGPT 经过训练可以接受文本输入。如果您使用过 ChatGPT，您就会知道您无法添加图像输入，但是您可以添加指向 Internet 上可用图像的链接，并根据它们获得一些基本答案。

ChatGPT 解释了一些基本图像，但它的推论并不总是正确的。然而，使用 GPT-4 时，这会变得更好。

GPT-4 是多模式的，这意味着您可以以各种格式向模型提供输入并获得答案。换句话说，您可以提供基于图像的输入。 GPT-4不仅分析和破译图像的内容，还根据图像进行逻辑解释。

下面是 OpenAI 给出的基于图像输入的应用示例。

除此之外，GPT-4的多模态也可以完成各种逻辑推理应用。这是一个巨大的飞跃！

GPT-4 的另一个能力是拆解图像以了解其中的细微差别，包括逻辑的存在与否，甚至说出似乎不合适的内容。

下面的例子更好地解释了这一点：

OpenAI 还分享了 GPT-4 能够分析图像中的图形表示并通过解释图形和其中的数据来提供答案的更多示例。

简而言之，GPT-4 内置了大量图像分析和处理功能，以增强大多数人工智能工具中已知的基本图像识别功能。

2. 更大的文本容量

虽然 ChatGPT 可以生成大约 3000 个单词的文本，但 GPT-4 更先进，可以创建更大的文本输出量。据说 GPT-4 能够生成多达 25,000 个单词。

这种差异也带来了工具信息保留能力的变化，使他们能够记住过去对话中说过的话。据报道，ChatGPT 最多可以引用 4000 个标记或 3000 个单词。但对于 GPT-4，它要高得多。

3. 语言能力

在语言能力方面，GPT-4 也领先于 ChatGPT。据说 GPT-4 更加熟练，能够以 26 种不同的语言提供更准确的响应。

除此之外，根据 ChatGPT 与全球数百万用户的对话，还进行了大量微调以消除 ChatGPT 中指出的所有漏洞。基于 ChatGPT 对一些用户欺骗该工具使其偏离其内容政策的时间的偏见反应，ChatGPT 一直陷入困境，OpenAI 团队为 GPT-4 增加了更多安全性。

为了更好地了解 GPT-4 的优势，我们还可以看看用户分享的一些示例，他们向该工具发出各种提示，结果却大吃一惊。

GPT-4 – 6 个您可能从未想过的用例

1.充当虚拟助手

如您所见，基于图像输入的复杂响应似乎是 GPT-4 改变游戏规则的功能之一。 Be My Eyes 的 Virtual Volunteer 工具是一个完美的例子，它展示了 GPT-4 的这些优势可以带来什么样的不同。

我们很高兴推出 Virtual Volunteer，这是一款由@OpenAI 的 GPT-4 语言模型提供支持的数字视觉助手。虚拟志愿者将回答有关图像的任何问题，并在应用程序内实时提供即时视觉帮助。 #Accessibility #Inclusion #CSUN pic.twitter.com/IxDCVfriGX
- 成为我的眼睛 (@BeMyEyes) 2023 年 3 月 14 日

由 GPT-4 提供支持的 Virtual Volunteer 专为有视力障碍的用户和有视力问题的人而设计，可根据用户面前的图像/物体快速回答问题。知道要烹饪什么以及如何烹饪就像点击冰箱内物品的图片一样简单，只会让该工具建议食谱以及如何准备它们。

翻译、导航——由于 GPT-4，Virtual Volunteer 设法实现了更多。

2. 甚至写一本书！

当人们为能够编写社交媒体标题和广告文案而欢呼时，GPT-4 已经通过编写一整本书来吸引眼球！受欢迎的企业家 Reid Hoffman 在 Twitter 上分享了他用 GPT-4 写的一本书。这确实改变了人们对人工智能的看法。

我用@OpenAI 最新、最强大的大型语言模型写了一本新书。

它叫做即兴：通过人工智能扩大我们的人性。

据我所知，这是第一本使用 GPT-4 编写的书。

这就是一切的开始...... https://t.co/M19e1ISGpb
- 里德霍夫曼 (@reidhoffman) 2023 年 3 月 15 日

3. 分析文档

您知道有时您只是没有时间阅读几页合同和条款和条件吗？或者有时信息太多，以至于您错过了关键细节。 GPT-4 可以防止这些情况。

以下示例显示了用户将实时以太坊合约输入 GPT-4 以扫描和识别潜在安全漏洞的情况。

我将一份实时以太坊合约转储到 GPT-4 中。

瞬间，它突出了一些安全漏洞，并指出了可以利用合约的表面区域。然后它验证了我可以利用合同的特定方式 pic.twitter.com/its5puakUW
- 康纳 (@jconorgrogan) 2023 年 3 月 14 日

在区块链和加密货币等数据密集型领域，GPT-4 快速高效的语言处理潜力可能是一个福音。

4. 构建应用

ChatGPT 推出时，讨论最多的话题之一是该工具创建代码片段甚至分析代码片段以识别错误的能力。但是 GPT-4 扩展了这个功能，可以编写完整的程序。

这是它帮助构建应用程序的示例。

嘿 gpt4，给我做一个 iPhone 应用程序，每天推荐 5 部新电影 + 预告片 + 在哪里观看。

随着我们的发展，我的野心越来越大 pic.twitter.com/oPUzT5Bjzi
- Morten Just (@mortenjust) 2023 年 3 月 15 日

用户还分享了创建此应用程序的过程和各种修订。

GPT-4 创建乒乓球游戏的另一个例子重申了模型的编程能力。

我不在乎它不是 AGI，GPT-4 是一项令人难以置信的变革性技术。

我在 60 秒内重新创建了 Pong 游戏。
这是我的第一次尝试。

事情永远不会一样。 #gpt4 pic.twitter.com/8YMUK0UQmd
- Pietro Schirano (@skirano) 2023 年 3 月 14 日

这些示例展示了世界各地的程序员如何借助 AI 提高技能并更快、更智能地工作。

5.消除应用程序/程序中的费用错误

与编写程序类似，GPT-4 也可用于审查程序并立即发现其中的差距和错误。这有助于应用程序开发人员在进入下一阶段之前快速发现并纠正错误。因此，可以避免由于代码错误而导致的代价高昂的错误。

GPT-4 扫描了我的@LangChainAI 聊天机器人代码库的整个前端以查找错误和错误。

这是发生的事情和我注意到的……#openai #chatgpt #gpt4 pic.twitter.com/0vLQXQFmxg
-梅奥 (@mayowaoshin) 2023 年 3 月 14 日

6. 创造更好的对话以获得更好的客户体验

我们一直在谈论 GPT-4 的许多优势，但我们不能忘记它的核心是对话式 AI。因此，GPT-4 最明显也是最相关的应用是改进的对话界面。是的，你猜对了。如果您计划改进聊天机器人以获得更好的客户体验、更快的提示和更相关的响应，那么 GPT-4 可以让这成为可能。

Duolingo 将 GPT-4 整合到其已经很直观的平台中，引入了 2 个功能——角色扮演和解释我的答案。对于试图练习语言技能的学习者来说，这两者都很方便。多亏了 GPT-4，对话听起来更人性化，让用户感觉他们是在和真正的人类导师一起练习。

是时候停止抗拒并开始接受人工智能了

发生了很多事情。对于试图跟上不断变化的内容创作世界的企业主和营销人员来说，这可能会让人不知所措。是的，人们一直在谈论人工智能抢走工作。但是，利用人工智能的力量所带来的好处也值得他们给予应有的关注。

正如我们所知，技术曾经是对人类劳动力的威胁，但今天它是生活方式。人工智能也可能会发生这种情况。营销中的 AI、用于快速和有用的设计灵感的 AI 设计工具，以及一些此类应用程序不断证明这项技术如何提高人类劳动力的生产力，而不是试图取代它。

2022 年对 OpenAI 来说是忙碌的一年，我们猜测 2023 年也不例外。因此，是时候开始抵制 AI 并开始接受它可以改善您的基础架构和工作流程的多种方式了。