首页 › AI人工智能 › GPT-4 生成长篇小说作品

GPT-4 生成长篇小说作品

02月02日 发布在 AI人工智能

4649 0 0

ChatGPT：我要求 GPT-4 写一本书。结果是：《亚特兰蒂斯的回声》，12 章，115 页，零人工输入。

目标

这个项目的目标是让 GPT-4 版本的 ChatGPT（最新的教学大语言模型）从头开始生成整部小说，包括标题、类型、故事、人物、背景和所有写作，无需人类输入。目前不可能使用单个提示（“给我写一本书”）来完成此操作，但可以提供一系列提示，为流程提供结构并允许其一步步完成这项大型任务。时间。不过，为了保证所有的创意工作都是由GPT-4完成的，提示中不允许具体提及书本的内容，只能提及书本的结构。目的是该过程应该简单、机械并且可以（原则上）完全自动化。每次从头开始重复这个过程，它都应该完全基于 GPT-4 的独立创意选择创造出另一本全新的书。

结果是：《亚特兰蒂斯的回声》，这是一部共 12 章、115 页的奇幻冒险小说，于 2023 年 3 月历时 10 天写成。

我在做这个项目的过程中得出的主要见解：

迭代细化：从高级大纲开始。制定详细的章节大纲。然后写出完整章节的草稿版本（这将比期望的短得多）。然后将每个场景扩展为更长、更详细的场景。

边界（由外向内）： GPT-4 喜欢走得太远，写出书中不应该发生的部分。防止这种情况的关键是让它先写第一部分，然后写最后部分，然后填写中间部分。最后一部分防止它走得太远，而前一部分又限制了上一节的最后一部分。边界用于除顶层之外的每个细化级别。

单个提示：通常，通过使用单个大提示而不是正在运行的对话，您可以灵活地确定输入缓冲区中将包含哪些信息，并确保所有信息都与当前任务相关。我设计了这种方法来将尽可能多的相关信息压缩到令牌缓冲区中。（注意：有时，如果您非常接近限制，即使是单个提示也可能会超出令牌缓冲区。在这种情况下，必须删除一些文本。）

连续性注释：要求它记录重要细节以记住其连续性和一致性。从前一个场景中总结的连续性注释开始，然后合并前一个连续性注释中的其他连续性注释。这样做时，提供有限的上下文（仅最近的场景和前一个场景的连续性注释）以避免向前看会很有帮助。连续性注释会随着时间的推移而增长；如果它们变得太长，请它总结他们。

修改大纲：在某些情况下，AI会即兴写作，例如将第5章的一些场景移至第4章，这会破坏本书的内容。为了解决这个问题，我要求它在每一章之后返回并更新其早期的、更高级别的大纲，并在继续之前重新生成每章的开头和结尾场景。这与真正的作者随着时间的推移修改其大纲的方式非常相似。

数据清理：有时输出会做一些奇怪的事情，例如从输入缓冲区复制标签（例如“打开段落”），或者忘记对场景进行编号，或者从零开始编号，或者在开头添加一些杂散文本。目前我手动清理这些，但完全自动化的解决方案必须处理这些问题。

提示示例

这些只是几个示例，它们并未显示提示中包含的所有数据。有关完整详细信息，请参阅我的研究日志。

第一级：顶层大纲

我：请为一本书写一个高级大纲。包括字符列表和每个字符的简短描述。包括章节列表以及每章内容的简短摘要。您可以选择任何您想要的标题和类型。

第 1 级：每章后更新大纲

我：请考虑到第一章中已经发生的事情，编辑和更新以下本书的高级大纲。

第 2 级：场景（边界）

我：请写出详细的大纲，描述每章的第一个场景。它应该描述开场场景中发生的事情，并为本章其余部分奠定故事基础。不要总结整个章节，只总结第一个场景。

我：写一个详细的大纲，描述每章的最后一个场景。它应该描述本章最后发生的事情，并为下一章的开头场景奠定故事基础，下一章将立即出现。

第二级：场景

我：给定以下书籍大纲，以及第一章的开头和最后场景，请写出详细的章节大纲，给出该章中的所有场景以及每个场景的简短描述。从下面的开始场景开始轮廓，并从下面的最终场景结束轮廓。

第 3 级：草稿

我：给定以下书籍大纲，以及第一章的详细章节大纲，写出第一章的初稿。标记每个场景。当你到达第一章的末尾时停止。它应该为第二章的故事做好准备，第二章将立即出现。它应该以叙事风格撰写，并且应该长、详细且引人入胜。

第 4 级：段落（边界）

我：鉴于以下本书大纲和第一章草稿，想象一下您已将此草稿扩展为更长、更详细的章节。对于每个场景，请给我第一个开头段落，以及更长、更详细版本的最后一段。将它们标记为开头段落和结尾段落。开头段落应该介绍场景。最后一段应该为接下来的场景奠定故事基础，该场景将立即出现。最后场景的最后一段应该为下一章奠定故事基础，下一章将立即出现。

第 4 级：段落

我：根据以下书籍大纲和第 1 章的草稿，编写场景 1 的更长、更详细的版本。该场景必须以以下段落开始和结束：（这里是开头和结尾段落）

连续性注释

我：请简要记下下面场景中您在编写本书其余部分时需要记住的任何重要细节或事实，以确保连续性和一致性。标记这些连续性注释。

我：将这些注释与下面现有的先前连续性注释结合并总结。

对结果的反思

尽管从很多方面来说，这部作品确实是一部连贯的小说作品，遵循自己的大纲并按照自己的大纲规定的节奏进行，而且有些部分读起来确实令人兴奋和有趣（特别是最早和最新的章节），我很犹豫称其为一本好书。它仍然存在一些奇怪而有趣的问题：

不带介绍的参考：有时，人工智能会参考尚未真正介绍/解释的事物，例如兰登

在第 4 章中了解马拉卡勋爵，或者艾莉亚在梦到尼利亚女王后拥有实体吊坠。感觉你一定错过了什么。

开头/结尾段落周围的接缝：因为开头和结尾段落是在场景的其余部分之前编写的，所以有时它们不能顺利地从其余部分流畅地流动，甚至最终变得多余。某种额外的传递可以帮助解决这个问题。同样，有时章节之间的过渡可能看起来很突然，比如从第 8 章到第 9 章（在迷宫中与马拉卡战斗，然后突然打开通往亚特兰蒂斯的通道）。

忘记某些细节：尽管某些细节保留在连续性注释或大纲中，但它决定删除其他细节，然后它们就永远不会被再次引用，因为它们不再位于输入缓冲区中。一个很好的例子是 Aria 收到的作为毕业礼物的指南针，它感觉很像契诃夫的枪，但后来再也没有被提及。另一个是他们一开始购买的特殊武器，但从未使用过。唯一明确的解决方案是更大的缓冲区或长期记忆解决方案。我考虑了一个更好的连续性注释流程，其中删除了已经可以从章节大纲中推断出的项目，为此类更多细节留出空间，但没有实现这一点。

重新安排：尽管我尽了最大努力，AI还是将一些部分从后面的章节移到了前面的章节，例如岛上的早期场景从第5章移到了第4章，以及早期的迷宫场景从第6章移到了到第五章。解决这个问题的唯一真正方法是要求其随后编辑和更新其高级大纲。这与人类作者的做法类似——他们很少将自己的大纲视为静态和不可侵犯的。

节奏：对我来说，迷宫章节感觉有点艰难。这是一个又一个陷阱室，持续了很长一段时间。这些确实符合原来的轮廓，所以原来的轮廓是问题的一部分，但也有一些方法可以让迷宫感觉新的和不同的。对我来说，这感觉像是 GPT-4 的一个创造性写作错误。

结构过于规则：人工智能几乎总是选择每章编写 6-8 个场景，每个场景大约 1-2 页。与许多人类编写的作品相比，这感觉不太有机，其中一些场景/章节很短，而另一些则较长。开发一个动态扩展结构可能会更好，在该结构中它会继续扩展，直到它在某种程度上满意它已达到所需的详细程度。

不同程度的细节：与此相关的是，一些场景非常详细，包括对话和微小动作，而其他场景（甚至更重要的场景）似乎通过总结轻松地跳过了重要的时刻。同样，我认为某种动态扩展来实现一致的细节水平可能会有所帮助。

一些有趣的笔记

在第五章的场景3中，GPT-4自发地在迷宫中写下了一个他们必须解决的原创谜语。

“我的墙内有一片大海，

但你却看不到一滴水。

人生有许多条路可以走，

但只有一条能带你回家。

我是什么？”

亚历克斯想通了，答案是“地图”。

在至少三个地方，GPT-4 在章节即将结束时巧妙地提到了“她生命中的下一章”或“他们冒险中的下一章”。

经常问的问题

问：在选择保留哪些答案和丢弃哪些答案时，您没有表现出很强的作者控制能力吗？

实际上，重新生成响应的情况很少见，只有当我发现流程存在严重问题，或者书中存在严重的逻辑问题而我无法弄清楚如何通过流程更改来解决时，我才会这样做。这种情况总共最多发生4-5次。至少 95% 的情况下，书中的文字是我从 GPT-4 得到的第一个回复。您可以在我的研究日志的注释中看到这一点。

问：这本书不太好。我认为专业作者不会有太多担心。

确实如此，但这不是重点。这是一个概念验证：人工智能能否从头到尾写出一整本 100 多页的书，同时保持连贯性并遵循最初计划的大纲？不需要人类介入并告诉它如何处理故事或角色？答案是肯定的。而且，我认为某些部分非常有趣。当然，下一个 GPT 模型只会是一个更好的作者。

问：ChatGPT Plus 上的 GPT-4 查询没有速率限制吗？你怎么能在10天内写完100多页？

是的，而且我打了很多次。然而，因为我的提示和 ChatGPT 的响应都很长，所以我能够从每个提示中挤出绝对最大的文本。此外，GPT-4 接受比 GPT-3 或 Bing 更长的提示输入，这有助于确保我可以包含尽可能多的上下文。此外，GPT-4 发布后的早期限制更高。

问：这需要 GPT-4 吗？它与 GPT-3 相比如何？

我之前用 GPT-3 尝试过，但遇到了一些问题，主要是在故事中写得太超前并且偏离了轨道。边界技术可能会有所帮助，我还没有尝试过 - 部分原因是处理较小的输入缓冲区很痛苦。需要进一步调查。

问：我可以使用您的书、流程或提示吗？

请放心，我这样做是为了在空闲时间玩得开心，我根据知识共享零弃权（CC0）将所有这些内容发布到公共领域，并否认任何知识产权。

本文系作者 @ 棠溪原创发布在轻抖云。未经许可，禁止转载。

喜欢 ( 0)