他用 GPT-3 实现了「量子速读」

你是否曾为了查一个问题,翻书翻到头秃?

要是书里有的内容,一问便知就好了…… 等等,“一问便知”,这怎么有 ChatGPT 那味儿了?

话说,有人还真就由此思路开发出一个聊天 Bot,做示例的书是马可・奥勒留的《沉思录》(全书共 12 卷,497 则)

只用几分钟,AI 就能记下全书内容。

然后随便问个书里讲过的东西,比如“如何处理负面情绪?”,AI 可以快速扫描文本并给出高质量回答,甚至还一条条给你列好。

原帖一发布,网友纷纷围观点赞。

开发者 Dan Shippers 称,做出这个 AI 并不难,主要功臣就是语言大模型 GPT-3,另外再加几行代码就搞定了。

另外,这哥们儿甚至还嗅到了一丝商机:

网上现在有很多受版权保护的文本、音视频资料集,都能被做成聊天机器人!

对想获取信息的人来说,有时一看给了钱自己还要慢慢整理,可能就放弃了;而要是能通过 AI 快速锁定目标内容的话,应该会有更多人愿意自掏腰包。

怎么做出来的?

用 Dan 哥的话来说,Bot 制作过程主要分为 3 个步骤

首先,当然是找到整活的素材。比如整本《沉思录》。

Dan 哥从网上下载了《沉思录》原著,将其保存在 Google Dive 的一个文件夹中。通过 Google Drive,用户可以将文件存储在云端,并在设备间同步、共享。

然后再在谷歌的云端编程平台 Colab 上,运行下面这段 Python 代码,既能访问 Google Drive,还能轻松实现与 GPT-3 的互动。

Dan 介绍称,GPT-3 能以任何文本素材为基础,给你整出一个聊天 bot。

不过有个问题:单次能向 GPT-3 输入的文本字数是有限的。

所以第二步,就是访问存在 Google Dive 上的那个文件夹,再把整个文本素材划分成一个个小块,存到新的文件中。

第三步,当用户提问时,先通过 OpenAI 的 API 访问书中包含相关解释的小块内容,再把这些内容传到 GPT-3 中,整理出语言通顺的回答。

具体代码如下:

到此,为整本《沉思录》专门定制的聊天机器人就做好了。

除此之外,基于此基本思路,Dan 哥又把他喜欢的某系列播客节目也做成了聊天 Bot。

他说自己曾在节目中听到一个感兴趣的名词,但忘了是啥意思。平时想弄明白的话,不得不把一集内容重新听一遍。

但现在有了聊天 Bot—— 重听?不存在的。

Dan 是何许人也?

话说回来,能从聊天机器上人看到新的商机,Dan 哥的过往经历或许也产生了一定影响。

他本科毕业于宾夕法尼亚大学的文科类哲学系,但这位哥其实还是个技术大佬。

他从小学 5 年级就开始编程,在大学期间又和小伙伴创办了一家软件公司 FireFly,收入在六位数以上。

他还在上大二时,不少科技公司就已抛来橄榄枝,但人家都拒绝了,说是想先完成学业。

大学一毕业,他把 FireFly 卖给了知名业务软件公司 Pegasystems,赚到第一桶金。

紧接着,他在 Pega 担任起项目负责人,并把业务部门的收入提高到百万美元级别。

再后来,他从 Pega 出来,于 2020 年又创办一家公司 Every,主要创作商业类简报和播客,目前已有 6 万 + 订阅用户。

(怪不得他会想到把播客内容做成聊天机器人)

目前除了自己开公司,Dan 还兼任红杉资本的 Scout,为风投者出谋划策。

参考链接:

  • [1]https://twitter.com/danshipper/status/1620464918515302401

  • [2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast

  • [3]http://danshipper.com/

本文来自微信公众号:量子位 (ID:QbitAI),作者:Alex

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注