估值200亿的AI公司,要干掉谷歌了?

图片来源 @视觉中国

钛媒体注:本文来源于微信公众号亿欧(ID:i-yiou),作者 | 王鹏,编辑 | 顾彦,钛媒体经授权发布。

是什么让全球科技圈都爱上了分享聊天截图?

继 AI 绘画爆火后,又一款 AIGC 产品刷屏了海内外的社交网络,它就是美国 AI 公司 OpenAI 在 11
月底发布的聊天机器人模型 ChatGPT。

不同于手机上的那些 ” 人工智障 “,ChatGPT
在聊天的过程中的表现令人惊艳,不仅博古通今,文理双全,而且还会写小说、编剧本、敲代码……给人的感觉就像是《钢铁侠》里的贾维斯、《她》里的萨曼莎、《西部世界》里的罗波安,可以说是将科幻电影照进了现实。

12 月 5 日,OpenAI 创始人兼 CEO 阿尔特曼在社交媒体上宣布,ChatGPT 上线短短 5
天,其用户注册人数已经突破了 100 万。就连马斯克都在感叹:” 很多人疯狂地陷入了 ChatGPT
的循环中。”

尽管这款产品的注册流程对于国内用户来说存在一定的门槛,但这并没有影响我们对 ChatGPT
的热情。百度指数显示,从上周一开始,ChatGPT 的相关搜索数据就在火速上升。

图源:百度指数

万众瞩目下,ChatGPT 的各种可能性和局限性也不断被挖掘出来,成为业内人士津津乐道的话题。

被玩坏的 AI 聊天助手

涉及 AI 的东西总是有很多出人意料的打开方式,在深入了解 ChatGPT
之前,我们其实可以让这个聊天机器人做一个简单的自我介绍。

图源:ChatGPT 截图

如图所示,ChatGPT 是一款由 OpenAI
开发训练的自然语言处理模型,目前运行在一个网页上,只需注册一个账户就可以免费使用。和大家在网上见到过的其他聊天 AI
一样,用户直接在对话框键入内容,就可以轻松开启人机对话。

这里还需要插播一条,因为 ChatGPT
是个多语言模型,所以用户在和它聊天时,不管键入任何国家的语言,都能够得到相应的回答。

别看 ChatGPT 从界面到操作上和一般的聊天 AI
区别不大,但它带来的使用体验却是前所未有的。亿欧测试后发现,相较于经常被视为 ” 人工智障 ” 的传统聊天
AI,ChatGPT 至少有四大升级之处。

第一,ChatGPT 是一个 ” 善解人意 ” 的
AI。它能够更好地理解人类语言,即使用户键入了内容复杂的问话,中间还嵌套多层语法结构,也能快速明确用户的需求并对答如流。

第二,ChatGPT 是一个 ” 学富五车 ” 的 AI。它拥有非常庞大的知识储备,可谓是 ”
上知天文,下知地理
“,针对各种领域的问题都能给出看起来很专业的回答。不管是一道家常菜怎么做,还是一个代码怎么写,亦或是一个工程问题怎么解决,它都能有问必答。

第三,ChatGPT 是一个 ” 能说会道 ” 的
AI。它具有连续多轮对话的能力,回答问题时会自动结合上文语境去调整输出的回复,这也就意味着用户可以围绕某一个特定话题和
ChatGPT 展开一长串的讨论,只要你有足够的时间和耐心,来一场秉烛夜谈也不是什么难事。

第四,ChatGPT 是一个 ” 明辨是非 ” 的
AI。如果用户发起的讨论触及了道德和法律的红线,ChatGPT
不但会自动拒绝回答你的问题,还会给出适当的警告和劝告。

这四大核心能力,也是这位 AI
界新明星的魅力所在,让无数人类都忍不住想要向其发起挑战。从社交网络分享的截图看,网友正在想方设法地去刁难这位看起来像是个万事通的新朋友,让
ChatGPT 不断执行涉及各种领域的问答、推理、创作、纠错等任务。

有人请它帮忙撰写邮件、周报、推文、小作文甚至是学术论文;有人请它帮忙检查自己的代码是否存在漏洞;有人拿它当医生,咨询生理乃至心理上的问题;还有一些人破天荒让
ChatGPT 和其他 AI 聊起了天……

当然,大家之所以在这些事上绞尽脑汁,主要还是想探索 ChatGPT 的可能性,毕竟谁不想拥有一个钢铁侠同款的 AI
助手呢?

一言不合就胡说八道

不过,就目前的情况而言,ChatGPT 要化身我们理想中的 AI
助手还有很长的路要走。这里不是说从文字聊天进化语音聊天有多难,而是 ChatGPT 本身还存在很多局限性。

首先,ChatGPT 在自我介绍中也提到了,自己并没有连接到互联网,所以知识面只覆盖到了 2021
年,并没有掌握最新的实时动态,所以你想问它 2022 世界杯谁会夺冠是不可能得到准确回答的。

再者,ChatGPT有时候给出的回答是一些不实信息。这种情况在向 ChatGPT
询问中国诗词的时候最为常见,很有可能是因为相关的训练数据不够丰富。

因为这个问题,知名的程序员问答网站 Stack Overflow 已经明确禁止用户去分享由 ChatGPT
生成的回复,以免传播错误答案从而误人子弟。

此外,尽管 ChatGPT 可以筛选过滤一些不当的问题,但只要我们加以诱导,这个单纯的 AI
还是会毫无保留地相信人类并给出触碰红线的答案。

最后还需要吐槽的一点,大家从上面诸多截图应该也已经发现了,那就是ChatGPT
的回答总是那么冗长。即便是面对一个很简单的问题,ChatGPT
也会回复大量内容,有些内容无关紧要,有些则是在强调自己作为 AI 助手的身份,这一点难免是有些画蛇添足了。

虽然每个人都期待拥有一个贾维斯,但恐怕没有人希望它是一个口齿伶俐的废话文学大师吧。

AI 社牛是怎样练成的

ChatGPT 超越人类预期的对话能力,不仅点燃了广大网友的热情,也让大家对其诞生过程充满了好奇。

首先,ChatGPT 的开发商在行业内很有名气,这家公司名叫 OpenAI,成立于 2015
年,是由马斯克、阿尔特曼等硅谷大佬汇集各方资源合力创建的一家人工智能企业。

AI 公司是众所周知的烧钱大户,不过因为有大佬的无条件支持,OpenAI
一直没有缺过子弹。2019 年,OpenAI 从微软那里拿到了 10 亿美金,并成为其长期合作伙伴。2021
年,OpenAI 又拿到了 2.5 亿美金的 A 轮融资,投资人包括微软、马斯克、谷歌风投、老虎基金等。

据 The Information 报道,成立七年的 OpenAI 公司目前的估值已经接近 200
亿美元,是其 2022 年预计收入的 500-800 倍。

兵精粮足的情况之下,OpenAI
发展迅速,近年来在自然语言处理、计算机视觉以及深度强化学习等方向都取得了不俗的研究成果。尤其是其从 2018 年开始训练的语言模型
GPT,到了 2020 年已经进化到了第三代,成为了全球最强大的自然语言处理模型之一。

虽然历代 GPT 的模型结构没有太大的变化,但是其训练规模却在野蛮生长,处理任务的能力也与日俱增。

根据官方的说法,从 GPT-1 到 GPT-3,其语言模型的参数量从 1.17 亿增加到了 1750 亿,预训练数据量从 5GB
增加到 45TB,其中 GPT-3 训练一次的费用是 460 万美元,总训练成本达 1200 万美元。听,是钱在燃烧的声音。

这个时候有人或许会问,那么前面我们讨论的 ChatGPT,就是下一代 GPT 语言模型吗?答案是否定的。OpenAI
的下一代语言模型其实是还在路上的 GPT-4,有传言称该模型或许会在明年正式面世,甚至还有人表示,GPT-4 能够通过图灵测试,成为
” 和人类无异 ” 的 AI。

至于 ChatGPT,则是从 GPT-3 到 GPT-4 的一个过渡产品,可以说是 OpenAI 在 2022
年基于 GPT-3.5 能力而衍生出的一个语言模型。在此之前,OpenAI 还基于 GPT-3.5
训练了另一个语言模型 InstructGPT,是 ChatGPT 的 ” 兄弟模型 “。

虽然只是中间产品,但是 ChatGPT 和 InstructGPT 对于 OpenAI
的意义却不容忽视。因为这两个语言模型的能力提升的逻辑和之前完全不同,不是单纯地通过增加算力来迭代升级,而是通过引入一种叫
RLHF(Reinforcement Learning from Human
Feedback,从人类反馈中强化学习)的训练方式来让模型更好地完成指令。

事实上,OpenAI 早在今年 3 月的一篇论文中就指出,尽管 InstructGPT 大模型的参数只有 13 亿个,比
GPT-3 少了整整 100 倍,但其在引入 RLHF
训练后能够输出更受用户偏爱的答案。这也证明了每个人在学习时代就深有体会的道理,有时候方法确实比努力更加有用。

要取代搜索引擎了?

从 ChatGPT 的一夜爆火也不难看出,相比于算力和体量,人类在评价一个 AI 模型时,更加看重的其实还是这个
AI 能够为人类社会带来的实际价值。

尽管 ChatGPT 目前还有很多尚未解决的问题,但是这并不影响业内人士对其应用前景的想象和展望。

首先,作为一种通用的自然语言处理模型,ChatGPT
有能力成为各种人机交互场景的沟通者。

目前,AI 技术已经渗透到了人类生活的方方面面,ChatGPT
能够更好地理解自然语言,应对文本分类、情感分析、问答系统等多种任务,这也就意味着它能够为现有的客户服务、教育、翻译、语音助手、数字人等
AI 应用场景注入新的活力。

其次,得益于其强大的信息整合能力,ChatGPT
很有可能会成为传统搜索引擎行业的颠覆者。

过去,像谷歌、百度这样的经典搜索引擎,只是通过抓取网页并进行相关性排名来为用户提供信息,很多时候并不能直接解决用户需求,而
ChatGPT 的回答则是基于 AI
对信息的搜索和整合,对于信息查询需求的反馈往往更加准确,未来如果能够解决目前的问题,得到更多用户支持也是理所当然的事。

此外,在 AIGC 赛道飞速发展的当下,ChatGPT
还有可能会以创作者的身份加入到人类的学习和工作中。

2022 年是行业公认的 AIGC 元年,伴随着技术的日新月异,AIGC
正在打破文本、图像、语音、视频等内容形式的边界,不断演绎出颠覆人类认识的玩法。因为自然语言是人类最原始的创意呈现载体,所以
ChatGPT 就是 AIGC 必不可少的基本工具之一。

以时下火出天际的 AI 绘画为例,AI 绘画生成图像之前,需要用户输入一段文字来描述画面,目前已经有外国网友尝试利用
ChatGPT 来生成 AI 绘画所需要的描述文字,并成功创作出 AI 绘画作品。

最后,让我们把话筒交给 ChatGPT,请它谈谈自己的应用前景。