ChatGPT能写论文?OpenAI赢在人情味?国内AI哪家强?编辑部关于ChatGPT的讨论

2023年 2月 13日

本文约9000字,分为三个部分:

一、ChatGPT现在能做什么

二、OpenAI的人性化商业模式

三、ChatGPT的核心技术与追赶难度

一、ChatGPT现在能做什么

苟住:

我有一个问题,首先我想问一下各位文科的硕士博士,用ChatGPT写的论文能满足发刊的标准吗?

 

小明:

我认为现在还不可以,但是照这个趋势以后是可以的。

去年在一家公司实习的时候,我曾用OpenAI写过英文论文。当时OpenAI还没有推出ChatGPT,但是已经有了写文章相关的功能,除此之外还有写文案,帮你修改文章、语法、句法的这些服务。它是按照字符收费的,一个月的套餐可以买一定数量的字符。

 

文章我是这么写出来的:先由我自己构思出文章的整个框架,在这些框架里我再把它细分成每个小节,进而根据这个小节所需要内容和方向,输入一些写作指令和关键词进去,系统会根据这些关键词生成一段话。这段话大多时候是很短的,而如果你输入的关键词比较合适,它可以会生成一个比较长的一段话。当生成的段落足够多了,再把它们人为地组织起来,如此一来就能形成一篇比较像样的一个小论文,至少很难让人看出是AI写的。

 

在这个过程中我体会到了OpenAI写作功能的厉害的地方。对于每一个关键词,AI系统都会有一套语料库来支撑它,当输入某个关键词之后就会激活与之相关的语料。如果不添加其他关键词,它的展现就非常有限。但是当你输入多个关键词时,AI系统可以帮你建立起这些概念的深层关联性,而不仅是字面意思的简单关联,这是最令我感到惊讶的地方。并且,它会给出一个基于深层理解的评论和看法。这就与我们平时在搜索引擎中输入关键词查相关资料的感觉完全不同。它好像读懂了这些资料,然后再告诉你答案。

 

在最近大火那个ChatGPT中,大家的感受也是,在聊天过程中就体会到它原来不仅仅可以搜索一些资料,而且还可以读懂你这整句话里面的意思,能进行语义上的理解。所以我觉得它虽然现在还不可以进行文科论文写作,但以后肯定是可以的。

 

小刘:

我不知道以后怎么样,但是现在看这个AI系统还无法识别出真实和虚假信息

 

我看到网上用它的人,在列参考文献的时候,AI列出的不是真实存在的参考文献,而是自己创造了一个参考文献。比方说你输入明朝相关的,它会给你列出“明代商务志”,但是这个东西实际上是不存在的,但是它硬生生的创造着东西出来。

 

实际上ChatGPT可以创造出很多合逻辑的虚假信息。因为它现在不是基于严肃的科研论文,而是网上存在的数据。它能够给出看起来非常合逻辑的一个假的东西,让外行人很难分辨出来。这个事情就让它可以变成一个非常危险的工具,人们可以通过ChatGPT创造一个现实中不存在的一系列的虚假信息的系统,它不是一个单方面虚假信息,而是一套系统性的虚假信息

 

所以我觉得这个东西虽然对文科论文会有帮助,但是其实它内在并没有遵从科研学习的逻辑,它也把握不了这个学习逻辑。结果就是它会形成虚假信息系统,让以前的片面的虚假信息变得成体系了。

小明:

刚才小刘说到的虚假信息的问题,我认为恰恰凸显出这次ChatGPT破圈的一个关键点不是在于它的准确性,而是它的拟人化

 

如果你让它去判断一件事情的真伪,它确实没有这个能力。但是这对于普通人也一样。如果没有学习足够的相关知识,让一个普通人去讨论明代的事情,他也难免会说出虚假的信息,这是知识局限性导致的,对于AI也是同理。这就像一个小孩子记错了知识,或是在网上看到了错误知识之后,答错了题一样。和人一样,如果它被投喂了相关论文或考古证据,想让它拥有辨别真伪的能力并不难

 

相反,我认为它在拟人性上的突破是非常惊人的,ChatGPT的说话方式已经非常逼真了。之前图灵曾提出一个“图灵测试”,大意就是说如果一个机器对所有问题的回答让人无法与人的回答分辨开来,那么就可以说这个机器具有了人的智能。ChatGPT可能已经可以通过图灵测试了,它或许已经到达了“弱人工智能”到“强人工智能”的临界点。

图灵测试漫画)

明公:

OpenAI的归纳法已经远超人类了,演绎法也处于临界点。

 

潇潇:

我一直在用ChatGPT,我的一些朋友们也在用,我来说一下我的看法。

 

我的美国朋友和我说,AI写论文现在还不是很好用,但是它有一个很大的优点是可以帮你润色英语和文章。它可以使用很高级的语句,所以至少可以替代留学中介的文书工作,以及文章优化之类的工作。

 

再有就是我们金融圈很多人已经在尝试着用它来写报告了,并且写的还不错,至少可以达到中等水平,当然目前还达不到上等。不过它需要你很有技巧地去引导它,就像刚刚小明说的,你需要把很长的论文拆分为几块,再给它一些具体的明确要求。

 

还有就是我自己的尝试。我尝试过用它写文案、写小说。我发现它写文案是完全OK的。我后来还发现美团外卖那些骑手发的短信文案很多也是ChatGPT写的。包括小红书上那些简短的文案,很多也是。

 

网络小说的话,暂时还写不出很生动的小说。但是它有一个非常厉害的地方,就是逻辑能力极强。我曾给它描述过一个限定的情景,我问它你觉得这个故事后来可能会有怎么样的走向。它竟然可以罗列出所有可能结果,有些是你作为作者都没有想到的结果和走向,但是它能告诉你。

 

我觉得它可能暂时不能够完全替代一个人去做什么,特别是这种比较高端的智力创造活动,但是你已经可以把它当成一个小助手、小助理,让它帮你去做一些事情,或者是在对话中让它给你启发。

 

关于小刘提到的辨别真伪的问题,我也和小伙伴们讨论过,大家觉得辨别真伪确实是一个比较难的问题。再有一点,我认为很快我们会面临ChatGPT带来的这种信息到轰炸,因为大家发现这是一个能够解放生产力的东西,而且它能够赚来流量,所以之后可能很多互联网平台就会充斥了这种海量的信息。我觉得可能会出现一种情况,就是道高一尺,魔高一丈,有这么一类号会专门的教你辨别说这个东西其实是AI写的、假信息。

小明:

我认为只要信息是有用的,是不是AI写的不重要。

 

信息轰炸这个也可以用AI来解决。你完全可以直接问它,今天的金融头条和重点新闻有哪些,让它帮你筛选罗列。让它不仅仅是一个生产信息的助手,还是一个整理信息的助手。

 

潇潇:

没错。虽然这里还是有一些问题。比如,你不知道它给你提供的信息是不是中立的。它可能有一些政治倾向、夹带私货,这时我们的信息就会被污染。

(特朗普声讨“假新闻”)

二、OpenAI的人性化商业模式

 

明公:

大家可以思考一个问题,在中国为什么腾讯可以反超百度?在过去,百度一开始碾压腾讯的。但是没过多久,也就三四年时间,腾讯就实现了对百度的反超,现在基本是十几倍市值的差距了。

 

从中我们能看到什么呢?从产品的角度看,用户与百度的沟通可以理解为是“理工型”的,就是说我们输入一个东西,百度给我们一个东西。与我们对话的不是一个“人”,在我们使用百度软件的时候,感受不到人文层面的关怀。最有人文情怀的百度贴吧,后来也被玩坏了。

但是反观腾讯,你会发现,它的所有产品,从聊天室、QQ到微信,甚至后来的游戏,都是本质上由人在提供服务的产品,而不是机器提供的。

 

那么我们再来对比现在OpenAI和其他AI的区别。其他的AI走的思路很多都是之前那种搜索引擎的思路,实际上就是你给我一个问题,我给你一个准确的回答,因此更像一个智能“机器人”。而OpenAI整个思路不是追求正确率,它追求的是像“人”。说OpenAI你可能能对其他的AI形成一个反超,并不是它的能力度更强,而是因为它更像一个人,我们更容易接受。在思路方面我觉得OpenAI与腾讯有相似之处。

 

这在很多产业中都能找到共性的东西。比如To B和to C的差别,或者甚至可以说苏联和美国之间这种竞争上的差异。苏联的生产更多追求高效性和有效性,而美国的产品则是最终是要回归到民用,要让老百姓能用得上,最终的成本才能降得下来。而苏联的话,即使你这东西做的再先进,比美国先上太空了,但是你的成本降不下来。我觉得这些的思路与马斯克是一脉相承的。他的所有思路都是把这个成本降下来,让产品的成本降到足够低,不论是火箭还是汽车,甚至是人工智能。其实你可以看到,我们用OpenAI是付费的,但要是用ChatGPT的话,它就是免费的。它把这个东西降到足够低之后的话,就可以用大量的人来来训练ChatGPT。

 

小明:

刚才明公讲到一点,和人打交道的经济模式。ChatGPT确实让你感觉在和人交流,它甚至会和你道歉,比如它如果发现前面说错了,在后面接着说的时候会首先给你道歉。这里面有情绪价值的传递。

明公:

我前几天文章也说过这一点。它和之前的AI对比,之前的AI就像是电视新闻主持人,而ChatGPT更像一个互联网大V,它在说错之后完全可以做到“第二天反对前一天的自己”。它本质上是在顺从着用户来说事情,面对问题时不管懂还是不懂,都会利用它有限的知识,把一些东西组合并展现出来。相比来说,电视新闻主持人就不能说错误的东西。如果问到他不知道的东西,他就会避开问题不去回答。

 

正是这种不冰冷的人情味,让ChatGPT迅速从小众的产品变成大众的。

小唐:

我想补充一下明公刚说的归纳能力,补充一点例证。

 

我特别同意您说的ChatGPT有很强的归纳能力并将突破演绎能力。我们经济学有同学尝试去用了一下。经济学最重要的是机制,对于一个原理、一个经济事物机制的归纳和分析。有同学问它两个经济现象之间的机制联系,它得出来的结论,反正我们自己看来,这个水平如果去投顶刊肯定不够,但是如果再配一些实证去投某些C刊可能还是有戏的。它对那些很水的论文一定是有很强的替代效应。

(电影《her》讲述人类与人工智能相恋)

三、ChatGPT的核心技术与追赶难度

 

小丁:

是这样的。我从技术上说一下吧。

 

ChatGPT用的逻辑是一个回归的逻辑。之前所有做对话机器人用的都是理解的逻辑,不是回归的逻辑。之前那些做自然语言处理做的都是去尝试理解你的话,包括你给它一篇文章,它要理解语义和语义之间的联系。之前所有自然语言处理都是走的这条路,包括Google也在走这条路。OpenAI它只做生成,它所使用的技术完全不管上下文之间的关系,就是说我学到了全世界所有的知识,我把世界上所有的知识全部混杂起来输出给你。

 

而它的逻辑能力是从代码学习那里搞的。它不仅有生成文字,它还有生成代码的功能。它在学习代码的过程中学到了逻辑能力。

 

在这个过程中出现了ChatGPT这个产品。它应该是领先Google大概半年到一年。Google内部也有自己的机器人,我不知道大家知不知道去年那件事?去年的时候Google有一个程序员说它们内部的机器人是有生命的,然后被公司开除了。ChatGPT这种对话机器人只有OpenAI或者说只有马斯克这种人能搞出来,因为如果像Google这样的公司如果搞出来这种事情肯定会有公关问题。

 

对一些国家也是同样,这个东西跑出来,肯定是要被政府打压的。其实在美国也是被打压的。它跑出来了之后,现在整体是领先Google半年到一年,我自己感觉是领先国内2~3年,而且很有可能它一进步又把国内甩开5~10年。

 

它这一套算法已经是不开源的了,在三年前大语言模型训练还都是开源的,从GPT3开始就是不开源的,因此国内的复现能力就彻底被甩开了。也就是说,ChatGPT技术背后它其实做的是生成,但是这一块之前很少有人做过,而且它是不开源的

潇潇:

小丁,我有一个问题想请教一下,你觉得这个东西它追赶起来的难度在哪里?

 

因为是这样的,我跟一些科技的投资人们聊,他们其实会有一个担心,他们会认为这些东西最重要的就是我的团队,实际上我只要花高价把这个团队挖过来让他们帮我做,他们很快就能做出差不多的东西。所以之前科技投资人们可能在AI这块投得并不会多,他们更会偏向于去投一些硬科技的,就是我们说所谓的现实能落地的这种东西。你觉得AI这块如果真的想做,这个东西的壁垒很高吗?还是说只要我砸钱去挖团队就可以解决?

小丁:

我自己的理解是看你想要一个什么样子,如果你想做一个仿制品,没准我雇个5000万外卖员每天帮我标注,也能生成一个差不多活灵活现的机器人。

 

但是你想完全复现这件事情,这个事情它的失败率非常高,就只有OpenAI这种纠集了全世界最强的科学家和工程师,每年投入几个亿的美金还看不见成果的公司才能做出来。还是要面临很大概率的失败来做这件事情。

 

国内很重要的一点,现在找不到一个领头人。我们还专门扒过清华的那些院士,还有国外的那些华人,包括海外华人做AI的,很难找到一个人能够把1000个顶尖的工程师和科学家聚集起来,每年投入几亿美金到几十亿美金,而且还不一定保证能干成。

 

这件事情如果想复现,我是觉得很难的,而且是3~5年或者说5~10年都不一定能成功,每年都投入几亿美金。其实是卡在第一步,没有领头人,现在找不到这个领头人,华人AI界找不到一个适合干这件事情。

明公:

我从另一个维度来说一下这个问题。

 

所有的前一时代既得利益者,在下一个时代来临的时候转换起来都特别困难。封建王朝时期的中国长期发展不起来资本主义,很大的一个原因就是因为在封建主义,我们任何一个发明的“奇技淫巧”,一方面会直接冲击到所谓的百万槽工他们的就业;第二,会冲击到漕运利益集团本身。明朝和清朝漕运集团,整个朝廷官员一半的收入基本上都是来源于漕运。

 

在改革面前,我们有两座大山,一个是就业大山,还有一个是既得利益集团大山。类似于像滴滴,滴滴就是很直接的一个例子,它直接影响到的就是中国庞大的出租车,以及地方监管利益集团。你想要把它最终变成一个合规的,这事如果想要办成,这个东西必须要有全球性质的政治正确。

 

投资者是不敢来搞带头人的。为什么?当你真正想明白了这个事情,你就知道你做这个事情是开创一个新的时代,是和整个旧的时代去做对。正常来说,没有人脑子会这么傻去做这个事情。当你的财富或者你的能力到这个层面上之后,一般人就不会去做这种事情了。

 

同样这个其实也适用于美国,只不过美国全球化的利益集团由于过去这些年的冲击,它已经变得很薄弱了,所以OpenAI其实反而更有可能性是在美国出现,因为美国实际上是被全球化冲击后已经去工业化了。对他们来说,这些AI取代效能是对资本更为有利的。

 

在我看来OpenAI是一个跨时代的产品,代表着一个新的时代的到来。这个时代是类似于一次工业革命时代的出现。但是并不是说OpenAI的生产力有多高。在我看来OpenAI最杰出的东西是什么呢?是ChatGPT。ChatGPT是什么呢?在我看来是一份《新青年》的报纸,是一个宣言,它能把更多的人号召起来了去参与这件事儿。它的伟大是在于发动了更多的群体去参与这件事情,而且把这个事情变成了相对政治正确的一件事情。否则你可以理解为举个例子,在中国,社区团购这种APP都有很大的阻力,因为它侵犯了小商贩的利益。同样ChatGPT其实也是一样,它侵犯了更多群体工人的利益。但是由于这一轮炒作,实际上它变了一个相对正面、政治正确的东西了。在这之后,很多人再去跟着做,就没有了阻碍。站在中国的角度,ChatGPT是“十月革命的一声炮响”,给中国送来了AI。

(古代漕运图)

小丁:

我的感觉是,国内的资本全都在往硬件转。这件事情是主观的,而不是客观的。客观来看,这些硬件不值这么多钱,但是资本就把这个东西吹到了那个价格,然后一级市场整体去炒热这件事情,这是一个无奈的现实。

潇潇:

你已经回答了这个原因,就是硬件不是说硬件本身值钱,而是硬件它不是几个人的出走就能够带走的东西。因为投资的话,你投资的是一个公司,投资人是要担心自己的钱会不会打水漂。如果你像软件一样,只要我随时挖走这个团队,我就可以另起炉灶,实际上就意味着我这个产品它真正的具有垄断性的技术、不可替代的东西,其实并没有留在这个公司里,所以投资人肯定是有这方面的顾虑。

 

金融这个行业很简单,它只看一个东西,就是怎么赚钱。大家说的再怎么天花乱坠,最终总是要退出的。我怎么能够尽快地高回报率地退出赚到钱,这个就是核心。像比如说我投了这种硬科技,你别管我是不是在跟风炒作,但只要这个东西国资会接盘,我能赚到钱,这个事情就完事了。我怎么能够风险更低的赚到更多的钱,这永远是金融这个行业的第一原则,就是你不需要去看他怎么吹,说我们是不是长期主义,是不是划时代什么的,这些都不重要。

 

但是刚刚明公说的我觉得挺有道理的,其实我之前也想过这个问题。我觉得科技也是有细分的,有些科技是“亲资本”的,有些科技是“亲劳动群体”的。所有这种科技如果它是奔着去代替人工的,那么其实它最终是亲资本的,像自动驾驶,它会使得很多劳动力暂时可能一下子没有工作了。但是这个方向对美国就不会是一个阻碍,因为美国现在本来就是这样一个资本的运作,所以AI它肯定是会出现在这样的国家中。像我们这种重度依赖于劳动力的国家,可能就比较难率先出现AI。

 

但是我感觉形势会发生变化。当 AI没有人做出来的时候,从零到一没有人突破的时候,博弈的平衡没有被打破。但是现在比如说已经出现了这种划时代的应用,这个时候你能做的事情就只能是加入这个浪潮,至少你要能有制衡的手段。所以我是觉得国内肯定是要在这方面就要进行追赶了,不可能就是留着这个弱点,等着别人来干自己。而且即使你追不追赶,实际上大家都还是会自发的去用它,因为大家已经认识到这个东西的前景,认为这个东西有利可图。它只要有利可图,就会有所有的人蜂拥的去干这个事情,这里面有淘金的机会,所以这个趋势是不可阻挡的。

小明:

对,已经形成共识了。

刚才小丁说到OpenAI的逻辑能力纯是靠代码生成训练出来的。我觉得这个倒是挺有意思的。因为ChatGPT给我们的感觉,它好像自带情绪。但情绪这个东西怎么通过代码的生成来训练出来呢?

小丁:

不是,我的意思是,它说话是自成逻辑这件事情,是靠着去学github里面的所有的代码库。这件事情目前还没有理论上的解释,都是实验上的证明。

 

GPT的发展历史就是先有GPT,又出了一个CodeX。CodeX在2020年、2021年的时候就已经运用在github里面了,有很多写代码的人已经开始用了。在之后再进一步生长的时候,在不停地去做测试的时候,就发现了这个代码生成器是可以说出来逻辑自洽的话的。我们可能之前见到的那种聊天机器人很少有像这样能生成这种逻辑闭环的话的,说出来的东西大多是驴唇不对马嘴的。这件事情正是ChatGPT要领先于Google的一个很重要的点。

 

我感觉中国很有可能搞这件事,但是最后搞什么样子,可能用的两三年前的技术,或者说是就落后于美国5~10年的技术,但是配上了人力,相当于我们就数据标注。他们用的是自监督学习,就不需要标注数据,但是我们可能会雇个5000万人,就标注数据标注完了之后,最后生成了这个结果可能跟它差不多,也算是一个聊天机器人。

小明:

你的意思是说找一些人专门去训练它是吗?不是通过市场化方式去训练?

小丁:

AI最前沿的追求就是要摆脱数据,或者说是用交互的方式来把这个数据给获取掉,不停地建立更好的模型。至于某个阶段展现的效果只是副产品。

 

这里我还可以补充一个故事。GPT3在2020年的时候就发布了,在去年年底的时候,OpenAI的CEO说我们不推出GPT4了,我们先基于GPT3搞一个ChatGPT先发布,当时内部是有很多的反对意见的,内部很多人是觉得这东西不好玩。然而谁也没想到发布之后会引起这么火爆的这个市场行情。

 

也就是说,ChatGPT只是一个他们追求过程中无意的成果。如果我们只是为了追求效果而去模仿,那么内核其实是完全不同的,而且这个差距会越被拉得越来越大。

小明:

你觉得从内核发展角度来看,现在国内哪一家企业最有希望?

 

小丁:

我认为是字节跳动,字节跳动最有可能。腾讯排第二。因为字节整体就是一个信息流,它的AI技术能力也都可以,它和腾讯都有稳定的收入来源,因此是可以持续地在这方面做投资的。还有就是“智源社区”是一个跑得比较快的,我感觉也就这三个机构是还可以的。百度其实我个人是非常不看好的,虽然它炒的是最热的。

潇潇:

我有一个问题,之前有一个投资人跟我说会有一个问题藏在GPT下面,往下迭代的话,它可能会有一个问题是关于算力能不能支持的问题,或者算力和它的成本能不能够支持的问题,我想问一下小丁知不知道,这块如果大家做训练的话,它的算力消耗是否会成为问题?

小丁:

对于OpenAI的话,算力这件事不成问题。

 

GPT3和ChatGPT是用了1万块的英伟达的A100,相当于1万块就是1亿美金,整体的硬件投资在5~10亿美金,这个价格是挺恐怖的。最新一代的GPT是大概用了2.5万块的A100。英伟达最新推出的一个新系列的产品,训练速度大概是上一代的6倍。以这个进步速度来看,现在模型参数已经是1000多亿了或者是几千亿了,不可能再往上高了,再高连数据都跟不上了。所以这一块硬件应该不是美国技术发展的瓶颈

 

但是H100和A100好像都对中国封锁了,尤其是H100中国是用不了的,所以中国在这方面是瓶颈。现在全世界的A100,50%在微软那里,微软云和亚马逊云也会抢英伟达的芯片。全中国加起来占了世界上的10%的A100,这是中国的瓶颈。美国没有这个瓶颈,美国的硬件进步速度是够的。

(英伟达H100评测图)

小明:

按你这么说,中国不还是应该先发展硬件吗?

小丁:

哈哈,对,但是英伟达追起来难度太高了。

小刘:

现在主要的问题不是芯片设计问题,是芯片生产的问题,中国突破不了这个瓶颈。中国2022年11月制裁之后,它也进口不了这些先进的AI芯片。

小丁:

设计也有问题,设计也很难追的。因为英伟达本身在美国也没有竞争对手,现在全世界用于训练的芯片,80%以上是英伟达的,甚至还有往高了走的趋势。这个硬件就是你一开始做的不如别人好,人家往后性能既比你好,价格又比你便宜,想追赶的话5~10年可能都不一定追得上。

 

所以现在实际上中国一方面又造不了,另外一方面又买不了,买不了的结果就是这些大的软件企业,它在算力上始终就有一个极限在。

 

小明:

好的,谢谢小丁。关于这个话题,我想我们讨论的已经挺充分了。感谢各位的参与和发言。

xitalk

这个人很懒,什么都没留下