(相关资料图)
自CHATGPT问世已经过去了半年时间,国内大厂们已经纷纷入局,国产ChatGPT产品争相面世。但目前为止,相关产品几乎都是在弱人工智能的基础上演化而来,离强人工智能尚有距离。为什么“学习能力”一向很强的国内厂商,这一次没有快速追赶上ChatGPT呢?
2022年11月,OpenAI的一记“惊雷”点燃了国内外巨头的竞争欲。
经过几个月的“角逐”,国内第一批ChatGPT产品已经面世。但是,不管是打响国内ChatGPT第一枪的百度“文心一言”,还是三六零(行情601360,诊股)、阿里以及科大讯飞(行情002230,诊股)紧急孵化的各个大模型,似乎都有些“雷声大雨点小”的意味。
要知道,ChatGPT的爆火,是因为其表现出了近乎于人类的语言表达能力、超强的学习能力以及语义理解能力,不仅能够通过微软的工程师测试,还能够撰写学术期刊论文等等。但这些,似乎都没有在任意一款国产ChatGPT产品上体现……
为什么国产大模型,这一次没有追上ChatGPT?
现实差距
国内的AI机器人(行情300024,诊股)、AI识图技术已然“炉火纯青”,相关产品也曾一度风靡海外。
然以AI机器人、AI识图以及视频识别技术等一系列专用人工智能,统称为弱人工智能,这些弱人工智能产品能够回答简单的问题,完成系统预设好的指令,并与其他家电产品联网,营造智能家居系统。
相对于弱人工智能,ChatGPT代表的是一种强人工智能,用户只要对其发出比较具体的提示语,对其提出相关要求,ChatGPT就可以写程序、做翻译、写论文、参加考试甚至进行文化创作,最重要的是,还能“胡说八道”。
“胡说八道是只有人类才能产生的行为”,三六零创始人周鸿祎曾经如是评价过。强人工智能能够覆盖弱人工智能的所有功能,还能够完成弱人工智能所不能完成的任务。
也就是说,ChatGPT的诞生,完全可以倾覆弱人工智能的全部成果。因此,ChatGPT才会引起全球科技巨头的警觉。
而当下国产ChatGPT产品形成于“临时抱佛脚”,带有很重的弱人工智能“影子”。
由此可见,从弱人工智能到强人工智能并不是一次简单的“复制粘贴”,而是一次重大的科技飞跃,甚至可以被评价为时代变迁的开端。
体系互异
一个从大环境角度出发的答案,是两国的创新机制不同。
具体而言,ChatGPT是典型的硅谷式创新产物。清华大学公共管理学教授梁正表示,这个创新生态体系有几个关键的步骤,首先要有创新性的机制,一些企业聚集了一批理想主义的技术天才,走了一条不寻常的道路,最后再由大公司进行投入和资源整合,完成商业化。
在这个过程中,隐藏着三个体系:一是研究型大学,有一批科学家在做探索性的工作;二是使命导向的实验室体系,以国家的使命驱动前沿研究;三是硅谷,基于创新创业和风险投资的商业生态。这三者相互叠加,密切联动,先从0-1突破,在通过大公司注资完成从1-2的工作,从而形成从科研到产业化的良性循环。
ChatGPT的诞生,就是微软重金投资了一家看起来非同寻常的公司——OpenAI,这家公司曾经无产品、无体系,但有一个技术天才,完成了一个又一个的构想,还受到了大资金的青睐,十年后,ChatGPT轰动了全球。
而国内的创新体系大致为,高等学府中的科学家做探索性的工作-这些科学家被高薪聘请到大公司-最后以大公司为背景,对这些探索性研究成果进行投入和落地。
这种体系很稳,且我国在人工智能方面的研究看似也从未停歇。早在2018年,中国人工智能方面的论文在总量和被引论文数量上就排在了世界第一,专利数量排名第二,中国人工智能企业数量位列世界第二,中国人工智能领域的投融资占到了全球的60%,成为全球最“吸金”的国家。
然而,尽管我国人工智能相关论文数量已经形成了一定的规模,论文被引用的次数也颇多,但距离真正的成果还有一定的距离。
不单是研发差距,风投的投资思维差异也是影响创新积极性的因素之一。国内的风投思维仍是“不投没谱的事情”,根据梁正教授的说法,巨头们可能不愿意做获利前景太远的事情,很少有人像微软一样,会押注一家“非盈利”的小公司。
一项倾覆世界的研发成果诞生,可能还需要很多个“临门一脚”才能完成。OpenAI为做出ChatGPT也耗费了大量的人力、物力、财力和时间成本。因此,国产大模型想要赶超ChatGPT,尚需时间。
语言殊途
除了环境因素,摆在国产大模型面前的还有现实因素。
相关学术论文显示,ChatGPT是融合了Transformer和强化学习两项技术。
拆分来看,所谓Transfoemer架构是一种基于注意力机制的神经网络架构,被广泛应用于自然语言处理领域。这一架构能使得ChatGPT能够通过分析输入的语料来理解人类语言的语法、语义,并按照语法生成流畅且拥有较强理解力的应答。
在此基础之上,ChatGPT使用的强化学习技术,通过外界设定的奖惩规则,自主学习,最终在某项具体任务中达到甚至超越人类的表现。
强化学习模型最知名的应用就是DeepMind团队开发的围棋机器人AlphaGo,其在2017年打败了人类最顶尖的骑手柯洁。DeepMind团队还开发出另一项颠覆性的研究——AlphaFold数据库,在蛋白质结构预测上远远超越人类,并在2022年宣布预测出地球上几乎所有的蛋白质结构。
简言之,就是ChatGPT需要先理解人类的语法、语义,再通过收集大量资料、不停完成训练、反复学习才能够达到当前类似于人类,甚至超越人类的表现。
而国产ChatGPT在这两项技术方面都略逊一筹,一方面是数据库容量,而更重要的是中、英两种语言结构的天然差异。
当前的ChatGPT是基于英文的,英文能够让ChatGPT通过词缀、词性、标点符号等,更加方便的将相同词缀的词汇构成并列。如以ing结尾的词汇,可以被ChatGPT快速并列为进行时态的词汇。而中文的正在进行时表达则相对多元。
另外,英文句子的结构是网状的,理论上,在语法正确的情况下,一句英文可以由一万个词汇组成,一个句子中能够有N个谓语、非谓语、从句等等。
反观中文,一些词汇能当动词也能当名词,一个词汇的褒贬含义还需要结合上下文理解,标点符号代表的含义也多有不同,学习起来并不容易。
除此之外,强人工智能代表的是人类知识的集大成者,而大多顶尖的学术类论文、文献、资料等都是英文。这也意味着ChatGPT的学习知识库远比国内的大模型要丰富,
芯片掣肘
先天条件遇到门槛,硬实力还遭遇了“卡脖子”。
据了解,ChatGPT的训练过程需要耗费大量的计算资源和时间,这需要企业具备强大的计算能力和相应的设备。
资料显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),需要7至8个投资规模30亿、算力500P的数据中心才能支撑运行。
支撑这些算力的,就是英伟达研发的全球顶尖的A100和H100智能芯片。有声音认为,即便是部署1万块英伟达A100显卡,也要持续不间断运算10年才能达到当前ChatGPT这样的算力高度。
但目前,这两款芯片在全球具有不可替代性,而英伟达A100和H100已经被限制出口中国。
为了继续占领中国市场,英伟达已经针对中国推出了中国特供版A800,但这两款芯片存在明显的性能差距。H100芯片的中国特供版也即将研发完毕,很快就能在中国上市。但芯片上的差距总是牵一发而动全身,单个芯片功能不足造成的时间差将导致国内AI花费更多的时间解析同样的数据。
有了芯片,还需要带动芯片的超级计算机。2020年,微软购买了28.5万个CPU和1万个GPU,联合OpenAI打造了一台AI超级计算机。根据2022年的全球超级计算机排名显示,这台超级计算机位列全球前五名。
虽然,我国的神威·太湖之光、天河-2A超级计算机也挤进了前十名,但有关分析显示,这两款超级计算机主要是用来做科研的,几乎不可能用来给科技公司做AI大模型的训练。
或许当前国内的大模型还处于微创新阶段,谈赶超ChatGPT为时尚早,但在巨头们的百舸争流下,有望形成两强格局。
关键词:
-
国产大模型离ChatGPT还有多远?
自CHATGPT问世已经过去了半年时间,国内大厂们已经纷纷入局,国产ChatGPT产品争相面世。但目前为止,相关产
-
爱仕达:林菊香质押330万股,约占总股本0.97%
乐居财经邓如菲5月12日,爱仕达(SZ002403)发布关于公司实际控制人股票质押的公告。
-
当前热门:台州困难高校毕业生临时生活补贴申领流程
台州困难高校毕业生临时生活补贴办理流程1 申请对象向参保地公共就业服务机构现场或网上提交申请材料,并选
-
2023年11月FRM考试可以申请延考吗 当前报道
2023年11月FRM考试可以申请延考,确实由于特殊原因需要申请FRM考试延考的考生,可以向GARP申请延期,待审核
-
智汇广元 弈动四川|四川省第二届智力运动会在广元开幕
四川新闻网-首屏新闻广元5月11日讯(记者李全民摄影报道)5月11日晚,由四川省体育局、四川省体育总会、广
-
世界快资讯:昭通永善:执文化之笔绘乡村振兴蓝图
今年以来,昭通市永善县精心探索,不断实践,立足历史文化资源特色,深入挖掘“善”文化底蕴“富矿”,从异
-
国际象棋超级巡回赛第五轮 丁立人不敌费鲁兹贾|天天观焦点
丁立人不敌费鲁兹贾(主题)今晚报讯(记者谢晨)2023年国际象棋超级巡回赛昨日在罗马尼亚布加勒斯特战罢第
-
下一站英超!内马尔拒绝回归巴萨,离开大巴黎成定局,曼联有机会-全球快报
虽然说内马尔和大巴黎的合同还有4年的时间才会到期,但是对于提前结束自己的大巴黎生涯,对于内马尔来说已
-
环球时讯:阜阳:降“三公”经费 增民生投入
记者5月10日从阜阳市财政局获悉,去年以来,全市财政系统全面贯彻落实政府过紧日子要求,念好“严、紧、控
-
环球快播:2023中国纤维流行趋势对接交流活动走进安踏、德润纺织
5月8日,新一季“纤维之路——2023中国纤维流行趋势对接交流活动”正式启动。当天,中国纤维流行趋势一行走
-
即时看!王廷科获选中国人保董事长
王廷科获选中国人保董事长,王廷科,非执行董事,中国人保董事长,中国人民保险集团
-
换机要等618吗?一加魅族小米这三款上市就真香,可等可冲 全球微资讯
在影像与续航上,一加Ace2也没有缩水,给到了5000万像素IMX890旗舰传感器、5000mAh大容量电池+100W超级闪充
-
央行:4月人民币贷款增加7188亿元,同比多增649亿元
北京商报讯(记者廖蒙)5月11日,央行发布2023年4月金融统计数据报告。数据显示,4月末,本外币贷款余额231 2
-
一彬科技(001278)5月11日主力资金净卖出74.92万元
截至2023年5月11日收盘一彬科技001278报收于2104元下跌164换手率552成交量171万手成交额360667万元5月11日
-
原子之心怎么移动拖车_移动拖车 环球资讯
1、不可以,公民没有权利去拖动不是自己的车。2、如果是这辆机动车停放的位置,影响了自己的出行,可以打车
-
精选!专职安全生产管理人员c1c2c3_专职安全生产管理人员
1、专职安全生产管理人员不是安全员。2、一般企业的安全员属于行政部门或人力资源部门,主要负责企业的所有
-
【全球报资讯】庸人自扰的意思翻译_庸人自扰的意思
今天小编肥嘟来为大家解答以上的问题。庸人自扰的意思翻译,庸人自扰的意思相信很多小伙伴还不知道,现在让
-
研究生入学考试科目有哪些_研究生入学考试科目
1、研究生国家统一考试科目一般包括外语、政治、专业课和综合。2、研究生入学考试是指教育主管部门或招生机
-
詹姆斯:我职业生涯20年效力过的球队都不喜欢假摔-全球实时
詹姆斯:我职业生涯20年效力过的球队都不喜欢假摔,科尔,nba,中国篮球,美国篮球,湖人主场,勒布朗詹姆斯,国际
-
传媒板块午后持续井喷,Wind电影与娱乐指数暴涨9%_天天报道
【传媒板块午后持续井喷,Wind电影与娱乐指数暴涨9%】传媒板块午后持续井喷,Wind电影与娱乐指数暴涨9%,27