??美国公司OpenAI推出的人工智能聊天机器人ChatGPT“火”出圈了,上线两个月就收获了1亿月活用户,成为历史上增长最快的消费级应用程序。这个速度打破了此前由字节跳动旗下短视频社交平台TikTok创造的9个月收获过亿月活用户的纪录。
??这款“现象级”产品背后预示着什么样的未来?中国有开发类似产品的基础吗?
??竞争已至
??在社交平台展示自己与ChatGPT的对话截图,已经成为一种时尚。它可以用自然语言和人类用户对话,理解用户意图,完成写论文、写代码等各种内容生成任务;还可以展现“学霸”光环,在沃顿商学院通过了MBA考试、在明尼苏达大学通过了法学院考试……
??“ChatGPT是人工智能领域的又一次革新,将会推动新一轮的AI(人工智能)模型竞争。”远鉴信息技术有限公司首席技术官郑榕认为,ChatGPT的最大贡献在于基本实现了理想型语言预训练模型的接口层,让机器人学习适应人类的表达方式,而不是反过来让人类学习可以命令机器的指令,这是一种更符合人类表达习惯的人机接口技术。
??ChatGPT的火爆对产业界、学术界都带来了巨大的冲击。
??“2016年以来,我国人工智能产业规模呈现迅猛增长态势,但2019年我国人工智能投融资出现大幅度下跌。”赛迪顾问股份有限公司副总裁宋宇认为,总体来看,人工智能发展退潮主要还是缺乏支撑产业快速发展的技术突破,而ChatGPT的出现恰好给行业发展和投资带来了新动力。
??高科技投资机构方舟投资发布报告预测,到2030年,AI将大幅提高知识工作者的工作效率,平均工作效率增加140%。“新一代人工智能技术将有可能大幅度降低脑力劳动者的工作强度。如果这一切成为现实,或将是继人类历史上由于动力革命而摆脱繁重的体力劳动之后,人类社会发生的又一次深刻的技术革命。”阿里研究院资深技术专家、中国计算机学会人工智能专委会常务委员苏中在近日发布的文章中表示。
??“ChatGPT更偏向于对话机制的巨大优势,对包括谷歌在内的传统搜索引擎而言是巨大的挑战。它的火爆将大大推动OpenAI主导的大规模语言模型研究方向的发展。随着企业多模态领域的布局,人工智能相关领域会有突破性的进展。”北京航空航天大学人工智能研究院副研究员胡堃说,由于ChatGPT对算力要求较高,对于计算资源有限的高校而言,加大了学术研究的困难,亟需打通企业资源,加强产学研合作。
??抓紧布局
??在ChatGPT带来的这波AI竞争中,中国显然不甘人后。2月13日北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》中,明确提出支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。
??从预训练到大模型的AI技术突破,是ChatGPT获得成功的基础。传统的AI模型训练中,标注成本一直是阻碍AI算法推向更大数据集合的障碍;而预训练技术不依赖数据标注,就可以训练出一个大规模深度学习模型。2020年6月,OpenAI发布了大型语言模型GPT—3,参数规模达到1750亿,ChatGPT正是基于该模型的改进版而创建的。
??大模型展现出的能力、潜力和丰富的应用场景,早已激发很多企业和研究机构投身这场竞赛。2021年1月,谷歌大脑推出了1.6万亿参数规模超级模型。2020年11月,华为启动了中文预训练大模型项目,2021年4月,千亿参数规模的盘古大模型发布。2021年6月,由北京智源人工智能研究院牵头,多家机构参与共同研发的悟道2.0大模型,参数规模达到1.75万亿。阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目,2021年10月,M6的参数规模扩展到10万亿,成为当时全球最大的AI预训练模型。
??苏中认为,在这条数据、算法和算力三轮同时驱动的技术赛道上,中美两国技术团队已经形成了“两驾马车”的发展模式,不断刷新人工智能能力规模上的边界线。在AIGC(人工智能内容生成技术)高质量论文领域,中国和美国数量几乎持平,并大幅度领先其他国家。
??“人工智能可以成为我国自主创新的突破口。我国人工智能产业与美国相比虽有一定差距,但差距并不大。”宋宇说,比如面对大模型所需要的日趋庞大的算力需求,国内已建立多个超算中心,以及专门的人工智能算力中心。“整体上看,我国现在的算力已经领先了人工智能的需求,为自主创新提供了保障。”
??数据显示,近年来,我国人工智能产业增速高于全球水平。2017年至2021年,我国人工智能产业规模增长了2.6倍,占全球比重提升到16.8%。2012年至2022年9月,全球人工智能领域发表的论文约100万篇,其中28%的论文来自中国。中国高水平论文产出占比从2012年的20.36%增长到2021年的50.71%。专利数量上,全球人工智能专利累计授权量25万件,中国占比60%。
??迎接挑战
??ChatGPT已领先一步,中国企业能否赶超?
??“ChatGPT从回答的逻辑性和完整度上都远超国内大模型,在回复速度上,ChatGPT也领先一截。”郑榕认为,这种差距与数据质量有一定关系。AI的进化需要投喂大量数据,而全球互联网的中文数据质量,相比于英文数据质量还有明显差距。“我们要想办法,做好中英文不同语言之间的数据互补。”郑榕说。
??ChatGPT使用的大模型对计算资源消耗极大,这意味着需要大笔投资。2019年,微软向OpenAI投资10亿美元,2021年另一轮投资数额未公开。今年1月,微软宣布将向OpenAI开展“多年、数十亿美元”的投资,两家公司没有披露具体款项,但据美国媒体透露,微软将向OpenAI投资100亿美元。
??面对这样的门槛,胡堃建议通过政策发力整合资源。“大多数企业无法承受人工智能发展对于算力等资源的巨大消耗,建议国家从政策层面整合相关资源,如建立统一的计算平台,结束各企业计算资源割裂和重复建设的状态,促成各方达成某种协议,共同建设,共获收益。”胡堃说。
??另一方面,门槛也是改进和赶超的机会。ChatGPT需要大量算力和能源投入,成本很高,大规模商用必须改进技术、降低成本。比如AI芯片不但需要保证高性能,还要做到高算力下低功耗,对此,国内芯片厂商可以有所作为。平台型科技企业也可以发挥综合优势,与研究机构、高校等合作形成联合创新主体,加速新一代AI技术的产品转化。
??“在体制机制上,要对开展自主创新的企业有足够的耐心。”宋宇表示,在国家层面,建议进一步完善对人才和机构的考核机制,要有长远的目标和足够的耐心让企业自主创新,要有试错容错机制。
??以ChatGPT为代表的人工智能内容生成技术,目前也面临许多伦理问题和安全问题,如歧视、诈骗、抄袭、造谣、伪造身份等,需要在发展中加以规范。
??多位专家表示,由于ChatGPT在中美科技竞争中扮演极其重要的角色,建议对相关技术和应用领域,采取鼓励创新、包容审慎的监管原则。同时,加强行业指引,特别是在科研、生活服务、商业、消费等伦理与安全相对有保障的应用领域,要积极鼓励发展。
??期待在ChatGPT引爆的新一轮AI产业竞争中,中国企业可以大展宏图。(记者 佘惠敏)