人工智能组织OpenAI推出大模型ChatGPT发表时间:2023-02-06 19:54 人工智能组织OpenAI推出大模型ChatGPT,让高喊人工智能的百度如坐针毡,人工智能每五六年都有一波浪潮,上一波AlphaGO让大家震撼,这一波就是ChatGPT。 这是非常颠覆性的体验,短短一个月的时间,全球100多万用户在使用和体验ChatGPT,除了感叹于ChatGPT的惊艳体验外,国内业界迅速反思,行业变得热闹而有活力。 ChatGPT从回答的逻辑性和完整度上都远超国内大模型,国内大模型的答案带有明显的拼凑感,夹杂着不少主题之外的胡编内容,在回复速度上也是无法相提并论。 目前全球还没有能跟ChatGPT抗衡的大模型,国内先不谈弯道超车,趁早追赶反而是更重要的,虽然训练了很多万亿模型或者是几千亿的模型,但是训练的程度还是不行。 在GPT-3之后,OpenAI所有的模型都没有开源,但它提供了API调用,建立起了真实的用户调用和模型迭代之间的飞轮,重视真实世界数据调用和模型迭代。 国内的大模型研究,是A公司训练了一个,B公司也训练了一个,打个广告就完了,模型开源,你爱用不用,没有把数据和模型飞轮完整转动,要想办法做中英文不同语言之间的数据互补。 人工智能组织OpenAI推出大模型ChatGPT,在看不到前景和没有明显效果的阶段,OpenAI非常坚定地做了投入,相反国内倾向于在技术出现突破后,快速追随,围绕业务在局部应用中开始超越。 ChatGPT有一个非常强大的技术底座,这个模型的论文刚发出来时,没有引起特别大的反响,大家觉得也就是 OpenAI的一篇论文而已,业内公司正在关注投入更大精力到GPT模型路线上。 ChatGPT不仅仅像以前的大模型,利用了没有人工标注的数据去学习,还在新版本上引入了人工标注的数据,通过人类的反馈,有针对性地进行优化。 模型越来越大,就像一股洪荒之力,有人会害怕未来它会不会控制人类,引入了这种强化学习机制后,就相当于给洪荒之力一个引导,让大模型的产出朝着可控的方向走,生成符合预期的结果。 对于ChatGPT如此开放的系统,没有明确的反馈机制,过去大家也尝试强化学习机制,问题是很多都不太成功,只有ChatGPT在数据质量和多样性上探讨较多。 OpenAI雇佣了一个数十人的数据团队,其实ChatGPT强化学习的数据量并不大,但对数据多样性、标注体系都有精巧的设计,让数据发挥出强大作用,在内容的可信性和可控性上有一定局限。 需要给ChatGPT足够正确的知识,引入知识图谱这类知识管理和信息注入技术,要限定它的数据范围和应用场景,让它生成的内容更为可靠。 很多单点环节里,用不用大模型会有天壤之别,没用大模型,只基于自己上一代小模型做产品的企业,跟应用了大模型且还做了业务垂直化的公司,将无法竞争。 目前ChatGPT还是一个对AI技术范式的探索,无法实时获取互联网信息,不能代替搜索,只是一个端到端的生成模型,能够自我构造虚假答案,会让商业搜索引擎公司入不敷出。 由于ChatGPT展现出的大模型的创造性,以及对长篇上下文的理解能力,会聚焦于一些开放性、创意性和通用性的任务上,在一些场景尝试引入ChatGPT来做外呼的Demo测试,调用ChatGPT来回复客户的问题。 智能客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,语料信息不充分时,AI没办法对问题做出反应,ChatGPT大模型能够补全这方面的能力。 AI是一个链条比较长的产品技术,如果没有建立一个好的反馈机制,在部署运营阶段,从最前线发现的问题,就很难有效定位解决,要让模型去持续成长和优化。 ChatGPT的优势是意图理解、上下文对话管理和高质量内容生成,技术升级后,预计会带来显著的体验提升,有了大模型之后,内容的输出可以通过大模型来完成。 数字人公司先给本地生活、知识付费和直播商家等建立一个数字人的虚拟主播形象,可以将大模型接入,让大模型辅助撰写数字人直播带货的话术和脚本。 ChatGPT目前调用一次的费用在几美分,智能客服一天的问答场景,通常可能要调用几十万次,几美分只是调用费用,还不算运营费用,调用ChatGPT的成本和它当下所带来的回报不成正比。 乍看中规中矩要素齐全,但细品会发现缺少灵魂,在观念性的创造上仍有待提升,除成本考量,在对企业的落地中,ChatGPT这类大模型,也有典型的问题。 这些大模型在一些特定行业或特定任务上,专业性是欠缺的,需要去适配,很多客户有私有化部署要求,但这些模型非常大,对资源要求高,当前不太可能实现私有化部署。 人工智能组织OpenAI推出大模型ChatGPT,如何兼顾成本、灵活性和数据隐私则是一个关键问题,这些问题也造成,这种模型还没有走到服务企业级客户,尤其是大型企业客户那一步。 人工智能技术都在与企业的核心业务流程做深度融合,而ChatGPT这个基于大模型的应用服务,ChatGPT对外提供的API还非常单一,更像一个独立的外挂,如何深度绑定成为企业使用它的一个难题。 随着大模型被越来越多地应用,要深化对垂直行业的认知,把大模型融入到企业的创新业务流中,创业公司需要基于对行业的认知深度,采集足够多的场景数据,基于这些细分数据更好服务用户。 用户越多,反馈越多,最终形成数据反馈的闭环,创业公司在小模型的竞争终局比拼的是,谁家的小模型跟业务结合得紧,且能解决好跟大模型结合的问题。 人工智能组织OpenAI推出大模型ChatGPT,大模型被充分使用、喂肥后可能成为强大的AI,最终吞噬细分赛道上小创业公司的发展空间,在充分利用已有大模型的情况下,要把小模型的闭环数据保护好。 |