近日,欧爱运营有限责任公司(OPENAI OPCO,LLC)在中国申请注册2枚“GPT-5”商标,引发广泛关注。
在 GPT-4 爆火后,GPT-5 成为了万众期待的下一个版本。
(资料图)
当地时间8月8日,OpenAI在官网介绍了新产品GPTBot,这是一种网络爬虫,可大规模爬取网络数据用于训练AI模型,据称可以用来改进未来的聊天机器人大模型。
OpenAI在其官网发布的一篇博客文章中表示:“使用GPTBot用户代理抓取的网页可能会被用来改进未来的模型。”公司还补充称,GPTBot可以提高内容准确性,扩展未来迭代的能力。此外,由于OpenAI近期刚向美国专利商标局申请了GPT-5商标,国外不少科技媒体认为,OpenAI所指的这个“未来迭代”就是GPT-5。
据悉,它将具备众多GPT-4所没有的能力,而且几乎每一项都剑指通用人工智能。
另外,值得注意的是,截至上周五美股收盘,英伟达一周累跌8.56%,接近失守1万亿美元市值关口。华尔街警告:AI概念股泡沫正在接近顶峰。
OpenAI提交GPT-5商标申请
网络爬虫是一种主要通过浏览网络抓取数据的工具,方式包括数据挖掘,网页数据复制/拍照、网站镜像等方式。网络爬虫是互联网和大数据时代最重要工具之一,被誉为“黄金矿工”,应用场景非常广泛。例如,谷歌、必应等搜索引擎通过网络爬虫来收集和建立网页索引,方便用户通过关键字快速找到相关的网页。
OpenAI表示,网络爬虫将从互联网上收集公开可用的数据,但会过滤掉需要付费的内容来源或个人身份信息的消息来源,以及有违反其规定的文本来源。需要指出的是,网站的所有者可以通过在服务器上的标准文件中添加“disallow(禁止)”指令来拒绝网络爬虫。
《每日经济新闻》记者注意到,在发布GPTBot前,OpenAI还在美国申请了GPT-5的商标,这被认为是当前被广泛使用的GPT-4的升级迭代版本。
该申请被OpenAI于当地时间7月18日提交给美国专利商标局,涵盖了“GPT-5”在基于人工智能的人类语音和文本、音频到文本转换、语音识别和语音合成中的使用。在这份新商标申请中,OpenAI 将“GPT-5”描述为一种“用于使用语言模型的可下载计算机软件”。
在这次披露的申请书中,OpenAI提到,尚未发布的GPT-5将具备众多GPT-4所没有的能力,而且几乎每一项都剑指通用人工智能(AGI)。
OpenAI最先提到的一个变化,就是多模态功能的加强。具体来说,GPT-5的功能包括把文本或语音从一种语言翻译成另一种语言、语音识别、生成文本和语音等。有观点认为,文件中突出的语音识别功能,看似只是一个不起眼的改动,但从某种程度上说,这也是OpenAI对GPT-5在通往AGI的道路上铺下的又一块路砖。
除了上述特点外,OpenAI提交的文件中还提到:“GPT-5可能还具备学习、分析、分类和回应数据的能力”。从目前人工智能的发展趋势来看,这很可能是指GPT-5具备了类似智能体的主动学习能力。而这样的能力,将会使GPT-5与以往只能被动地通过人类投喂数据来学习新知识的模型相比,产生本质的区别。
具体来说,主动学习的能力,是指模型可以根据自身的目标和需求,自主地选择、获取和处理数据,而不是仅仅依赖于人类提供的数据。
这样可以让模型更有效地利用数据中的信息和知识,更灵活地适应不同的数据环境和任务场景,而不只是被动地接收和输出数据。而这样的能力,在GPT-5面临一些比较陌生、垂直的领域时,就显得尤为重要。
如果GPT-5具备了主动学习的能力,它可以自动地从网络上搜集和更新这些领域的相关数据,分析和分类这些领域的基本概念、重要原理和最新动态,以及回应这些领域的常见问题、典型案例和实际应用。
《每日经济新闻》记者还注意到,GPT-3.5有1750亿参数规模,OpenAI没有公布过GPT-4的具体规格,但之后的分析认为其拥有16个专家模型,每个NLP(Natural language processing,自然语言处理)专家大约有1110亿个参数,总计1.8万亿参数,是GPT-4的10倍。如果按照这个比例来提升,GPT-5将突破10万亿参数,有望成为最大规模的大语言模型。
GPT-5仍可能在未来重新定义AI
虽然目前GPT-5仍然处于理论概念的阶段,但它仍可能会在未来重新定义人工智能,并有可能达到通用人工智能的高度。
GPT是一种大型语言模型神经网络,可以执行并回答问题、生成代码和总结文本等任务。通过扫描数以百万计的网络文章和数据,GPT模型可以生成真实和非剽窃的内容。目前,GPT-5已经成为全球科技界广泛期待和猜测的话题。尽管OpenAI没有给出官方的GPT-5上线日期,但各路专家早已在各大论坛上分享见解。
据外媒报道,GPT-5有望显著减少回答所包含的错误内容,OpenAI可能会通过先进的训练方法来解决这个问题。此外,GPT-5或将具有更高的计算效率,从而拥有更快的响应时间。虽然具体的细节尚未透露,但人们相信GPT-5可能会通过突破自然语言理解、上下文推理和整体语言流畅性等领域的界限,为AGI做出贡献。
一位名为 Siqi Chen 的开发者在Twitter 上发文称,GPT-5 预计将在今年年底完成训练,并有可能实现通用人工智能(AGI)。AGI旨在创建无需显式编程即可执行任何智力任务的智能系统。如果 GPT-5 实现 AGI,它可以显著提高生产力并自动执行复杂的认知任务。
不幸的是,外界目前只能从OpenAI申请商标的动作来对其计划进行推测,这也并不一定表明OpenAI何时或是否计划推出GPT-5。就在今年6月份,OpenAI创始人兼CEO山姆·阿特曼表示,公司距离开始培训GPT-5“还差的很远”,他解释称,在开始(训练GPT-5)之前还需要进行广泛的安全审核。“在启动GPT-5之前,我们还有很多工作要做。”阿特曼6月份在一次会议上说道。
还有外媒分析认为,更有可能的结果是,OpenAI将把精力集中在改进GPT-4模型上,而不是把所有的资源都投入到下一个大语言模型的迭代中。
与此同时,OpenAI最近的数据收集策略还引起了外界的关注,尤其是围绕版权和用于许可的问题。例如,今年4月,意大利监管机构还指控ChatGPT违反了多项欧盟隐私法律,随后将ChatGPT进行了“封杀”;今年6月,日本隐私监管机构就未经许可收集敏感数据向OpenAI发出了警告。6月下旬,16名原告对OpenAI提起集体诉讼,指控其从ChatGPT用户交互中获取私人信息。
此外,OpenAI还收到了GitHub Copilot的诉讼,原告称代码生成工具侵犯了开发者的权利,因为它在没有提供适当归属的情况下抓取了他们的代码。如果这些指控属实,OpenAI以及同样被列为被告的微软,将违反《计算机欺诈和滥用法案》(Computer Fraud and Abuse Act),这部法律的应用在网络抓取案件方面有先例。
(文章来源:每日经济新闻)
近日,欧爱运营有限责任公司(OPENAIOPCO,LLC)在中国申请注册2枚“GP
1、目前漫画还没说,但我觉得就是斑,不如说是假四代水影:其实我感觉
中国恒大公告,恒大新能源汽车与认购方(包括本公司)订立股份认购协议及
当地时间8月14日,俄罗斯“军队-2023”国际军事技术论坛在莫斯科州...
中梁控股(02772)发布公告,于重组支持协议费用截止期限,占计划债务约7
【卢布暴跌后俄罗斯央行考虑加息称俄金融稳定未面临威胁】英国《金融时
《HunterxHunter》推出了炫酷的新宣传片,庆祝KilluaZoldyck在漫画中的
寿光福麦斯轮胎有限公司“柬埔寨年产120万条全钢子午线轮胎和年产800万
许多博德之门3用户想知道博德之门3精金熔炉复仇侍卫打法详解攻略,下面
在最近发表在《自然物理学》杂志上的一篇论文中,美国加州理工学院电子
导读1、平娘by双面美人鱼君心已成妖by布衣祺尼心似水by十三生这文很好
第一时间提供各大券商研究所报告,最大程度减少个人投资者与机构之间信
作为这部动漫最重要的角色,不良帅不可能这么早领盒饭,第三季假死,第
个人房贷余额首现负增长业内:预期政策持续优化,贷款,信贷,个人房贷,存
来为大家解答以上问题,TF卡无法格式化解决,tf卡无法格式化很多人还不
美国宾夕法尼亚州地方官员13日说,该州第二大城市匹兹堡附近城镇普拉姆
聚焦小微市值公司10家头部公募上报中证2000ETF,etf,主动型,富国基金,公
【全文】新加坡能源集团2022 2023年度财务报告(英文)近日,新加坡能
养老金二级市场上持续落子布局,二季度末共现身17只个股前十大流通股东
8月7日,以“物聚龙江,智联百业”为主题的物联网创新发展合作交流...
今年是被称为“科技体制改革试验田”的北京生命科学研究所(以下简...
8月11日,曹妃甸海事局、河北建投海上风电有限公司联合举办的“2023年
关于公开征集孙静等人涉恶犯罪团伙违法犯罪线索的通告近日,济宁市公安
8月13日,“我在服贸会等你”2023年服贸会新闻发布会在首钢园召开。...
【多家公司所购中融信托产品出现逾期兑付】8月11日晚间,南都物业发布
诸多的对于cad破解版安装教程2019,cad破解版安装教程这个问题都颇为感
大家好,小乐来为大家解答以上的问题。老虎怎么画,老鼠怎么画这个很多
长江日报大武汉客户端8月13日讯(记者谢冰林通讯员高雷)8月12日晚上,
第三方支付监管形势持续收紧中。
会有许多博德之门3玩家还不了解博德之门3法术火花获得方法攻略,接下来