需要更多数据训练 OpenAI放开限制
北京商报
2024-04-03 17:48:45
0

原标题:需要更多数据训练 OpenAI放开限制

OpenAI正试图通过对数量庞大的非注册用户开放其较低版本模型ChatGPT,来扩充自己的训练数据来源。当地时间4月1日,OpenAI宣布,用户无需注册即可使用ChatGPT,即其旗下大语言模型GPT-3.5版本的对话式人工智能产品。

OpenAI在其官方网站发布的博文中宣称,其核心使命是让ChatGPT等工具得到广泛使用,以便人们可以体验人工智能的好处。目前,每周有来自185个国家和地区的超过1亿用户使用ChatGPT。OpenAI选择逐步推出无需注册即可使用ChatGPT的功能,目的是让任何对其功能感兴趣的人都可以使用人工智能。

此外,OpenAI可能会使用用户向ChatGPT提供的信息来改进其模型。不过,用户无论是否创建账户,都可以通过“设置”关闭此功能。

OpenAI还补充到,其为使用ChatGPT的未注册用户引入了额外的内容保护措施,例如阻止提示和更广泛类别的生成。同时,OpenAI不忘提示称,“创建账户有很多好处,包括能够保存和查看聊天历史记录、共享聊天以及解锁语音对话和自定义指令等附加功能”。

也就是说,无论用户是否注册使用ChatGPT,用户在使用过程中产生的数据都可能会被OpenAI用以训练模型,但用户可以主动选择关闭。相比起注册用户,非注册用户在使用ChatGPT时会有更加严格的内容保护政策,但OpenAI没有详细解释这种限制政策具体包括什么。

事实上,包括OpenAI、谷歌等巨头在内,所有的致力于发展人工智能的公司,都正在或即将面临数据短缺的困境,尤其是高质量数据的短缺。这主要由于,一方面需要数据训练模型的人工智能公司和大模型越来越多,对数据的需求越来越大;与此同时,一些数据所有者,比如纽约时报、reddit以及马斯克拥有的X平台,正在不同程度上限制或阻止部分或全部人工智能公司对他们数据的访问。

OpenAI称,185个国家的1亿多人每周使用ChatGPT。流量跟踪器SimilarWeb发现,尽管谷歌的Gemini已经开始出现增长势头,但2月份访问量估计为16亿的ChatGPT仍然是全球最大的人工智能聊天机器人网站。然而,它的流量比2023年5月的高点略有下降,当时估计访问量超过18亿。

有分析称,这应该也是OpenAI放开限制的原因,随着人工智能技术的发展,现有的互联网信息量可能不足以支撑科技巨头训练更先进的人工智能系统,甚至高质量文本数据的不足可能减缓人工智能技术的发展速度。

据华尔街日报4月1日报道,一些高管和研究人员表示,人工智能行业对高质量文本数据的需求可能会在两年内供不应求,这可能会减缓人工智能的发展。曾在OpenAI工作的人工智能研究员阿里·莫科斯(Ari Morcos)表示,数据短缺“是一个前沿研究问题”。

为了应对这个问题,报道援引知情人士的说法称,OpenAI已经讨论了利用YouTube公共视频的转录来训练其下一代模型GPT-5。

在更早前的一次采访中,OpenAI的CTO Murati在回答旗下视频生成模型Sora的训练数据来自哪里时,支支吾吾并试图回避回答这个问题,甚至称“不太确定”是否使用了Youtube、Facebook和Instagram等平台的数据。

同时,OpenAI和其竞争对手Anthropic的研究人员正试图通过创建所谓的更高质量的合成数据来避免这些问题。OpenAI的发言人表示,其还在探索合成数据生成。但也有另一些研究人员表示,这种方法实际上可能会导致严重的故障。

值得关注的是,The Information在上周的一篇报道中援引知情人士消息称,微软和OpenAI的高管一直在制订一个数据中心项目计划,该项目将包含一台超级计算机,配备数百万个专用服务器芯片,为OpenAI的人工智能提供动力。报道称,据一位曾与OpenAI首席执行官Sam Altman交谈过的人士以及一位看过微软部分初始成本估算的人士透露,该项目的成本可能高达1000亿美元,这一成本比当今一些最大的数据中心高出100倍。

北京商报综合报道

相关内容

热门资讯

东北亚具身智能创新中心成功发布 (来源:沈阳日报) 转自:沈阳日报 本报讯(沈阳日报、沈报全媒体记者黄超)9月6日,在2025全球工...
“首次”“首创”不断 我国科学... (来源:中国环境网) 转自:中国环境网 近期 我国科学家首次确证火星存在固态内核 我国科学家揭示植物...
罗永浩“唠嗑”,为何成了B站的... 最近,全网都在看罗永浩唠闲嗑。 “真还传”告一段落之后,罗永浩以“罗永浩的十字路口”的IP重新开启新...
打造绿色发展“新名片” 在落实“双碳”目标的大背景下,电力特别是绿色电力受到更多关注。构建新型电力系统,是助力实现“双碳”目...
全国首个“商圈IP+自研机器人... 小朋友与机器人赛跑。 “机器人川剧变脸、机器狗舞狮……科技时尚和传统非遗相结合,太震撼了!”9月7日...
消息称阿里云首次出手具身智能,... IT之家 9 月 8 日消息,据晚点 LatePost 报道,具身智能公司自变量机器人(X Squa...
惠普Z2 Mini G1a迷你... 【ZOL中关村在线原创评测】在桌面Mini电脑领域,惠普一直以来有着非常深入的产品布局,并且深受企业...
送药、助行、陪聊、量血压 机器... 浙江省发布行动计划 三年建成人工智能医疗应用基地 送药、助行、陪聊、量血压 机器人越来越能干了 本报...
神二十乘组工作日志“上新” 多... 央视网消息:九月伊始,国家太空实验室内,由陈冬、陈中瑞、王杰组成的神舟二十号航天员乘组承担的各项空间...
西工大实现航天器柔性传感系统首... 9月5日19时39分,我国在酒泉卫星发射中心成功发射谷神星一号运载火箭,将“基于柔性传感的卫星关键折...
特斯拉人形机器人,有新动向! 【大河财立方消息】9月8日消息,特斯拉近日开通了名为“TeslaAI”的微博账号,并于9月7日发布首...
智博会上的重庆智“治” 9月5日,2025世界智能产业博览会在重庆开幕。如何以“数智”赋能超大城市现代化治理?上游新闻带你走...
万兆光网赋能智能制造 万兆光网赋能智能制造 宁波电信助力招宝磁业打造数字新高地 本报讯 AGV小车在厂房内平稳穿梭,摄像...
300余件潼南“智造”亮相20... 9月5日,2025世界智能产业博览会(以下简称智博会)在重庆国际博览中心开幕。今年智博会以“人工智能...
广西工业互联网“百场路演”活动... 来源:乌鲁木齐晚报 近日,一场以“推动工业互联网创新发展、助力工业高质量发展”为核心的盛会——广西工...
歌尔股份公布“发声装置和电子设... 天眼查APP显示,近日,歌尔股份有限公司申请的“发声装置和电子设备”专利公布。 摘要显示,本发明公开...
智博会上感受“智慧”生活 (来源:中国妇女报) 转自:中国妇女报 9月6日,在2025世界智能产业博览会现场,生活家居机器人...
从“3年15次”到“4年20次... 人民日报海外版记者 刘峣 日前,神舟二十号乘组圆满完成第三次出舱活动。航天员陈冬、王杰完成了空间站空...
嘉兴锚定新质生产力加速跑 9月6日,记者走进位于嘉兴嘉善经济技术开发区的某能源股份有限公司(嘉善基地)生产车间,只见一块块A4...
宇树IPO时间定了,人形机器人... 来源:财经网 9月2日晚,宇树科技在社交平台上披露了关于该公司的IPO计划:预计在2025年10月至...