Amouranth计划在她的视频中为粉丝引入人工智能功能
14
2025-01-23
毫无疑问,人工智能在全球社交媒体用户中的受欢迎程度正达到顶峰。
我是说,还有什么比猜测一对名人夫妇未来的孩子长什么样更有趣的吗?或者听过已故的弗雷迪·默丘里如何表演Doja Cat的“Paint the Town Red”?
但据一些科学家称,到2026年,人类可能很快就会耗尽完全训练人工智能所需的数据类型。
失去这些为全球强大的人工智能系统提供动力的数据,可能会降低人工智能模型的增长率,尤其是大型语言模型。
这种损失甚至可能改变人工智能革命的轨迹。
对这些数据的需求是为了训练准确、高质量的人工智能算法——一个例子是聊天GPT,它使用了570千兆字节的文本数据(大约3000亿个单词)进行训练。
如果没有足够的数据来训练这些程序(包括DALL-E, Lensa和Midjourney),可能会产生不准确/低质量的输出。
这些必要数据的质量也非常重要,因为尽管低质量的数据(例如模糊的图片和社交媒体帖子)很容易获取,但它们不足以训练高性能的AI模型。
此外,来自社交媒体平台的文本可能带有偏见或偏见,或者可能包含虚假信息或非法内容,这些内容可能会被复制。
这解释了为什么高质量的内容,如书籍文本、在线文章、科学论文、维基百科和某些过滤的网络内容正在被寻找。
一组研究人员在去年发表的一篇论文中预测,如果目前的人工智能训练趋势继续下去,到2026年,我们可能会用完这些重要的数据。
他们还怀疑,低质量的语言数据可能会在2030年至2050年之间耗尽。
这让世界各地的众多计算机和数据科学家感到担忧,因为预计到2030年,人工智能将为世界经济贡献高达15.7万亿美元。
其他专家向科技用户保证,情况可能并不像看起来那么糟糕,因为未来人工智能模型的发展仍有数百个未知数。
他们还表示,解决潜在数据短缺的方法很少,包括人工智能开发人员改进算法以更有效地使用数据。
这些科学家表示,在未来几年,训练高性能模型所需的数据和计算能力可能会更少,这将反过来减少人工智能的碳足迹。
有人还建议,人工智能将创造合成数据,以训练他们需要的系统。
发表评论
暂时没有评论,来抢沙发吧~