去中心化的OORT AI数据在Google Kaggle上跻身前列

CN
AiCoin
关注
7小时前

来源: Cointelegraph
原文: 《 去中心化的OORT AI数据在Google Kaggle上跻身前列 》


由分散式AI解决方案提供商OORT开发的人工智能训练图像数据集在谷歌的Kaggle平台上取得了显著成功。


OORT的"Diverse Tools Kaggle"数据集清单于4月初发布;此后,它在多个类别中攀升至首页。Kaggle是谷歌旗下的在线平台,用于数据科学和机器学习比赛、学习和协作。


加密AI项目OpenLedger的核心贡献者Ramkumar Subramaniam向Cointelegraph表示,"Kaggle首页排名是一个强有力的社会信号,表明该数据集正在吸引数据科学家、机器学习工程师和从业者等关键社区的积极参与。"


OORT创始人兼CEO Max Li 向Cointelegraph透露,该公司"观察到了令人鼓舞的参与指标,这验证了"其通过分散式模型收集的训练数据"确实具有早期市场需求和相关性"。他补充道:


"来自社区的自发兴趣,包括积极使用和贡献——清晰地展示了像OORT这样的分散式、社区驱动的数据管道如何能够在不依赖中心化中介机构的情况下实现快速分发和广泛参与。"


Li还表示,OORT计划在未来几个月发布多个数据集。其中包括车内语音命令数据集、智能家居语音命令数据集,以及旨在提升AI驱动的媒体真实性验证能力的深度伪造视频数据集。


Cointelegraph独立核实确认,上述数据集本月早些时候已在Kaggle的通用AI、零售和购物、制造业以及工程类别中成功登上首页。截至发稿时,该数据集在5月6日的一次可能无关的数据集更新和5月14日的另一次更新后已不再保持这些排名位置。


虽然认可这一成就,Subramaniam向Cointelegraph表示,"这并非实际落地应用或企业级质量的决定性指标。"他指出,OORT数据集的独特之处"不仅体现在排名上,更在于数据集背后的来源渠道和激励机制。"他进一步解释:


"与可能依赖不透明流程的中心化供应商不同,一个透明的、基于代币激励的系统能提供可追溯性、社区共同管理以及持续优化的可能性,前提是建立合适的治理结构。"


人工智能风险投资机构Generative Ventures合伙人Lex Sokolin表示,尽管他认为这些成果并非难以复制,"但这确实证明了加密项目能够利用去中心化激励机制组织具有经济价值的活动。"


人工智能研究机构Epoch AI发布的数据显示,人类生成的文本AI训练数据预计将在2028年耗尽。压力已大到投资方目前正在促成交易,为AI公司获取受版权保护材料的使用权。


关于AI训练数据日益稀缺以及这可能如何制约该领域发展的研究报告已流传多年。虽然合成(AI生成)数据正被越来越广泛地应用并取得一定成效,但人类生成的数据仍被普遍视为更优选择,这类高质量数据能够培养出性能更佳的AI模型。


在AI训练图像领域,情况变得愈发复杂,艺术家们正有意识地破坏训练工作。为保护自己的作品不被未经授权用于AI训练,Nightshade工具使创作者能够"毒化"他们的图像,从而严重影响模型性能表现。


Subramaniam指出:"我们正步入一个高质量图像数据日益稀缺的时代。"他同时强调,图像投毒技术的广泛应用使这一挑战更为严峻:


"随着图像隐蔽技术和对抗性水印等AI训练投毒方法的兴起,开源数据集正面临数量和可信度的双重挑战。"


针对这一局势,Subramaniam表示,可验证且由社区贡献的激励数据集"较以往任何时候都更具价值"。他认为,这类项目"不仅能作为替代方案,更将成为数据经济中AI对齐和数据溯源的重要支柱。"


相关推荐:Kima加入Mastercard沙盒以实现稳定币卡片充值


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

HTX:注册并领取8400元新人礼
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接