• 联系我们
  • FAQ
加入收藏
比特900财经
  • 首页
  • 7×24
  • 市场行情
    • 比特币(BTC)
    • 以太坊(ETH)
    • Ripple(XRP)
    • Chainlink(LINK)
    • Litecoin(LTC)
    • Cardano(ADA)
    • Zcash (ZEC)
    • Altcoin(ALT)
    • Dogcoin
    • EOS
  • 区块链
  • 交易所
  • NFT
  • DeFi
  • Layer 2
  • Web 3
  • 技术创新
  • 深度观察
  • 联系我们
No Result
View All Result
  • 首页
  • 7×24
  • 市场行情
    • 比特币(BTC)
    • 以太坊(ETH)
    • Ripple(XRP)
    • Chainlink(LINK)
    • Litecoin(LTC)
    • Cardano(ADA)
    • Zcash (ZEC)
    • Altcoin(ALT)
    • Dogcoin
    • EOS
  • 区块链
  • 交易所
  • NFT
  • DeFi
  • Layer 2
  • Web 3
  • 技术创新
  • 深度观察
  • 联系我们
No Result
View All Result
比特900财经-专业比特币财经媒体
No Result
View All Result
Home 7x24

IBM 研究数据加载器增强了开源社区的 AI 模型训练

digger by digger
4 10 月, 2024
in 7x24, 区块链
0
189
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter


当你在海量数据上训练人工智能模型时,如何克服瓶颈?在今年的 PyTorch 会议上,IBM Research 展示了一款用于大规模 LLM 培训的突破性数据加载器。该工具现已可供 PyTorch 用户使用,旨在为尽可能广泛的受众简化大规模培训。

研究的起源

高吞吐量数据加载器的想法源于研究科学家在模型训练期间观察到的实际问题,因为他们的工作需要一种可以跨多个设备处理大量数据的工具,同时跟上日益高效的 GPU 的步伐。正如 IBM Research 在其关于该版本的博客中指出的那样,“这一切都归功于一组研究人员,他们只是构建了完成工作所需的工具。”

Related articles

加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相

加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相

9 11 月, 2025
比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会

比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会

9 11 月, 2025

IBM 研究中心的 Davis Wertheimer 解释了大规模培训期间可能出现的一些挑战:“大规模培训存在 80/20 规则。百分之八十的已发表文献都在研究 GPU 内存与通信和计算之间的算法权衡。但当你真正尝试构建某些东西时,80% 的时间,你可以依赖所有这些其他实际问题的长尾,因为管道以最窄瓶颈的速度运行。”

当 IBM 团队开发培训平台时,他们不断遇到瓶颈。 “随着我们越来越擅长使用 GPU,瓶颈越来越多地出现在数据加载器上,”Wertheimer 说道。

这种认识导致了双重开发过程。 “这是一个并行的过程,一方面,不断发展我们的培训平台,另一方面,不断发展我们的数据加载器,以满足我们培训平台的速度需求,避免出现瓶颈,”他解释道。

世界一流的数据加载器的主要特点

IBM 研究中心的 Linsong Chu 概述了数据加载器的基本特性:

有状态和可检查点: “每当你保存模型时,你的数据加载器状态也会被保存,每当你从检查点恢复时,模型状态和数据加载器状态都需要同时恢复,”Chu 说。

自动调整检查点: 数据加载器会在扩展训练期间自动调整以适应工作负载的变化。 Chu 指出:“培训很容易需要数周或数月的时间,并且有很多原因导致您可能必须在中间重新调整工作量。”

高效的数据流: 该系统支持数据流,并且洗牌的构建开销为零。

异步分布式操作: “我们希望数据加载器是非阻塞的,”Chu 解释道。 “在保存数据加载器状态时,我们希望以零通信的形式分发保存内容。”

动态数据混合: 数据加载器可以适应不同的数据混合比例,这对于不断变化的训练需求非常有用。

高效的全局洗牌: 该工具解决了处理大型数据集时的内存瓶颈,即使数据增长时也能提高洗牌效率。

PyTorch 原生、模块化且广泛: 数据加载器专为适应性和可扩展性而设计,为未来的增长做好了准备。 “如果明年我们必须处理 30 万亿、50 万亿或 100 万亿代币怎么办?”楚问道。 “世界瞬息万变,因此我们需要构建数据加载器,使其不仅能够生存在今天,而且还能生存在明天。”

真实世界的表现

IBM 研究团队在几个月内严格测试了他们的数据加载器,运行了数百个大大小小的作业。他们观察到稳定且流畅的代码。而且,整个数据加载器异步运行并且是非阻塞的。

“我们利用了许多内置的 PyTorch 功能来实现这一切,”Wertheimer 说。 “这就是我们做出贡献、回馈社会的原因。”

电子书:如何选择合适的基础模型

这篇文章有帮助吗?

是的不



Source link

Tags: IBM模型训练研究数据加载器增强了开源社区的
Share76Tweet47

Related Posts

加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相

加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相

by 小明 老师
9 11 月, 2025

Ledger 报告称 2025 年收入将...

比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会

比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会

by 小明 老师
9 11 月, 2025

大多数情况下,加密货币市场围绕比特币(B...

FTX 债权人代表确认三轮付款总计 $7.1B

FTX 债权人代表确认三轮付款总计 $7.1B

by 小明 老师
9 11 月, 2025

FTX 债权人代表 Sunil 确认了三...

Hyperliquid 新闻:Hyperliquid 拒绝风险投资以保护去中心化愿景

Hyperliquid 新闻:Hyperliquid 拒绝风险投资以保护去中心化愿景

by 小明 老师
9 11 月, 2025

Hyperliquid 创始人 Jeff...

DOGE、SHIB 和 Pepe 预测在社交领域占据主导地位,而 Ozak AI 却引起了投资者的兴趣

DOGE、SHIB 和 Pepe 预测在社交领域占据主导地位,而 Ozak AI 却引起了投资者的兴趣

by 小明 老师
9 11 月, 2025

随着狗狗币 (DOGE)、柴犬 (SHI...

Load More
  • Trending
  • Comments
  • Latest
比特币即将崩盘吗? 分析师指出可能出现下降趋势

分析师警告称,股价可能跌至 59,000 美元

26 4 月, 2024
LTC 可能会在新一轮飙升之前重新测试 60 美元

LTC 可能会在新一轮飙升之前重新测试 60 美元

30 3 月, 2024
Multipool 与 Mobilum 建立合作伙伴关系,为用户提供从法币到 DeFi 的开/关 – 区块链新闻、观点、电视和就业机会

Multipool 与 Mobilum 建立合作伙伴关系,为用户提供从法币到 DeFi 的进/出通道

23 5 月, 2024
埃隆·马斯克 (Elon Musk) 计划对 Ripple 的 XRP 投资 1040 亿美元

埃隆·马斯克 (Elon Musk) 计划对 Ripple 的 XRP 投资 1040 亿美元

29 11 月, 2024
技术问题继续困扰 Zilliqa 的未来

技术问题继续困扰 Zilliqa 的未来

16 1 月, 2025
需要注意的 3 个可能影响以太坊价格的主要指标

需要注意的 3 个可能影响以太坊价格的主要指标

22 4 月, 2024

Enterprise Ethereum Alliance Appoints First Executive Director

Opera's Crypto Browser Enters iOS, Worldcoin's Open Source, LUNA Gift + More News

Opera's Crypto Browser Enters iOS, Worldcoin's Open Source, LUNA Gift + More News

US SEC’s Proposal On 'Exchange' Definition Could Be Unconstitutional – Think Tank

US SEC’s Proposal On 'Exchange' Definition Could Be Unconstitutional – Think Tank

LTC 可能会在新一轮飙升之前重新测试 60 美元

LTC 可能会在新一轮飙升之前重新测试 60 美元

看涨势头或看跌压力会占上风吗?

看涨势头或看跌压力会占上风吗?

狗狗币价格突破三年新高

狗狗币价格突破三年新高

加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相

加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相

9 11 月, 2025
比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会

比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会

9 11 月, 2025
FTX 债权人代表确认三轮付款总计 $7.1B

FTX 债权人代表确认三轮付款总计 $7.1B

9 11 月, 2025
Hyperliquid 新闻:Hyperliquid 拒绝风险投资以保护去中心化愿景

Hyperliquid 新闻:Hyperliquid 拒绝风险投资以保护去中心化愿景

9 11 月, 2025
DOGE、SHIB 和 Pepe 预测在社交领域占据主导地位,而 Ozak AI 却引起了投资者的兴趣

DOGE、SHIB 和 Pepe 预测在社交领域占据主导地位,而 Ozak AI 却引起了投资者的兴趣

9 11 月, 2025
以太坊和 BNB 反弹,但 Ozak AI 的 0.014 美元入场券可能会在 2028 年以 440 倍的投资回报率超越两者

以太坊和 BNB 反弹,但 Ozak AI 的 0.014 美元入场券可能会在 2028 年以 440 倍的投资回报率超越两者

9 11 月, 2025

比特900财经

比特900财经

最新最快的区块链财经科普平台




比特900财经是一家专业的数字货币和区块链媒体平台,致力于为读者提供最新的加密货币新闻、区块链技术动态和市场趋势分析。我们关注比特币行情、区块链投资、智能合约等热门话题,并提供加密货币ICO和数字货币钱包等方面的深入解读。通过我们权威的区块链监管政策报道和专业的加密货币市场分析,帮助读者了解行业趋势,做出明智的投资决策。





Categories tes

  • 7×24
  • Altcoin(ALT)
  • Cardano(ADA)
  • Chainlink(LINK)
  • DeFi
  • Dogcoin
  • Litecoin(LTC)
  • NFT
  • Ripple(XRP)
  • Web 3
  • Zcash (ZEC)
  • 交易所
  • 以太坊(ETH)
  • 区块链
  • 市场行情
  • 技术创新
  • 比特币(BTC)
  • 法律合规
  • 深度观察

Tags

ADA BlockDAG BTC Cardano Coin Coinbase Dapp DappRadar Dapps DeFi DOGE ETF ETH Finance Inu Labs Meme Memecoin Network NFT PEPE Qubetics Ripple SEC SHIB SHIBA SOL Solana SUI Web3 XRP 万美元 与 亿美元 什么是 代币 区块链新闻观点电视和工作 和 在 年 月 比特币 的 美元 随着

近期文章

  • 加密货币新闻:在加密货币钱包黑客事件激增之际,Ledger 考虑在纽约首次亮相
  • 比特币反弹:看涨势头能否保持或市场已见顶?在 Digitap ($TAP) 呈抛物线走势之前预售的最后机会
  • FTX 债权人代表确认三轮付款总计 $7.1B
  • Hyperliquid 新闻:Hyperliquid 拒绝风险投资以保护去中心化愿景
  • DOGE、SHIB 和 Pepe 预测在社交领域占据主导地位,而 Ozak AI 却引起了投资者的兴趣
  • 关于我们
  • FAQ
  • 联系我们

© 2024 Bit900 - support By Pangoo

No Result
View All Result
  • 首页
  • 7×24
  • 市场行情
    • 比特币(BTC)
    • 以太坊(ETH)
    • Litecoin(LTC)
    • Ripple(XRP)
    • Dogcoin
    • Altcoin(ALT)
    • Cardano(ADA)
    • Chainlink(LINK)
    • Zcash (ZEC)
    • EOS
  • 交易所
  • 区块链
  • 深度观察
  • 技术创新
  • NFT
  • Layer 2
  • Web 3
  • DeFi
  • 深度观察

© 2024 Bit900 by Bit900.