大型语言模型可能占据头条新闻,但不同类别的人工智能可能会改变企业预测未来的方式。紧凑而高效的时间序列模型正在改变各个行业的预测。
IBM 的 TinyTimeMixer (TTM) 体现了这一趋势。TTM 拥有不到一百万个参数,能够提供可靠的预测,且无需像大型同类产品那样进行计算。
IBM 技术战略专家 Joshua Noble 解释道:“如果正确使用,预测可以成为一种强大的工具。预测需求、收入、成本、设备故障或市场变化的能力对于任何规模的企业来说都是强大的资产。”
人工智能行业最近对小型、更高效的语言模型的兴趣激增。这些紧凑型模型旨在提供与大型模型相当的性能,同时需要更少的计算能力和内存。例如,Mistral AI 凭借其 Mixtral 8x7B 模型引起了人们的关注,该模型采用混合专家方法,以相对较少的参数数量实现高性能。
这种“AI精简版”的趋势反映出人们对实际部署和可访问性的日益关注,有可能使AI技术适用于更广泛的应用和设备。
控制注意力:提高效率的关键
TTM 取代了传统的机器学习自注意力机制(序列中的每个元素都衡量其与所有其他元素的关系),转而采用门控注意力机制,这是一种选择性控制简单感知器块以链接时间序列变量的机制。这种简化的方法可以提高专注度并大幅降低训练和微调的计算成本,从而形成一个精简、高效的模型,在时间序列任务中表现出色。
北京空气质量数据集是一个真实世界的测试案例,展示了 TTM 使用历史数据和气象变量预测 PM2.5 空气污染水平的能力。此应用展示了该模型在环境监测和城市规划方面的潜力。
虽然时间序列模型前景光明,但挑战依然存在。Noble 警告说:“预测与大多数人工智能一样,依赖于良好的数据和可预测的模式。有些现象根本无法预测,没有模型能够解决这个问题。”
微调通过简化流程解决了模型限制:准备数据、加载模型、评估、微调和重新评估。其影响显而易见:对于北京空气质量预测,微调将评估损失从 0.426 降至 0.253,显著提高了预测准确率。这个真实示例展示了微调在增强特定任务模型性能方面的强大功能。
教程:使用基础模型进行时间序列预测
精细调整,确保精度
微调过程包括拆分数据集、加载预训练模型、建立基线性能、使用早期停止微调训练数据以及最终评估。这种方法增强了模型捕获复杂数据模式的能力,从而做出更准确的预测。
TTM 的预测流程处理复杂的时间序列数据,结合目标变量和外部因素。回到 PM2.5 预测示例,这种方法使 TTM 能够捕捉影响空气质量的各种因素之间的复杂关系。通过同时考虑多个变量,该模型提供了更准确、更细致的预测,考虑到影响空气质量的因素随时间推移的复杂相互作用。
IBM watsonx 平台将这些功能带给了更广泛的受众。该平台使用户能够高效地训练、验证、调整和部署模型,使各种规模的企业都能实现 AI 驱动的预测。
随着 TTM 等时间序列模型的发展,它们对业务预测的影响也越来越大。这些模型提供了强大的工具来应对不确定性,从供应链优化到市场趋势预测。
Noble 总结了这些模型的潜力:“基于时间序列数据训练的基础模型可以帮助降低此类预测的进入门槛,因为它们已经内置了大量训练数据。”
电子书:如何选择正确的基础模型
这篇文章有帮助吗?
是的不