三十多年来,IBM Consulting® 的开发人员和数据科学家团队一直与美国网球协会 (USTA) 合作,为美国网球公开赛球迷提供引人入胜的数字体验。
让我们深入了解今年两个生成式 AI 项目的创新,这两个项目利用了 IBM 多功能的企业级 Granite™ 基础模型系列以及其他模型。我们还将了解团队如何使用 IBM watsonx Code Assistant™ 来加速代码生成并提高生产力和协作。
我们采访了项目负责人、IBM 院士、发明大师和 IBM Quantum™ 大使 Aaron Baughman,了解 IBM 如何在美国公开赛上推动洞察。
项目 1:内容引擎
为男单和女单打比赛中的数百场比赛提供最新的新闻报道是一项艰巨的任务。但是,通过利用 IBM Consulting 多年来与 USTA 合作构建的 Red Hat® OpenShift® 混合云架构,开发团队可以快速创建、测试和实施新的自动化工作流程来应对此类挑战。今年的内容引擎就是这样一种工作流程。
内容引擎产生三个主要输出:每场单打比赛之前和之后的要点描述性文字、比赛精彩片段的口头评论和字幕,以及提供已完成比赛的描述性摘要和分析的多段比赛报告。
基础数据
该系统从众多数据点中提取数据,包括锦标赛开始前的世界排名和正在进行的比赛:第一轮 128 场比赛,第二轮 64 场比赛,依此类推,直到最后两场男、女冠军赛。此外,系统还利用 AI 分析近期表现,生成每场单打比赛的获胜可能性预测(这是球迷和媒体评论员热议的一项统计数据)。
生成式人工智能系统
完成该过程后,生成式 AI 系统会创建赛前要点。“每天清晨,我们都会通过代理架构处理当天的比赛安排,”Baughman 说道。“Granite 13b 聊天模型会生成我们的要点;我们使用少量样本技术,为其提供示例以供其效仿并提供类似的输出。”赛前要点根据排名、对战结果和球员简历提供见解,为球迷提供比赛背景信息,并发布在网站和应用程序上。
比赛结束后,系统会根据发球得分、破发点、双误、制胜球和击球速度等统计数据生成文本描述比赛情况。然后,这些描述会通过托管在 IBM® watsonx™ AI 和数据平台上的生成式 AI 模型(包括 IBM Granite)转换为自然语言要点。
接下来,创建比赛报告。这些报告利用可靠的美国公开赛数据,并利用 Granite 和 IBM® watsonx.ai™ 上托管的其他模型的综合功能来创建长篇摘要。“比赛报告总结了谁参加了比赛、发生了什么,并有助于解释球员获胜的原因,”Baughman 说。然后,USTA 编辑团队会在应用程序和网站上审查、编辑和发布这些叙述。
益处
在内容引擎出现之前,编辑们必须花费数小时观看重播并解读比分和统计数据,然后才能开始撰写较长的故事,发布在美国网球公开赛媒体渠道上。比赛报告提供了一目了然的故事情节和精彩片段,因此他们可以立即开始写作。今年,美国网球协会编辑团队将首次能够为每场男单和女单比赛发布比赛报告。
通过 WatsonX 代码助手提高开发速度并改善协作
IBM® watsonx™ Code Assistant™ 提供企业级代码生成,提供代码片段和功能以加速应用程序的现代化、自动化和扩展。该助手在 Granite 基础模型上进行训练,根据现有源代码提供 AI 生成的建议并响应自然语言请求。
Watsonx Code Assistant 帮助加速了内容引擎重要部分的开发。使用集成开发环境中的代码插件,开发人员可以通过侧边栏面板与助手聊天。他们可以向助手询问诸如如何从数组中随机选择文本之类的问题,然后获取推荐的代码片段,这些代码片段可以复制并根据他们正在使用的数据进行定制。
除了代码生成之外,watsonx Code Assistant 还为合作、试图理解和构建现有代码的团队提供了宝贵的见解。
“例如,如果有人编写了一个函数或方法,我无需通读所有代码即可了解其功能,”Baughman 说道。“我可以突出显示该块,然后助手会总结代码的功能。它还帮助我们创建注释块,从高层次描述每个变量代表什么。我们可以更轻松地评估方法将返回什么以及如何使用它们。”
如果输出结果仍不清楚,助手还会回答后续问题。该应用程序还允许对输出结果立即给出赞成或反对的反馈,从而提高工具的性能。
随着与 watsonx Code Assistant 的协作和对话的进展,用户可以在现有聊天记录的基础上进行构建,也可以根据新的内容和问题进行重置。
“假设你正在为生成式人工智能编写一个事实核查器,有些输出你喜欢,有些你不喜欢,”鲍曼说。“你可以控制,选择对你来说最有意义的代码。如果有你不理解的代码片段,你可以问一个问题。这几乎就像是选择你自己的开发冒险。”
项目二:音频评论
去年推出的 AI 生成的音频评论功能为美国网球公开赛网站和应用程序上播放的每场单打比赛精彩片段提供自动配音和字幕。此功能使用多种模型(包括 Granite 13b 聊天模型)来创建复杂的网球语言以支持生成的评论。
增强合成语音的个性和色彩
今年的一个主要目标是让音频评论更加自然和人性化。团队尝试了两个变量:top k,一个控制模型应考虑的可能答案数量的参数,以及温度采样,用于调整可能答案的概率分布。这些杠杆有助于确保模型生成更人性化的短语,而不是最可能和重复的短语。
团队影响个性的另一种方式是通过提示,即以自然语言传递的系统级指令,告诉模型该做什么。“我们指示模型‘对这场比赛做出有趣的评论’,”鲍曼说。
测试和人工审查
在测试阶段,团队审查并微调了评论。“这是技巧和控制之间的平衡——这不是一个容易的决定,”鲍曼说。“控制越多,开发工作就越多。控制越少,开发工作越少,但风险越大。用例会告诉你最终结果。”
下一步是从文本到语音,在这一步,让声音听起来像真人一样至关重要。通过实验和多次不同的测试,团队确保声音清晰,韵律正确——即音调和语速与所说内容的性质相匹配。
推理与输出
当找到这些平衡点时,推理和输出过程几乎实时地在无人监督的情况下进行。五个事件触发评论创建:比赛结束、比赛开始、盘点结束、局分结束和赛点结束——总共约 9,000 个比赛评论事件。当事件发生时,评论系统会收到一条消息并执行评论员短语的生成。然后,声音文件被集成到视频精彩片段中。
经验助力创新
通过多年来与美国网球协会的密切合作,IBM 咨询团队探索了创造引人入胜的球迷体验和提高美国网球公开赛数字团队生产力的新方法。这也是展示强大的新工具的机会,例如 Watsonx Code Assistant 和 Granite 基础模型系列。
探索 IBM AI 咨询如何帮助您的组织 探索 IBM 旗舰级企业级 LLM 系列 Granite
这篇文章有帮助吗?
是的不