后对 OpenAI 的投资为了将其人工智能雄心推向新的高度,苹果刚刚公布了一项新的合作伙伴关系,这一点并非最不重要。该公司与图形处理器巨头强强联手(现在是人工智能):NVIDIA,一家由黄仁勋领导的公司,他确实学年伊始股市爆发。金融市场的结果可以通过其在人工智能方面的专业知识来准确解释。
凭借高性能 GPU,黄仁勋的公司已成为数据中心、研究实验室和开发人工智能应用程序的公司的最终提供商。可以说,与 NVIDIA 的新合作伙伴关系可以给苹果带来很大的推动,指责的她该部门有一定的延迟面对竞争。
前所未有的硬件和软件协同
Apple 和 NVIDIA 之间的技术合作基于在 TensorRT-LLM 环境中集成 ReDrafter(一种使用 Apple 开发的大型语言模型生成文本的新方法)。它是一个由 NVIDIA 优化的 Python 库,允许您运行大型语言模型 (LLM)在 GPU 上速度极快。
为了实现这种集成,NVIDIA 在其 TensorRT-LLM 框架中开发了新的专用运算符。这些软件组件可确保最佳通信Apple 算法与 NVIDIA 图形处理器之间的对比。调整的重点是有效管理 ReDrafter 生成的数据结构,特别是在两个阶段。
第一个是波束搜索,一种人工智能中使用的启发式方法有效地探索大的搜索空间,专注于最有前途的路径。第二个是基于动态树的注意力。这种机制允许人工智能模型将注意力集中在信息中最相关的部分,根据上下文和后者的演变来调整这种注意力并确定优先级。
工程师实施了同步机制,允许在不同 GPU 核心之间高效分配计算。这种多级优化充分利用了 NVIDIA 处理器的张量计算单元,同时保持了模块化架构能够随着未来的发展而演变。
已经有实实在在的表演
与 NVIDIA 生态系统的整合已经取得成果。在实验室中,对配备数百亿参数的大规模神经元结构进行了测试,表现出惊人的性能提升。贪心算法代表通过语言模型生成文本的经典方法,其中算法在每一步选择概率最高的标记(文本单元)。
ReDrafter 带来的改进使得可以大大加快这个过程:在传统系统每秒生成一定数量代币的情况下,ReDrafter 的集成使我们的产量提高了 2.7 倍在同一时间间隔内。
除了原始数据之外,这项技术进步还将改变最终用户的体验。应用程序响应时间显着缩短,同时硬件和能源占用量也减少。苹果研究人员意识到了实际问题,强调这一双重改进: «语言模型为越来越多的生产应用程序提供支持,提高推理效率可以影响计算成本,同时减少用户的延迟»。
毫无疑问,这次合作将为苹果插上翅膀并将巩固其在人工智能市场的地位。我们能做的就是希望苹果情报 有一天会从这种协同作用中受益。
- Apple 和 NVIDIA 正在合作,为高度优化的 GPU 带来先进的文本生成方法。
- 这种技术合作显着提高了人工智能模型的速度和能源效率。
- 这种协同效应的表现将加强苹果在人工智能竞赛中的地位。