这位人工智能领域的大腕加入苹果，开展有前景的项目

后对 OpenAI 的投资为了将其人工智能雄心推向新的高度，苹果刚刚公布了一项新的合作伙伴关系，这一点并非最不重要。该公司与图形处理器巨头强强联手（现在是人工智能）：NVIDIA，一家由黄仁勋领导的公司，他确实学年伊始股市爆发。金融市场的结果可以通过其在人工智能方面的专业知识来准确解释。

凭借高性能 GPU，黄仁勋的公司已成为数据中心、研究实验室和开发人工智能应用程序的公司的最终提供商。可以说，与 NVIDIA 的新合作伙伴关系可以给苹果带来很大的推动，指责的她该部门有一定的延迟面对竞争。

前所未有的硬件和软件协同

Apple 和 NVIDIA 之间的技术合作基于在 TensorRT-LLM 环境中集成 ReDrafter（一种使用 Apple 开发的大型语言模型生成文本的新方法）。它是一个由 NVIDIA 优化的 Python 库，允许您运行大型语言模型 (LLM)在 GPU 上速度极快。

为了实现这种集成，NVIDIA 在其 TensorRT-LLM 框架中开发了新的专用运算符。这些软件组件可确保最佳通信Apple 算法与 NVIDIA 图形处理器之间的对比。调整的重点是有效管理 ReDrafter 生成的数据结构，特别是在两个阶段。

第一个是波束搜索，一种人工智能中使用的启发式方法有效地探索大的搜索空间，专注于最有前途的路径。第二个是基于动态树的注意力。这种机制允许人工智能模型将注意力集中在信息中最相关的部分，根据上下文和后者的演变来调整这种注意力并确定优先级。

工程师实施了同步机制，允许在不同 GPU 核心之间高效分配计算。这种多级优化充分利用了 NVIDIA 处理器的张量计算单元，同时保持了模块化架构能够随着未来的发展而演变。

与 NVIDIA 生态系统的整合已经取得成果。在实验室中，对配备数百亿参数的大规模神经元结构进行了测试，表现出惊人的性能提升。贪心算法代表通过语言模型生成文本的经典方法，其中算法在每一步选择概率最高的标记（文本单元）。

ReDrafter 带来的改进使得可以大大加快这个过程：在传统系统每秒生成一定数量代币的情况下，ReDrafter 的集成使我们的产量提高了 2.7 倍在同一时间间隔内。

除了原始数据之外，这项技术进步还将改变最终用户的体验。应用程序响应时间显着缩短，同时硬件和能源占用量也减少。苹果研究人员意识到了实际问题，强调这一双重改进: «语言模型为越来越多的生产应用程序提供支持，提高推理效率可以影响计算成本，同时减少用户的延迟»。

毫无疑问，这次合作将为苹果插上翅膀并将巩固其在人工智能市场的地位。我们能做的就是希望苹果情报 有一天会从这种协同作用中受益。