谷歌云和希捷深入了解了他们使用机器学习(一种人工智能)来预测存储数 TB 数据的数据中心硬盘何时可能开始出现故障的情况。
![](https://img.phonandroid.com/2021/05/HDD-Unsplash.jpg)
根据技术项目经理 Nitin Agarwal 和 AI 工程师 Rostam Dinyari 的 Google 博客,Google 管理着数百万个硬盘 (HDD),其中一些明显出现故障。 «如果未能在正确的时间识别这些故障,可能会导致我们许多产品和服务的严重中断。“,我们可以阅读。
尽管其波动性和高失败率,硬盘驱动器是在数据中心托管数据的首选方式。尽管闪存等更新、更可靠的技术被认为是可行的替代方案,但如此大量部署它们仍然太昂贵。蓬勃发展的加密货币甚至可能导致短缺。
谷歌希望自动检测有缺陷的硬盘
根据谷歌的说法,识别硬盘驱动器的问题“有问题或在过去 30 天内出现三个或更多问题» 这是一个耗时的过程,因为它需要对设备进行物理访问。因此,希捷和谷歌的新人工智能旨在防止工程师浪费时间进行自动故障检测。
另请阅读–Windows 10:新功能可让您更好地管理硬盘并节省空间
两家公司测试了两种可以预测驱动器故障风险的机器学习模型。第一个基于 AutoML 表,另一个是为此项目定制开发的。第一个会赢“准确率 98%,召回率 35%,而定制 ML 模型的准确率 70-80%,召回率 20-25%»,这证明了现有 AutoML 表的可靠性。
谷歌表示,计划将该系统扩展到其使用的所有希捷硬盘。因此未来将有可能识别最潜在的磁盘故障,以避免云服务中断和中断。目前尚不清楚这种人工智能是否也可供所有用户使用。
来源 :谷歌