首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

软件比硬件更加难搞?细数SSD固件惹过的祸

软件比硬件更加难搞?细数SSD固件惹过的祸

软件比硬件更加难搞?细数SSD固件惹过的祸
作为新生事物,很多朋友对SSD有着天然的不信任。不少人觉得,SSD和HHD相比,寿命更短,这是由于闪存特别是TLC擦写次数较少所决定的。不过,和人们的印象不同,SSD只要使用了合格的元件(例如原厂NAND颗粒乃至白片),硬件上极少出现问题。与硬件部分相比,SSD软件部分——固件,出过的问题可能更多!
和HDD相比,SSD的机制要复杂得多。例如,SSD和传统HDD结构完全不同,SSD需要通过FTL层和系统对话;又例如由于闪存需要擦写后才能重新写入数据,所以SSD需要进行Trim来把闪存重新“洗干净”;再例如,SSD还需要一个好的平衡写入算法,来确保闪存颗粒被均衡损耗,不至于出现某一个区块写入量特别大,而提前挂掉的情况。

这些复杂的机制,都是由SSD固件调控的,SSD固件的编写难度,可见一斑。于是,SSD因为固件翻车的情况屡见不鲜。那么到底出现过什么著名的SSD固件翻车案例?这就来为大家盘点一下!
8M门:数据灰飞烟灭

这是一个出现在320系列SSD中的典型固件问题,在X25M等型号中也有出现过,但出现的频率没有320系列SSD高。由于固件编写有问题,320系列SSD在断电重启后,很有可能容量会变为8M,而不是实际上的数十G容量。一旦问题发生,SSD基本上和砖了没有什么区别。尽管用户可以联系退货,但丢了的数据,就无缘再见了。
这个问题官方的叫法是“Bad Context 13X Error”,用户其实也可以手动解决。官方给出的临时解决办法是,利用SSD TOOLBOX进行Secure Erase安全擦除,这可以让SSD恢复到可用的状态——但是,用户的数据会全部丢失。最后,官方发布了新版固件,总算是解决了问题。

5200小时门:SSD时辰突然已到

这是一个在M4系列SSD中出现的固件问题,有很多用户发现,M4系列SSD在用到5200小时左右的时候,会出现周期性蓝屏。有经验的用户观察到,在蓝屏中的报错代码是“0xF4”,这是一个典型的丢盘代码。

一般来说,出现这个代码意味着SSD已经很不健康了,闪存寿命将尽。但这是不合常理的,虽然和HDD相比,SSD的理论寿命的确更短,但也完全不至于短到只有5000个小时左右。
经过了用户和官方的一轮撕逼后,这个问题被确认为固件问题。官方之后发布了新固件,固件阐明“修正了通电5184小时之后SMART计数器出错导致M4不响应的问题”。最终,M4的固件问题得到了修复。

实际上,M4的固件性能表现在同时代的SSD中是出类拔萃的,尤其是在高负载时候的性能,堪称企业级。但官方对待固件问题的态度,让很多用户深深失望。M4系列的后继者,再也没有达到M4的受欢迎程度。

掉速门:TLC大吃一惊

这是出现在840系列SSD中的固件问题,而840系列SSD,可以说是TLC闪存推广的先锋。TLC闪存长期被人们认为性能寿命欠佳,偏偏840系列SSD出现了速度狂掉的问题,这让人们对TLC更加谈虎色变。

在840系列SSD中,掉速的具体表现是长期不访问的数据读取速度胡出现大幅下滑,如果只是看现象的话,这最有可能是一个写入平衡方面的问题,和闪存并没有什么大关系。但是用户本来就对TLC不满,840系列在这个节骨眼出现“掉速门”,令很多用户感到不安。
过这个问题解决得还是相当迅速的,官方经过调查后,很快给出了解释。官方的说法是,由于软件算法存在错误,840 EVO会不停地在数据保存的单元中进行读取-重试(Read-Retry),导致整体读取性能下降。

这是一个闪存管理机制对电压变化的反应存在的失误,利用官方发布的性能修复工具,可以无损修复。现在TLC SSD已经普及,再也没有出现什么“掉速门”,事实证明掉速的确不是TLC的锅。

实际上,SSD的硬件已经日趋成熟,市面上并不乏高性能的公版主控方案。但这在固件方面,就算是大厂,也不能保证一定不翻车。
QQ图片20170411152114.jpg
返回列表